De l'engouement à la rationalité, les modèles à grande échelle ont inauguré le "tournant" de l'industrie

Source de l'image : générée par l'IA illimitée

Tout le monde parle du grand modèle, qui est un véritable portrait du monde de la technologie au premier semestre de cette année.

A en juger par l'effervescence du marché, les modèles à grande échelle sont devenus une piste sur laquelle s'engouffrent divers fabricants de technologies, qu'il s'agisse de géants de l'Internet, d'entreprises technologiques ou encore d'institutions de recherche, tous ont rejoint cette mêlée de modèles à grande échelle. -les maquettes sont devenues "Battleground".

Juste au moment où le marché national des modèles à grande échelle bat son plein, ChatGPT, qui a stimulé la popularité des modèles à grande échelle d'un seul coup, a connu une baisse des visites. Selon les dernières données de SimilarWeb, une agence de surveillance tierce, en mai de cette année, ChatGPT a commencé à afficher un ralentissement de la croissance, avec un taux de croissance de seulement 2,8 % au cours de ce mois, alors que les quatre premiers mois de 2023 étaient de 131,6 %, 62,5 %, 55,8 %, 12,6 %. C'est la première fois que ChatGPT connaît une croissance négative du trafic depuis sa sortie le 30 novembre 2022.

Ce phénomène peut refléter une tendance importante de l'industrie.Toutes les parties passent de l'enthousiasme technique initial pour les grands modèles à une réflexion plus calme sur la commercialisation. Et l'atterrissage de modèles à grande échelle est également un sujet que toutes les entreprises de modèles à grande échelle doivent sérieusement considérer.

** "JD.com estime que la valeur d'un grand modèle = algorithme × puissance de calcul × données × carré de l'épaisseur de l'industrie", a déclaré Xu Ran, PDG de JD.com. JD.com poursuit non seulement l'avancement de la technologie, mais accorde également une attention particulière à l'épaisseur de l'industrie - il apprécie le nombre de scénarios industriels dans lesquels la technologie peut être appliquée de manière pratique et peut créer diverses valeurs pour la société. **

Le 13 juillet, JD.com a lancé un grand modèle de Yanxi. Selon JD.com, il s'agit d'un modèle de nouvelle génération avec des paramètres atteignant des centaines de milliards de dollars, et il sera profondément utilisé dans le commerce de détail, la finance, la logistique, la santé, l'industrie et d'autres scénarios industriels à l'avenir.

Lorsque l'efficacité industrielle et l'expansion des frontières industrielles sont qualitativement améliorées, le grand modèle aura une valeur et une signification pratiques plus importantes. Dans l'agitation des grands modèles, nous devrions revenir à la rationalité et considérer sérieusement la vraie valeur des grands modèles. De quel type de grand modèle l'industrie a-t-elle besoin ? Comment le grand modèle devrait-il être utilisé commercialement pour réduire les coûts et accroître l'efficacité de l'industrie ?

Concurrence pour le grand modèle : le consensus du général à l'industrie

Du jour au lendemain, des modèles domestiques à grande échelle ont "émergé" les uns après les autres.

Selon le "Rapport de recherche sur la carte du modèle à grande échelle de l'intelligence artificielle de la Chine" publié par l'Institut chinois de l'information scientifique et technologique du ministère de la Science et de la Technologie, au 28 mai, au moins 79 modèles de base à grande échelle avec une échelle de plus d'un milliard de paramètres en Chine ont été publiés. Le nombre de grands modèles développés dans mon pays s'est classé deuxième au monde.

Cependant, derrière le nombre croissant de R&D, la manière de réaliser la valeur commerciale des grands modèles mérite d'être explorée.

À l'heure actuelle, de grands modèles plus polyvalents sortent. Ce type de modèle à grande échelle possède de puissantes capacités de compréhension du langage naturel, de génération de langage et de reconnaissance vocale, et fonctionne bien dans des scénarios avec de forts attributs généraux tels que le chat et le divertissement. , ces scénarios sont encore difficiles à atteindre une commercialisation à grande échelle.

Dans les scénarios industriels subdivisés, la précision de la réponse du grand modèle général est faible, car l'industrie elle-même a une petite taille d'échantillon, une distribution inégale des données et des scénarios d'application changeants, ce qui rend le grand modèle incapable de s'auto-optimiser et de s'améliorer. La précision n'est naturellement pas élevée.

Du point de vue de la commercialisation, les entreprises n'ont peut-être pas besoin d'un modèle à grande échelle « complet » à usage général, mais ont davantage besoin d'un modèle industriel à grande échelle qui cible des scénarios de terrain subdivisés et résout des problèmes pratiques.

Wu Hequan, un académicien de l'Académie chinoise d'ingénierie, a un jour souligné que "les grands modèles de type chat ont déclenché une nouvelle vague de recrudescence, mais le dialogue, l'écriture de poésie et la peinture ne sont en aucun cas tous des grands modèles. Nous devons réfléchir profondément à la direction d'application des grands modèles, et nous devons réellement mettre de grands modèles dans Dans les domaines du développement urbain, de la technologie financière, de la biomédecine, de la fabrication industrielle et de la recherche scientifique, les entreprises et organisations professionnelles sont également nécessaires pour accélérer leur mise en œuvre dans le véritable industrie, apportant une réelle valeur aux besoins immédiats de l'industrie, et véritablement au service de la société à grande échelle. »

De nos jours, un consensus se forme sur le marché des modèles à grande échelle selon lequel les modèles à grande échelle qui ne peuvent pas être utilisés à des fins commerciales ne sont que des "outils de divertissement", et seuls les modèles à grande échelle qui pénètrent profondément dans l'industrie et résolvent des problèmes pratiques ont valeur. En réfléchissant profondément à la valeur des grands modèles, une formule proposée par JD.com est plus en phase avec la tendance du marché des grands modèles, à savoir : la valeur des grands modèles = algorithme × puissance de calcul × données × carré de l'épaisseur de l'industrie.

** D'après la formule de valeur du grand modèle, on peut voir que le grand modèle industriel et le grand modèle général ne sont pas en opposition. Le grand modèle industriel est basé sur le grand modèle général et est entraîné. Le contenu est plus en ligne avec les besoins des scénarios industriels verticaux et plus ciblés. **

En termes de route d'évolution du grand modèle, il n'est pas surprenant que JD.com soit tourné vers l'avenir. Depuis sa création, Jingdong est ancré dans l'industrie et accorde naturellement plus d'attention à la valeur des grands modèles de l'industrie.

« Jingdong concerne les grands modèles et autres innovations technologiques. En plus de poursuivre la nature avancée de la technologie, il accorde également une attention particulière à l'épaisseur de l'industrie - combien de scénarios industriels la technologie peut être appliquée en pratique pour créer véritablement de la valeur pour la société. " a déclaré Xu Ran, PDG de Jingdong.

** En fait, le développement de grands modèles à ce stade passe de "l'universel" à "l'industriel". **

Le dernier rapport de recherche publié par Minsheng Securities a mentionné qu'après la période de sortie intensive des grands modèles de février à mars, la période de développement des produits d'avril à mai et l'orientation politique ont été progressivement clarifiées, les produits et les applications des grands modèles commenceront en juin. Il est prévu d'inaugurer une version centralisée. La nouvelle vague de versions est basée sur des produits d'application de modèles à grande échelle, et des mises à niveau à grande échelle ont commencé à être mises en ligne, se préparant à entrer dans des milliers de foyers.

Récemment, la plupart des derniers modèles à grande échelle publiés par les entreprises technologiques nationales sont destinés aux industries verticales. Outre-mer, diverses entreprises ont successivement publié des modèles industriels à grande échelle à différentes échelles, dans le but de les appliquer au domaine industriel.

D'après les tendances réelles des principaux fabricants nationaux et étrangers, il n'est pas difficile de voir que le modèle industriel sera plus en mesure d'aider les partenaires industriels à mener à bien la transformation numérique, à réduire les coûts et à augmenter l'efficacité, et à créer une plus grande valeur pour l'industrie et la société. .

Grand modèle industriel, il est difficile de poser des bases solides pour l'industrie

La difficulté de construire des modèles industriels à grande échelle est beaucoup plus élevée que celle des modèles à grande échelle à usage général.

Si le modèle général à grande échelle teste la puissance de calcul et l'accumulation d'algorithmes de l'entreprise, le modèle industriel à grande échelle teste l'accès et la compréhension de l'entreprise aux scénarios commerciaux, ainsi que l'accumulation et l'application des données industrielles.

Un consensus de l'industrie est que dans la formation de grands modèles industriels, la chose la plus difficile à obtenir est les données industrielles. Les données industrielles sont souvent entre les mains des entreprises. En raison de la sécurité des données et d'autres considérations, peu d'entreprises sont disposées à divulguer des données privées. Cependant, ces données industrielles affectent souvent directement ou indirectement la vitesse d'itération technique, la précision du modèle et le professionnalisme commercial du grand modèle industriel.

"Les données industrielles peuvent également être divisées en données statiques et données dynamiques. Les données statiques sont relativement stables, ne changeront pas immédiatement et le chemin d'acquisition est relativement clair. Les données dynamiques sont les données générées à chaque instant dans différents scénarios industriels. Cette partie du Les données sont des données de scène « vivantes ». Ce n'est pas facile à obtenir, mais c'est l'un des éléments nécessaires du modèle industriel », a souligné He Xiaodong, président du JD Research Institute et président du département des services et produits intelligents de JD Technology.

Cependant, la formation de grands modèles industriels ne peut pas seulement utiliser des données industrielles, mais doit encore utiliser une grande quantité de données générales pour fournir des connaissances de bon sens. Les raisons sont les suivantes : premièrement, la généralisation des données industrielles est insuffisante, et le grand modèle doit être recyclé à chaque changement de scène, ce qui est coûteux ; bloqué dans un état bloqué.

He Xiaodong a comparé la formation d'un grand modèle industriel à la formation d'une personne : « Si une personne sort travailler directement après avoir obtenu son diplôme d'études secondaires, cela semble correct, mais le professionnalisme sera moins professionnel. Si vous pouvez terminer une formation de quatre ans diplôme de premier cycle avant d'aller travailler, vous avez à la fois des connaissances générales et des connaissances professionnelles suffisantes sont les capacités que devrait avoir un grand modèle industriel.

Pour cette raison, les données du grand modèle de JD Yanxi sont composées de 70 % de données générales et de 30 % de données brutes sur la croissance de la scène de la chaîne d'approvisionnement.

Il convient de mentionner que ces données industrielles proviennent de JD.com lui-même. JD.com lui-même est une entreprise basée sur la chaîne d'approvisionnement. Elle est enracinée dans un large éventail d'industries. Elle dispose non seulement de données pratiques dans le commerce de détail, la logistique, la finance, la santé, l'industrie et d'autres industries, mais également de données sur les villes, affaires gouvernementales, finance, fabrication, industrie, aviation, transport, etc. Les données désensibilisées d'industries telles que les parcs industriels, les parcs industriels et l'énergie, et les données de haute qualité générées chaque année atteignent 10 milliards de pièces.

Outre la fourniture continue de données industrielles de haute qualité, le grand modèle industriel doit également comprendre le savoir-faire de l'industrie, c'est-à-dire avoir une connaissance unique de l'industrie et avoir des exigences de compréhension plus élevées. Par exemple, le secteur de la vente au détail accorde plus d'attention à l'effet du marketing et de la recommandation, et le secteur financier accorde plus d'attention à l'effet du contrôle des risques, de la fiabilité et de la sécurité.

Pour cette demande, la chaîne d'approvisionnement en intelligence numérique à long terme de JD.com a joué un rôle clé, et elle est devenue le centre des efforts de JD.com dans l'application de grands modèles. Le grand modèle peut également s'appuyer sur l'intelligence numérique de la chaîne d'approvisionnement et aller en profondeur dans l'industrie physique.

Il est rapporté que la chaîne d'approvisionnement en intelligence numérique de JD.com a couvert plus de 10 millions de SKU de produits autonomes de JD.com, desservant plus de 8 millions d'entreprises clientes actives, dont plus de 90 % des 500 plus grandes entreprises mondiales en Chine, et près de 70 % des nouvelles PME spécialisées du pays. Dans le même temps, la chaîne d'approvisionnement en intelligence numérique de JD.com est toujours dans le pays et entretient une coopération approfondie avec plus de 2 000 ceintures industrielles.

Ce type de chaîne d'approvisionnement de renseignement numérique avec des liens plus longs, des scénarios plus complexes et des données plus riches est un excellent "terrain d'entraînement" pour les grands modèles. De l'avis de JD Cloud, la valeur du grand modèle ne peut être réalisée qu'en comprenant parfaitement la chaîne d'approvisionnement et en permettant au grand modèle de "fonctionner" sur la chaîne d'approvisionnement.

En plus de l'accumulation du côté industriel, la force de JD.com en algorithmes de base et en puissance de calcul ne doit pas être sous-estimée.

En 2021, JD Discovery Research Institute a lancé le premier cluster informatique à très grande échelle du pays basé sur l'architecture DGX SuperPOD à Chongqing-Tianqin α, qui a multiplié par 6,2 la vitesse de raisonnement et réduit le coût du raisonnement de 90 %. Cela offre à JD.com la garantie la plus élémentaire pour la formation de modèles à grande échelle.

La même année, JD.com a lancé le modèle K-PLUG à un milliard de niveaux. La copie du produit générée par K-PLUG a couvert plus de 3 000 catégories sur JD.com, générant un total de 3 milliards de mots, et la passe de révision manuelle. le taux dépasse 95 %. D'ici 2022, le grand modèle de JD.com sera mis à niveau vers un modèle Vega de dizaines de milliards, qui peut être largement utilisé dans diverses tâches de traitement du langage naturel en aval telles que l'analyse des sentiments, la correspondance sémantique, la correction des erreurs grammaticales, la réponse intelligente aux questions et le bon sens. raisonnement.

Grâce à l'accumulation précédente, JD.com a fait une autre percée technologique cette année et a lancé une nouvelle génération du modèle à grande échelle de JD.com avec des centaines de milliards de paramètres, se concentrant sur plusieurs tâches majeures telles que la génération de contenu, le dialogue homme-machine, compréhension de l'intention de l'utilisateur, extraction d'informations et classification des émotions. , a réalisé le réglage fin du modèle de base + modèle de domaine vertical et appliqué des scénarios verticaux approfondis tels que la vente au détail, la logistique, la finance, la santé et les affaires gouvernementales.

À l'heure actuelle, le grand modèle industriel représenté par JD.com forme le grand modèle grâce à ses données et connaissances accumulées industrialisées et basées sur des scénarios, et corrige le grand modèle en fonction de son savoir-faire industriel accumulé, pour améliorer les performances des grands modèles. dans des industries et des scénarios d'application spécifiques, et pour améliorer la contrôlabilité. Cela équivaut à terminer une "formation générale" pour l'IA.

** Le grand modèle de Jingdong pénètre progressivement dans diverses industries pour améliorer le niveau d'intelligence de la chaîne d'approvisionnement. À l'inverse, la mise à niveau de l'intelligence numérique de la chaîne d'approvisionnement favorise également la transformation industrielle, qui à son tour fournit un sol de données plus riche pour les grands modèles, formant un cycle positif. **

"Couper dans le modèle à grande échelle du côté industriel, c'est comme escalader le mont technique Everest depuis le versant nord : bien que la route soit plus difficile, il y a des paysages plus magnifiques. Jingdong insiste pour faire des "choses difficiles mais correctes", insistant sur faire pratique, précieux et c'est une affaire à long terme. Dans le domaine technique et dans le grand modèle, c'est notre engagement constant ", a déclaré Xu Ran.

** Les "choses difficiles et correctes" nécessitent une accumulation à long terme. Cependant, en termes de construction du modèle industriel, JD.com a clairement posé les bases. **

Jingdong, né dans l'industrie, crée de la valeur industrielle avec de grands modèles

"A l'ère du grand modèle, tout est à refaire avec le grand modèle."

Sous la vague des grands modèles, l'industrie a rapidement atteint le consensus ci-dessus. Cependant, alors que d'autres grands fabricants recherchent des modèles commerciaux à travers diverses stratégies, la direction de l'industrie du débarquement de Jingdong n'a jamais changé.

« Les caractéristiques industrielles sont les caractéristiques distinctives de la technologie de JD.com. Chaque technologie développée par JD.com découle de besoins industriels, d'expériences dans des scénarios industriels et crée de la valeur industrielle », a déclaré Xu Ran.

À l'heure actuelle, le modèle à grande échelle de JD Yanxi progresse conformément à la stratégie en « trois étapes » : à l'heure actuelle, JD Cloud a construit un grand modèle à usage général basé sur les pratiques internes ; d'ici la fin de cette année, JD. Services industriels solides ; il est prévu qu'au début de 2024, les capacités du modèle à grande échelle seront ouvertes à des scénarios commerciaux sérieux externes.

D'un point de vue pratique, le grand modèle de JD.com a atteint la deuxième étape. JD.com applique les capacités du grand modèle aux scénarios les plus familiers tels que la vente au détail, la finance, la logistique et la santé, et a pénétré dans divers liens.

Par exemple, Jingdong améliore la capacité du service client intelligent grâce à de grands modèles. Le domaine du service client est différent des discussions et conversations quotidiennes. Il s'agit d'une scène de dialogue sérieuse basée sur des tâches qui doit résoudre divers problèmes complexes entre acheteurs et vendeurs dans le monde réel.

"Quand un utilisateur parle à ChatGPT, peu importe si la réponse est fausse, et cela n'affectera aucune prise de décision. Mais si dans un scénario commercial sérieux, le service client intelligent répond mal, les conséquences seront inimaginables. . Par conséquent, l'exactitude de la réponse est très importante", a déclaré le comité technique du groupe Jingdong, Cao Peng, président et président de la division JD Cloud.

Pour les scénarios de service client intelligents, JD.com a non seulement construit un grand modèle avec une compréhension sémantique de base et une logique de questions-réponses, mais a également peaufiné un petit modèle pour des scénarios spécifiques. Si le problème du client implique des retours et des échanges communs, etc., le service client intelligent fera appel à un grand modèle plus général. Et une fois que la question concerne la politique de garantie et les règles de protection des prix de produits spécifiques, le service client intelligent appellera un petit modèle plus ciblé pour donner la réponse. Différents modèles peuvent assumer différentes responsabilités.

Désormais, le service client intelligent fonctionne au sein de JD.com, aidant plus de 20 000 employés du service client autonome à réduire les coûts et à augmenter l'efficacité, et à optimiser en permanence l'expérience du service client. JD.com a également ouvert ses capacités de service client intelligent au monde extérieur pour aider davantage d'agences gouvernementales et d'entreprises à effectuer une transformation et une mise à niveau numériques et intelligentes.

En termes de services externes pour les grands modèles, JD.com maintient toujours son propre rythme «lent» et n'est pas pressé de «vendre» de grands modèles aux entreprises. La raison en est que l'intelligence artificielle est un changement technologique très grave : si elle est bien utilisée, elle peut transformer l'industrie, mais si elle est mal utilisée, elle peut aussi avoir de graves conséquences. Dans de telles circonstances, Jingdong adhère à la mentalité à long terme et est un excellent choix.

"JD.com ne servira pas de plats qui n'ont pas atteint" la pleine couleur, la saveur et le goût ". Une fois que le modèle à grande échelle aura terminé son expérience et sa pratique dans des scènes internes clés, il sera ouvert aux partenaires pour aider l'ensemble de l'industrie à réduire les coûts. et augmenter l'efficacité." Xu Ran express.

Dans le plan de JD.com, le grand modèle de Yanxi deviendra le support technique de niveau le plus bas. Sur la base de ses capacités, le champ produira une série de produits, et les produits du même champ seront agrégés dans une plate-forme, et enfin une valeur de sortie pour l'industrie.

Par exemple, dans le domaine de la génération de contenu, JD.com a construit la plateforme de marketing de contenu JD Cloud AIGC. Sur la base de la riche accumulation de données sur les produits de toute la catégorie de JD.com, le grand modèle peut mieux comprendre les caractéristiques des produits, aider les marchands à générer automatiquement des images de produits, des arguments de vente et d'autres supports marketing, et améliorer l'efficacité opérationnelle des marchands et la qualité du contenu marketing.

En d'autres termes, les commerçants n'ont qu'à télécharger une image de produit et peuvent obtenir rapidement plusieurs types d'images telles que des images de produits principaux, des images d'affiches marketing et des images de détails commerciaux nécessaires aux opérations de commerce électronique, répondant aux besoins d'ouverture rapide de magasins, référencement et commercialisation des produits. Ces capacités peuvent permettre aux marchands d'économiser 90 % du coût de dessin et de raccourcir le cycle de production de 7 jours à une demi-journée.

En utilisant des capacités de modélisation à plus grande échelle, les commerçants n'ont même pas besoin de vendre leurs propres marchandises, mais ont seulement besoin d'utiliser l'humain numérique multimodal de JD Cloud pour livrer des marchandises 24 heures sur 24 à faible coût.

En plus de ces applications, JD.com a également fait la démonstration d'une plateforme d'opérations marketing IA dans le domaine financier. Grâce à un dialogue simple, les utilisateurs peuvent générer des activités marketing en un seul arrêt, couvrant la formulation de la stratégie opérationnelle, la planification des tâches marketing, la création de pages d'activités, la génération par lots de rédaction et de supports marketing, la livraison numérique, etc. Selon les données pertinentes de JD.com, dans le passé, cet ensemble de processus nécessitait cinq types de personnel fonctionnel : produit, R&D, algorithme, conception et analyste, mais il a maintenant été réduit à une seule personne ; dans le passé, le processus nécessitait 2 000 interactions homme-machine, mais il a également été réduit à moins de 50. Avec le soutien de la grande capacité de modèle, l'efficacité de production du plan marketing a été considérablement améliorée.

** On peut dire que le grand modèle industriel de JD.com devient la base d'applications industrielles dans diverses industries. À l'heure actuelle, il a pénétré dans la vente au détail, la logistique, la santé, l'industrie, la fabrication, la finance, le marketing et d'autres industries, et est allé à l'industrie et à l'application pratique. **

Six mois après que le grand modèle se soit déchaîné, les fabricants ont réalisé que la "grande échelle" ou les "paramètres élevés" ne peuvent pas résoudre les problèmes pratiques. Lorsque la période de bulle est terminée, les grands modèles doivent retourner dans l'industrie, revenir à des scénarios réels et résoudre des problèmes pratiques après tout.C'est la destination ultime de la technologie et le début du développement bénin des grands modèles. Les entreprises disposant de données industrielles solides et d'une pratique de scénarios ont commencé à entrer en scène.

De toute évidence, le grand modèle Jingdong Yanxi a mis les voiles à l'autre bout de la valeur industrielle.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)