ChatGPT est devenu un produit incontestablement phénoménal dans l'industrie mondiale des technologies de l'information.
Au nom de "l'intelligence artificielle générale", il discute avec des êtres humains, aide les gens à rédiger des e-mails et des lettres d'avocat, répond à certaines questions philosophiques ésotériques ultimes, écrit un code Python utilisable, répond à certaines questions qui semblent nécessiter une logique complexe et progressive, écrit un scénario de film basé sur certains paramètres de personnages, écrit un beau poème d'amour, attrape les devoirs de thèse des étudiants... Il semble qu'il n'y ait pas d'espèce d'IA aussi polyvalente dans l'histoire humaine. Bill Gates a déclaré que l'émergence de ChatGPT n'est "pas moins que la naissance d'Internet". Le PDG de Microsoft, Satya Nadella, a déclaré que c'était comparable à la révolution industrielle. Les amateurs d'intelligence artificielle orale ont une fois de plus crié que la "singularité" est en train d'arriver. La maturité mentale, c'est vraiment quelque chose qui rend l'IA heureuse.
J'ai utilisé ChatGPT pour faire beaucoup de choses indescriptibles, et j'ai trouvé que ce n'est pas toujours pratique, mais il peut donner de meilleures réponses et solutions à certains problèmes apparemment plus difficiles. Par exemple, si vous demandez si BYD peut battre Tesla, cela peut donner des déclarations claires et banales avec de nombreuses erreurs factuelles et aucune personnalité ; mais si vous lui demandez comment la conduite autonome changera le design industriel d'une voiture, cela peut donner une discussion pleine d'imagination de l'intérieur en termes d'innovation de châssis, de changements d'intérieur, de divertissement numérique et de percées d'apparence. Dans l'ensemble, ChatGPT est assez imparfait, notamment en termes de précision convaincante, mais il surprend souvent les humains dans des domaines tels que la fourniture d'un discours d'information structuré, l'ouverture de l'imagination et la libération de la créativité. Vous ne pouvez pas dire quelle utilisation spécifique il a pour vous, mais cela peut vous aider à réaliser et à compléter des choses triviales, redondantes et même créatives.
C'est un tel ChatGPT apparemment inutile mais utile, qui semble être utile mais inutile, qui a poussé sa société mère OpenAI à recevoir un investissement supplémentaire de Microsoft de plus de 10 milliards de dollars américains.Il a fallu deux jours pour percer le million d'utilisateurs, et Facebook a mis 305 jours; Le réseau de neurones à grande échelle contenant 175 milliards de paramètres -lorsqu'il est préférentiellement licencié à Microsoft pour intégrer des logiciels bureautiques et des services de moteurs de recherche comme Office et Bing, il devient vraiment un produit "utilisable".
Mais cela suffit à rendre jaloux les licornes chinoises de l'IA.
Avec 500 employés, la valorisation globale de l'entreprise est proche de 30 milliards de dollars américains. C'est OpenAI ; avec des milliers de personnes, la valorisation/valeur de marché de l'entreprise est au mieux de 1 à 2 milliards de dollars américains. Il s'agit d'un certain nombre de "petits géants" de l'IA en Chine.
En raison de l'énorme écart entre l'efficacité humaine et la valeur, et en raison de l'influence soudaine de ChatGPT sur la société réelle de tous les êtres humains, la naissance de ChatGPT a considérablement stimulé le domaine de l'intelligence artificielle en Chine. De nombreuses personnes ont de nouveau sauté, estimant que l'écart entre la Chine et les États-Unis en matière d'intelligence artificielle s'est encore creusé, et que la Chine a encore un long chemin à parcourir pour rattraper cette vague. Certaines personnes souhaitent également discuter des raisons pour lesquelles la Chine n'a pas son propre ChatGPT, et la conclusion est toujours que "la Chine manque de terreau pour l'innovation" et que "les sociétés Internet chinoises sont engagées dans la diffusion en direct et l'épicerie", qui sont à la fois irresponsables et ignorantes des faits.
Les entreprises Internet chinoises ne sont pas toutes engagées dans la diffusion en direct et l'épicerie. Elles sont engagées dans le développement de semi-conducteurs, la recherche de modèles d'IA et la conduite autonome. Les entreprises Internet américaines sont également très populaires dans la diffusion en direct, l'épicerie et surtout la finance sur Internet.
En tant que société Internet chinoise la plus accumulée dans le domaine de l'intelligence artificielle et du traitement sémantique naturel, Baidu travaille sur son propre grand modèle d'apprentissage en profondeur "Paddle Paddle" (Paddle Paddle) depuis cinq ans, et a même utilisé sa propre puce d'IA à usage général "Kunlun Core" pour former son propre modèle - ils constituent l'environnement de base et la prémisse permettant à Baidu de former son propre "ChatGPT". Alibaba, ByteDance et Didi ont également des modèles de formation sémantique naturels basés sur leurs propres besoins. On peut dire qu'en termes de formation de modèles sémantiques naturels complexes avec des dizaines de milliards de paramètres, les entreprises et institutions de recherche chinoises ne sont pas faibles, et leur point de départ n'est pas inférieur à celui de leurs homologues américains - du moins vers 2016. Ces dernières années, l'écart entre les cercles de l'intelligence artificielle chinois et américain dans le domaine des modèles à grande échelle n'est pas une question de prise de conscience, de point de départ et de capacité, mais une question de routes et de méthodes.
L'écart entre la Chine et les États-Unis dans le domaine des modèles de dialogue homme-machine de type ChatGPT n'est pas causé par une soi-disant réglementation. Si vous avez eu des échanges francs avec ChatGPT sur certaines questions religieuses, culturelles, ethniques et géopolitiques plus riches, vous vous rendrez compte que derrière son refus apparent et sa discussion prudente sur ces questions, il y a certaines tendances de position spécifiques qui coïncident subtilement avec les valeurs dominantes généralement reconnues dans la société américaine. On peut dire que pour tout modèle complexe de sémantique naturelle, le processus de construction du modèle, de collecte de corpus, de formation et d'ajustement des paramètres est un processus de "révision de contenu" basé sur un système de valeurs spécifique, et tous ont conscience de maintenir leur système de valeurs. Il ne s'agit pas de savoir si nous devons "générer" la position de valeur de la Chine dans le modèle sémantique naturel, mais comment elle doit être générée afin de vérifier et d'équilibrer véritablement la vision du monde et l'hégémonie culturelle selon lesquelles l'anglais domine le corpus mondial de l'Internet, de renforcer le poids des repères de compréhension de la langue chinoise dans le système mondial de traitement sémantique naturel et de fournir une diversité culturelle pour le développement de l'intelligence artificielle et du dialogue homme-ordinateur dans le monde.
Je suis aussi sérieusement en désaccord avec l'affirmation selon laquelle la qualité des informations Internet chinoises est trop mauvaise pour que la source du corpus du modèle chinois ChatGPT soit "polluée".C'est aussi un jugement paresseux et intelligent. En raison de la quantité totale d'informations sur Internet, le contenu en anglais est sans aucun doute le plus important au monde, et le contenu extrême de qualité inquiétante est également le plus important, ce qui affectera le processus et les résultats de la formation du modèle sémantique naturel. Au début de la formation, ChatGPT a donné la priorité au contenu très apprécié sur le forum social Reddit avec une qualité de contenu élevée, qui a une tendance spécifique à la sélection de corpus. Si la Chine donne la priorité aux communautés du savoir telles que Zhihu et Dede, et que les grands médias donnent la priorité au corpus de modèles sémantiques, il n'y aura pas de problème de contamination du corpus. Sans parler de la maîtrise de la langue étrangère et de l'étendue de la lecture de la plupart des gens qui soutiennent que "la qualité du contenu chinois est faible" ne suffit pas à étayer leurs conclusions.
Mais en tout cas, la naissance de ChatGPT est bel et bien une sorte de stimulation et un défi conceptuel pour moi, qui appelle depuis de nombreuses années à "l'adieu au culte de la Silicon Valley".
Ce n'est pas parce que je pense que l'écart entre la Chine et les États-Unis dans le domaine de l'intelligence artificielle s'est creusé, mais parce qu'un modèle général de dialogue humain-ordinateur d'intelligence artificielle tel que ChatGPT est un outil qui peut véritablement promouvoir la collaboration de production sociale et la civilisation du point de vue de tous les êtres humains, plutôt que d'un domaine ou d'une industrie spécifique. Son importance est supérieure à l'émergence de l'Internet mobile, comparable à la naissance de la messagerie électronique et des moteurs de recherche. En tant que puissance de l'intelligence artificielle, la Chine n'est plus un pays avec une industrie des technologies de l'information médiocre lorsque les e-mails et les moteurs de recherche sont nés.Cependant, nous n'avons pas laissé ce type d'innovation générale de l'intelligence artificielle qui peut affecter le progrès de la civilisation humaine se produire pour la première fois en Chine, et former un modèle dont le corpus de base est construit à partir de la culture et du système de valeurs chinois.
De plus, la méthode de formation du modèle de ChatGPT repose en grande partie sur la mise à niveau des paramètres de "renforcement des miracles", la formation répétée et l'optimisation itérative continue du modèle basée sur les commentaires du contenu généré - c'était à l'origine la méthode de travail dans laquelle l'équipe chinoise était la meilleure. Lorsqu'une start-up américaine utilise l'argent collecté auprès de Microsoft pour investir à tout prix dans d'énormes coûts de puissance de calcul, emploie un grand nombre de travailleurs des données en Afrique et au Moyen-Orient pour l'étiquetage des informations et utilise les itérations les plus efficaces pour mener une "course aux armements" de modèle de traitement sémantique à grande échelle avec des géants comme Google, vous avez toujours un sentiment très irréel - qu'il s'agisse d'une entreprise de San Francisco ou d'une entreprise de Shenzhen.
Un modèle de traitement sémantique naturel comme ChatGPT aurait dû naître en Chine, mais il n'est pas né en Chine.La raison doit commencer par les entreprises technologiques chinoises engagées dans l'intelligence artificielle, peu importe ce que font les géants ou les startups ces dernières années.
Un problème que beaucoup de gens ne réalisent peut-être jamais est qu'un modèle de traitement sémantique naturel à très grande échelle comme ChatGPT est le plus susceptible de produire des miracles lorsqu'il est construit par une start-up d'IA, et de meilleurs résultats ne sont généralement pas obtenus au sein d'un géant de la technologie. C'est pourquoi le modèle d'application de dialogue LaMDA de Google et Bard, qui s'est récemment lancé dans la bataille, n'ont pas brillé, et c'est aussi le défi auquel Baidu sera inévitablement confronté ensuite.
Pourquoi? La première est que la modélisation générale du traitement sémantique naturel est trop coûteuse. En fait, brûler de l'argent n'est généralement pas l'apanage des grandes entreprises, mais le privilège des startups. Les géants de la technologie sont presque tous des sociétés cotées en bourse. L'investissement de dizaines de milliards de dollars est investi dans quelque chose qui ne rapportera pas avant longtemps. La pression sur le directeur financier face au conseil d'administration et aux assemblées d'actionnaires est très élevée, et ils sont souvent punis par le cours de l'action. Cela fait que les grandes entreprises n'osent pas prendre de gros risques. Qu'est-ce que "Faire des miracles vigoureusement" ? C'est de dépenser beaucoup d'argent et de faire d'abord de grands efforts, puis de prier pour que des miracles se produisent, au lieu d'accepter qu'un miracle doit se produire, puis de décider de dépenser de l'argent et de faire de grands efforts.
Malheureusement, les grandes entreprises ne peuvent être que ces dernières. C'est pourquoi même Microsoft, qui a beaucoup profité de ChatGPT, n'a osé partir que d'un milliard de dollars au début, qui a duré quatre ans, jusqu'à 10 milliards de dollars cette année, et a continué à augmenter les investissements un par un pour soutenir OpenAI dans "in vitro" de Microsoft, entraînant le modèle GPT pendant de nombreuses années. Les fonds propres acquis par Microsoft en investissant dans OpenAI ont pour priorité d'intégrer la capacité du modèle ChatGPT dans son Office et ses moteurs de recherche.Il n'est peut-être pas facile de dire s'il mangera OpenAI à l'avenir, mais au moins Microsoft, qui a une valeur marchande de près d'un billion de dollars américains et un revenu annuel de dizaines de milliards de dollars américains, n'ose absolument pas "faire des miracles vigoureusement" au début et former ce modèle tout seul.
Deuxièmement, parce que les gens sont moins tolérants envers les géants de la technologie qui s'engagent dans l'innovation, et plus tolérants envers les erreurs et les déviations des startups. Afin de faire face à la pression de ChatGPT, Google a lancé à la hâte la version de test de dialogue homme-ordinateur Bard. Il a été constaté que certains dialogues contenaient des erreurs factuelles de base, il a donc été amplifié à l'infini et la valeur marchande s'est évaporée de centaines de milliards de dollars du jour au lendemain. En fait, ce n'est pas que Google ne le sache pas, s'il n'était pas pressé, ce ne serait pas si téméraire. Le modèle LaMDA annoncé par Google en 2021 a des niveaux de paramètres et des capacités de recherche d'informations nettement plus élevés que le GPT-3 formé par OpenAI à l'époque, mais Google a hésité à tester publiquement son effet car il a peur qu'il fasse des erreurs, provoquant la méfiance du public et la baisse du cours des actions.
Ce dont Google se soucie, OpenAI ne s'en soucie pas. Dès le premier jour de la sortie de ChatGPT, il a déclaré publiquement qu'il n'avait aucune capacité de récupération d'informations et que son corpus n'était que jusqu'en décembre 2021. Il ne peut pas répondre à de nombreuses questions sur la valeur et les jugements moraux, et fait souvent des erreurs factuelles. Les testeurs ont accepté avec tolérance l'auto-"mauvaise performance" de ChatGPT et ont été étonnés de sa capacité d'association d'informations, d'expression émotionnelle, de structure logique et de cohérence de pensée dans les domaines de la programmation, de la création littéraire, de l'écriture formatée et de la consultation médicale, et ont légèrement ignoré les erreurs qu'il a commises.
En mars 2019, après le succès sans précédent du modèle GPT-2, OpenAI, âgé de quatre ans, a décidé de passer d'une fondation à but non lucratif à une société commerciale. Après tout, aucune fondation ne peut supporter le salaire annuel de 1,5 million de dollars de son scientifique en chef.En mai 2019, Sam Altman (Sam Altman) est devenu le PDG d'OpenAI. Ensuite, OpenAI a reçu un investissement de 1 milliard de dollars de Microsoft. En mai 2020, le modèle GPT-3 lancé par OpenAI a des paramètres qui ont fortement augmenté, passant de 1,5 milliard en GPT-2 à 175 milliards, formant un système d'apprentissage automatique d'une puissance sans précédent.
On peut voir qu'une start-up d'intelligence artificielle qui est née avec une cuillère en or dans la bouche, a levé une énorme somme d'argent et est liée à des entreprises géantes, est engagée dans la construction et le développement de modèles sémantiques naturels d'intelligence artificielle à usage général et investit dans la formation de modèles quel que soit le coût, ce qui est l'état le plus idéal. Les retours imaginatifs et commerciaux qui accompagnent les modèles les plus puissants sont suffisants pour stimuler Microsoft et d'autres investisseurs.
Alors, pourquoi cette logique ne fonctionne-t-elle pas en Chine ? La Chine a-t-elle jamais eu un puissant modèle d'intelligence artificielle sémantique naturelle à usage général, même s'il ne s'agissait que d'un prototype ?
Pour répondre à cette question, regardez quand Microsoft a investi pour la première fois dans OpenAI : juillet 2019. Quatre mois après que Microsoft a parié sur le modèle GPT d'OpenAI, c'est-à-dire en novembre 2019, Shen Xiangyang, le vice-président senior mondial de Microsoft qui est en charge de l'activité de recherche Bing et le principal responsable de l'intelligence artificielle de Microsoft, et un informaticien de Hong Kong, Chine, a annoncé qu'il avait quitté Microsoft depuis plus de 20 ans. Et la dernière contribution de Shen Xiangyang au modèle général d'intelligence artificielle de Microsoft est le robot de chat Xiaobing développé par Microsoft Asia Internet Engineering Institute en 2014.
En juillet 2020, Xiaoice est devenue indépendante de Microsoft et est devenue une start-up chinoise d'intelligence artificielle. Shen Xiangyang en a été le président et Li Di, l'ancien vice-président exécutif de Microsoft Asia Internet Engineering Academy, en a été le PDG. Xiaoice est passée à plus de la sixième génération lorsqu'elle est devenue indépendante, et ses formes de produits impliquent des robots d'intelligence artificielle conversationnels, des assistants vocaux intelligents, des fournisseurs de contenu créés par l'intelligence artificielle et une série de solutions de champ vertical. Xiaoice a jadis suscité un débat public, en plus d'être un robot de chat plein d'émotions et de sexualité féminine, il a aussi ses performances étonnantes dans le domaine de la création poétique chinoise - elle a publié un recueil de poèmes "Sunshine Lost the Glass Window", qui a reçu beaucoup d'éloges et plus de controverses.
Il ne fait aucun doute qu'un robot XiaoIce capable d'écrire des poèmes et de mener des conversations simples basées sur l'émotion et le bon sens était le modèle d'intelligence artificielle générale conversationnelle le plus performant au monde il y a quelques années.
Il est impossible pour l'équipe dirigée par Shen Xiangyang de comprendre la recherche, et encore moins l'intelligence artificielle. Et le départ de Shen Xiangyang de Microsoft et de "l'indépendance" de Xiaobing, couplé à l'investissement et à la coopération du PDG de Microsoft, Nadella, avec OpenAI, est en fait le premier négociant en intelligence artificielle en Chine et aux États-Unis. Une séparation formelle des chemins dans le domaine des modèles généraux d'intelligence artificielle.
Alors, Xiaobing écrit-il encore de la poésie aujourd'hui ? Qu'est-ce que ça fait
Au cours des deux dernières années, Xiaobing a depuis longtemps cessé d'écrire des poèmes. Il est occupé à commercialiser. Il a créé un studio de jeux pour fournir du contenu de dialogue scénarisé aux PNJ pour les jeux ; il a coopéré avec les Jeux olympiques d'hiver pour fournir un système de notation visuel pour les compétences aériennes en ski acrobatique ; il a fourni à Wind Information des résumés textuels générés par l'intelligence artificielle des annonces des sociétés cotées en bourse ;
En un mot, par le passé, l'équipe d'intelligence artificielle qui représentait le niveau supérieur du modèle général d'intelligence artificielle sémantique naturelle, et les Chinois soutenaient l'ensemble de la structure, est maintenant devenue un fournisseur d'intelligence artificielle qui mélange l'intelligence artificielle générative et l'intelligence artificielle décisionnelle et fournit des solutions spécifiques pour des scénarios spécifiques.
Vous ne pouvez pas dire que c'est la "chute" de Xiaoice, après tout, elle n'a levé que des centaines de millions de yuans sur le marché des capitaux. Selon la méthode de formation modèle de ChatGPT, l'argent sera dépensé en une journée. Sans la protection de Microsoft, Xiaobing doit prendre soin de sa propre vie. Cependant, je n'ai jamais entendu parler de Baidu, Tencent ou ByteDance, j'ai pensé à investir dans Xiaoice et à le soutenir pour continuer à développer un modèle à grande échelle d'intelligence artificielle sémantique naturelle générale.
Pas seulement Xiaobing. Au cours des dernières années, d'autres équipes entrepreneuriales en Chine se sont également engagées dans la modélisation automatique de l'intelligence artificielle générale et de l'informatique hétérogène, permettant à 7 à 8 types de puces nationales et étrangères d'être connectées à des logiciels via ce modèle. Les institutions d'investissement chinoises n'ont jamais montré d'intérêt pour les modèles généraux d'intelligence artificielle, et même un peu d'imagination.
"Plus de 85% des investisseurs nous ont demandé de présenter le scénario du produit. Nous avons dit que nous aidions le GPU à se connecter à l'écosystème logiciel, et même Nvidia utilise notre modèle. Les investisseurs ont dit que ce n'était pas un scénario. Nous avons dit que nous avions aussi des clients, des recherches sur les satellites, les docks, les villes intelligentes et les industries intelligentes. Ils ont dit que votre travail était trop dispersé, donc nous n'investirons pas." C'est ce que j'ai entendu de la part d'entrepreneurs qui font des modèles généraux d'intelligence artificielle.
Comme nous le savons tous, les VC en Chine aiment le plus "éduquer" les entrepreneurs, et bien sûr éduquer les scientifiques qui sont engagés dans l'entrepreneuriat en intelligence artificielle. "Vous devez avoir des données dans cette industrie", c'est leur phrase préférée pour éduquer les entrepreneurs en IA.
Il existe des données dans une certaine industrie, et il est nécessaire de se concentrer sur la fourniture de solutions dans un certain domaine segmenté.C'est l'état d'esprit de la plupart des VC et PE en Chine qui prétendent investir dans l'intelligence artificielle. Ensuite, nous regardons "quelle est la taille de la scène", la scène de la caméra de sécurité est assez grande, donc le modèle d'évaluation devient la taille de la Chine, combien de caméras peuvent être installées ? Combien coûte chaque caméra ? Quelle est la taille totale de la plaque de caméra ? Eh bien, la plaque est assez grande, et nous avons voté dans la subdivision de la caméra. Revenons à la logistique portuaire intelligente : combien y a-t-il de ports en Chine ? Combien y a-t-il de ports en eau profonde ? Combien chaque terminal portuaire peut-il payer pour des solutions d'IA ? Il s'est avéré que nous avons payé une si petite somme d'argent. Il semble que la scène du "port" n'est pas assez grande, donc nous ne voterons pas. L'homme numérique virtuel de l'IA comme service client ? Il peut être lié au métavers, il a une histoire et de l'imagination, eh bien, nous pouvons l'essayer.
Donc, ce que vous voyez, c'est que les "quatre tigres" de l'intelligence artificielle chinoise sont essentiellement engagés dans le domaine des caméras et de la reconnaissance faciale, et ils sont tous devenus des exécutants et des intégrateurs de projets d'IA. Le modèle commercial est le même que celui de Neusoft et iSoftStone il y a 30 ans.
Pendant une assez longue période, peu d'investisseurs dans le domaine de l'intelligence artificielle ont cru sincèrement qu'un modèle général pouvait être réutilisé dans diverses industries. Parfois, il y en a quelques-uns qui sont un peu patients et intéressés par le modèle général, et ce sont essentiellement des fonds en RMB. Le fonds en dollars américains n'est vraiment pas intéressé par la tentative de l'équipe chinoise de développer un modèle général. Pensez-vous qu'en comparant la difficulté et le niveau de formation des modèles d'entreprises comme OpenAI et Google, ils sentent qu'il y a un fossé entre l'équipe chinoise en la matière ? Alors vous pensez vraiment trop. Ils connaissent le moment où le développement du modèle GPT est en cours, c'est-à-dire les deux derniers mois.
Ces gestionnaires d'investissement de première ligne qui se sont vantés que "SenseTime et Megvii vendent des caméras de sécurité à mes yeux", ces partenaires d'investissement de première ligne qui ont fièrement dit aux entrepreneurs que "votre modèle n'est pas une scène", sans parler de ces partenaires de fonds d'investissement en dollars américains qui n'ont guère investi dans l'intelligence artificielle dans l'histoire et qui ont bricolé avec des entrepreneurs chinois pour "aller à l'étranger" pour s'engager dans la crypto-monnaie pendant tant d'années, ont soudainement changé d'apparence aujourd'hui et ont déclaré qu'ils soutiendraient les entrepreneurs du "ChatGPT chinois". Ensuite, vous pouvez y réfléchir, leurs vœux et leur suffisance contiennent une certaine compréhension et sincérité du modèle général de l'intelligence artificielle, et certains sont des spéculations et des calculs.
Vous pouvez même y penser, l'entraînement d'un modèle sémantique super naturel peut coûter des dizaines de millions voire des centaines de millions de yuans par jour, sans parler du module de puissance de calcul qui assure l'entraînement des grands modèles - le meilleur GPU au monde, à cause de l'embargo déraisonnable des États-Unis. Il devient de plus en plus difficile à obtenir. Avec l'attitude et le style de comportement de ces investisseurs au cours des dernières années, ils peuvent persister pendant quelques jours, combien d'argent sont-ils prêts à persuader le comité d'investissement d'investir, ou peuvent-ils aider ces équipes entrepreneuriales à résoudre le problème du GPU ? Peut-être qu'un jour, peut-être six mois plus tard, ils commenceront à exhorter ces équipes de modèles généraux à "réaliser la commercialisation dans des domaines subdivisés" dès que possible.
Avec l'insistance de Baidu à investir dans le modèle PaddlePaddle, il est inévitable qu'il pratique cette industrie modèle dès le début et poursuive la commercialisation dans différentes industries dès que possible. Dans une large mesure, la formation de grands modèles d'intelligence artificielle générale comporte un "triangle impossible" de données massives, de production de contenu créatif et de haute qualité et d'application industrielle.
Pour obtenir des données massives et une production de contenu créatif de haute qualité, il est inévitable qu'il ne puisse pas être appliqué rapidement à la mise en œuvre spécifique d'une certaine industrie - telle que ChatGPT.
Si vous souhaitez créer des scénarios d'atterrissage industriel spécifiques dans les plus grandes données de masse créées par les humains sur Internet, vous ne pourrez certainement pas fournir des résultats de la plus haute qualité, car il doit y avoir des conflits entre la génération de contenu basée sur des données de masse et des systèmes de prise de décision précis - c'est en fait un gaspillage.
Si vous souhaitez obtenir une sortie de contenu de haute qualité pour aider à la prise de décision précise dans les scénarios d'atterrissage industriel, vous devez sacrifier la plus grande quantité de données, et les données détenues par les scénarios industriels les plus précis ne peuvent pas prendre en charge la formation et la recherche de modèles à grande échelle.
Ces entrepreneurs et investisseurs qui se préparent aujourd'hui à entrer dans le "ChatGPT chinois", sans parler de combien d'argent et combien de GPU vous avez dans vos poches, puisque vous êtes tous sur ce bateau, vous sentez que vous détenez un ticket. Quel coin du "triangle impossible" de l'intelligence artificielle générale déciderez-vous d'écarter ? C'est une question qui doit d'abord être résolue.
En d'autres termes, quelle institution d'investissement - qu'il s'agisse d'une institution financière d'investissement ou d'un département d'investissement d'une grande entreprise - a la volonté d'investir dans la formation de modèles sémantiques naturels à grande échelle pendant plusieurs années et d'allonger à l'infini le cycle de retour ? Après tout, l'histoire nous dit qu'il s'agit du groupe de personnes les moins déterminées et les plus anxieuses de trouver un successeur.
La Chine n'a jamais manqué d'entrepreneurs et de scientifiques exceptionnels, et le domaine de l'intelligence artificielle ne fait pas exception. Le niveau et l'accumulation d'entreprises technologiques chinoises et américaines dans le domaine de l'intelligence artificielle sont les plus proches au monde.Il y a au moins quelques années, il n'y avait pas un grand écart entre la Chine et les États-Unis dans la construction et la formation de grands modèles sémantiques naturels. Cependant, la Chine manque d'institutions d'investissement et d'investisseurs qui ont une vision plus large, ne suivent pas les opinions des autres, sont déterminés et clairvoyants.
Des gens comme Shen Xiangyang, Li Di, Ma Weiying, Wang Xiaochuan et Li Zhifei, qui sont sortis pour lancer des modèles sémantiques naturels génériques à grande échelle, sont assez fiables, mais le problème est qu'ils doivent changer un groupe d'institutions d'investissement et d'investisseurs qui les soutiennent.
Pour être honnête, bien qu'aucune institution d'investissement sérieuse n'ait examiné les modèles généraux d'intelligence artificielle depuis tant d'années, certaines institutions ont encore investi dans de nombreuses sociétés d'intelligence artificielle avec des cycles de récupération extrêmement longs. Par exemple, les VC qui ont investi dans les solutions lidar locales et de conduite autonome de la Chine ont contribué à l'établissement de la toute nouvelle compétitivité de la Chine dans les changements sans précédent de l'industrie automobile mondiale en un siècle. Par exemple, ces VC qui ont investi dans les GPU locaux de la Chine - cela est destiné à être une piste pleine de dangers, face à l'interdiction et à la suppression des États-Unis, et le cycle de retour est extrêmement long ; mais ces nouveaux acteurs de GPU locaux émergents - qu'il s'agisse de Hanbo, de Biren ou d'autres, ils pourraient fournir des munitions pour le modèle général de traitement sémantique naturel de la Chine à l'avenir. Les investisseurs derrière eux, s'ils se décident un jour à soutenir le projet de modèle sémantique naturel à grande échelle de la Chine, j'aurai peut-être des attentes et une confiance différentes en eux.
C'est juste qu'il n'y a pas trop d'investisseurs et d'institutions d'investissement qui ne se vantent pas, ne se retiennent pas et ne se précipitent pas pour un succès rapide, mais ils sont trop peu nombreux.Cependant, la construction et la formation du modèle sémantique naturel de la Chine ont besoin de tels investisseurs et institutions d'investissement, qu'il s'agisse d'un investisseur financier, d'un investisseur stratégique ou d'une institution financière soutenue par la volonté de l'État.
La Chine doit avoir son propre modèle sémantique naturel à grande échelle à usage général. Elle doit avoir la vision de fournir la sagesse chinoise, le système de valeurs chinois et des solutions chinoises pour l'intelligence artificielle globale à usage général. Elle doit éviter les risques et les problèmes juridiques, moraux et éthiques dans l'ensemble du processus de sélection de corpus, de construction et de formation de modèles et d'ajustement des paramètres. Elle a également besoin de détermination et de patience.
En aucun cas, il ne peut être spéculé.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Récompense
J'aime
1
Reposter
Partager
Commentaire
0/400
AhQuan1204
· 2023-07-24 00:07
Vous êtes un phénomène, les pays commencent à interdire
Qui retient le ChatGPT chinois ?
ChatGPT est devenu un produit incontestablement phénoménal dans l'industrie mondiale des technologies de l'information.
Au nom de "l'intelligence artificielle générale", il discute avec des êtres humains, aide les gens à rédiger des e-mails et des lettres d'avocat, répond à certaines questions philosophiques ésotériques ultimes, écrit un code Python utilisable, répond à certaines questions qui semblent nécessiter une logique complexe et progressive, écrit un scénario de film basé sur certains paramètres de personnages, écrit un beau poème d'amour, attrape les devoirs de thèse des étudiants... Il semble qu'il n'y ait pas d'espèce d'IA aussi polyvalente dans l'histoire humaine. Bill Gates a déclaré que l'émergence de ChatGPT n'est "pas moins que la naissance d'Internet". Le PDG de Microsoft, Satya Nadella, a déclaré que c'était comparable à la révolution industrielle. Les amateurs d'intelligence artificielle orale ont une fois de plus crié que la "singularité" est en train d'arriver. La maturité mentale, c'est vraiment quelque chose qui rend l'IA heureuse.
J'ai utilisé ChatGPT pour faire beaucoup de choses indescriptibles, et j'ai trouvé que ce n'est pas toujours pratique, mais il peut donner de meilleures réponses et solutions à certains problèmes apparemment plus difficiles. Par exemple, si vous demandez si BYD peut battre Tesla, cela peut donner des déclarations claires et banales avec de nombreuses erreurs factuelles et aucune personnalité ; mais si vous lui demandez comment la conduite autonome changera le design industriel d'une voiture, cela peut donner une discussion pleine d'imagination de l'intérieur en termes d'innovation de châssis, de changements d'intérieur, de divertissement numérique et de percées d'apparence. Dans l'ensemble, ChatGPT est assez imparfait, notamment en termes de précision convaincante, mais il surprend souvent les humains dans des domaines tels que la fourniture d'un discours d'information structuré, l'ouverture de l'imagination et la libération de la créativité. Vous ne pouvez pas dire quelle utilisation spécifique il a pour vous, mais cela peut vous aider à réaliser et à compléter des choses triviales, redondantes et même créatives.
C'est un tel ChatGPT apparemment inutile mais utile, qui semble être utile mais inutile, qui a poussé sa société mère OpenAI à recevoir un investissement supplémentaire de Microsoft de plus de 10 milliards de dollars américains.Il a fallu deux jours pour percer le million d'utilisateurs, et Facebook a mis 305 jours; Le réseau de neurones à grande échelle contenant 175 milliards de paramètres -lorsqu'il est préférentiellement licencié à Microsoft pour intégrer des logiciels bureautiques et des services de moteurs de recherche comme Office et Bing, il devient vraiment un produit "utilisable".
Mais cela suffit à rendre jaloux les licornes chinoises de l'IA.
Avec 500 employés, la valorisation globale de l'entreprise est proche de 30 milliards de dollars américains. C'est OpenAI ; avec des milliers de personnes, la valorisation/valeur de marché de l'entreprise est au mieux de 1 à 2 milliards de dollars américains. Il s'agit d'un certain nombre de "petits géants" de l'IA en Chine.
En raison de l'énorme écart entre l'efficacité humaine et la valeur, et en raison de l'influence soudaine de ChatGPT sur la société réelle de tous les êtres humains, la naissance de ChatGPT a considérablement stimulé le domaine de l'intelligence artificielle en Chine. De nombreuses personnes ont de nouveau sauté, estimant que l'écart entre la Chine et les États-Unis en matière d'intelligence artificielle s'est encore creusé, et que la Chine a encore un long chemin à parcourir pour rattraper cette vague. Certaines personnes souhaitent également discuter des raisons pour lesquelles la Chine n'a pas son propre ChatGPT, et la conclusion est toujours que "la Chine manque de terreau pour l'innovation" et que "les sociétés Internet chinoises sont engagées dans la diffusion en direct et l'épicerie", qui sont à la fois irresponsables et ignorantes des faits.
Les entreprises Internet chinoises ne sont pas toutes engagées dans la diffusion en direct et l'épicerie. Elles sont engagées dans le développement de semi-conducteurs, la recherche de modèles d'IA et la conduite autonome. Les entreprises Internet américaines sont également très populaires dans la diffusion en direct, l'épicerie et surtout la finance sur Internet.
En tant que société Internet chinoise la plus accumulée dans le domaine de l'intelligence artificielle et du traitement sémantique naturel, Baidu travaille sur son propre grand modèle d'apprentissage en profondeur "Paddle Paddle" (Paddle Paddle) depuis cinq ans, et a même utilisé sa propre puce d'IA à usage général "Kunlun Core" pour former son propre modèle - ils constituent l'environnement de base et la prémisse permettant à Baidu de former son propre "ChatGPT". Alibaba, ByteDance et Didi ont également des modèles de formation sémantique naturels basés sur leurs propres besoins. On peut dire qu'en termes de formation de modèles sémantiques naturels complexes avec des dizaines de milliards de paramètres, les entreprises et institutions de recherche chinoises ne sont pas faibles, et leur point de départ n'est pas inférieur à celui de leurs homologues américains - du moins vers 2016. Ces dernières années, l'écart entre les cercles de l'intelligence artificielle chinois et américain dans le domaine des modèles à grande échelle n'est pas une question de prise de conscience, de point de départ et de capacité, mais une question de routes et de méthodes.
L'écart entre la Chine et les États-Unis dans le domaine des modèles de dialogue homme-machine de type ChatGPT n'est pas causé par une soi-disant réglementation. Si vous avez eu des échanges francs avec ChatGPT sur certaines questions religieuses, culturelles, ethniques et géopolitiques plus riches, vous vous rendrez compte que derrière son refus apparent et sa discussion prudente sur ces questions, il y a certaines tendances de position spécifiques qui coïncident subtilement avec les valeurs dominantes généralement reconnues dans la société américaine. On peut dire que pour tout modèle complexe de sémantique naturelle, le processus de construction du modèle, de collecte de corpus, de formation et d'ajustement des paramètres est un processus de "révision de contenu" basé sur un système de valeurs spécifique, et tous ont conscience de maintenir leur système de valeurs. Il ne s'agit pas de savoir si nous devons "générer" la position de valeur de la Chine dans le modèle sémantique naturel, mais comment elle doit être générée afin de vérifier et d'équilibrer véritablement la vision du monde et l'hégémonie culturelle selon lesquelles l'anglais domine le corpus mondial de l'Internet, de renforcer le poids des repères de compréhension de la langue chinoise dans le système mondial de traitement sémantique naturel et de fournir une diversité culturelle pour le développement de l'intelligence artificielle et du dialogue homme-ordinateur dans le monde.
Je suis aussi sérieusement en désaccord avec l'affirmation selon laquelle la qualité des informations Internet chinoises est trop mauvaise pour que la source du corpus du modèle chinois ChatGPT soit "polluée".C'est aussi un jugement paresseux et intelligent. En raison de la quantité totale d'informations sur Internet, le contenu en anglais est sans aucun doute le plus important au monde, et le contenu extrême de qualité inquiétante est également le plus important, ce qui affectera le processus et les résultats de la formation du modèle sémantique naturel. Au début de la formation, ChatGPT a donné la priorité au contenu très apprécié sur le forum social Reddit avec une qualité de contenu élevée, qui a une tendance spécifique à la sélection de corpus. Si la Chine donne la priorité aux communautés du savoir telles que Zhihu et Dede, et que les grands médias donnent la priorité au corpus de modèles sémantiques, il n'y aura pas de problème de contamination du corpus. Sans parler de la maîtrise de la langue étrangère et de l'étendue de la lecture de la plupart des gens qui soutiennent que "la qualité du contenu chinois est faible" ne suffit pas à étayer leurs conclusions.
Mais en tout cas, la naissance de ChatGPT est bel et bien une sorte de stimulation et un défi conceptuel pour moi, qui appelle depuis de nombreuses années à "l'adieu au culte de la Silicon Valley".
Ce n'est pas parce que je pense que l'écart entre la Chine et les États-Unis dans le domaine de l'intelligence artificielle s'est creusé, mais parce qu'un modèle général de dialogue humain-ordinateur d'intelligence artificielle tel que ChatGPT est un outil qui peut véritablement promouvoir la collaboration de production sociale et la civilisation du point de vue de tous les êtres humains, plutôt que d'un domaine ou d'une industrie spécifique. Son importance est supérieure à l'émergence de l'Internet mobile, comparable à la naissance de la messagerie électronique et des moteurs de recherche. En tant que puissance de l'intelligence artificielle, la Chine n'est plus un pays avec une industrie des technologies de l'information médiocre lorsque les e-mails et les moteurs de recherche sont nés.Cependant, nous n'avons pas laissé ce type d'innovation générale de l'intelligence artificielle qui peut affecter le progrès de la civilisation humaine se produire pour la première fois en Chine, et former un modèle dont le corpus de base est construit à partir de la culture et du système de valeurs chinois.
De plus, la méthode de formation du modèle de ChatGPT repose en grande partie sur la mise à niveau des paramètres de "renforcement des miracles", la formation répétée et l'optimisation itérative continue du modèle basée sur les commentaires du contenu généré - c'était à l'origine la méthode de travail dans laquelle l'équipe chinoise était la meilleure. Lorsqu'une start-up américaine utilise l'argent collecté auprès de Microsoft pour investir à tout prix dans d'énormes coûts de puissance de calcul, emploie un grand nombre de travailleurs des données en Afrique et au Moyen-Orient pour l'étiquetage des informations et utilise les itérations les plus efficaces pour mener une "course aux armements" de modèle de traitement sémantique à grande échelle avec des géants comme Google, vous avez toujours un sentiment très irréel - qu'il s'agisse d'une entreprise de San Francisco ou d'une entreprise de Shenzhen.
Un modèle de traitement sémantique naturel comme ChatGPT aurait dû naître en Chine, mais il n'est pas né en Chine.La raison doit commencer par les entreprises technologiques chinoises engagées dans l'intelligence artificielle, peu importe ce que font les géants ou les startups ces dernières années.
Un problème que beaucoup de gens ne réalisent peut-être jamais est qu'un modèle de traitement sémantique naturel à très grande échelle comme ChatGPT est le plus susceptible de produire des miracles lorsqu'il est construit par une start-up d'IA, et de meilleurs résultats ne sont généralement pas obtenus au sein d'un géant de la technologie. C'est pourquoi le modèle d'application de dialogue LaMDA de Google et Bard, qui s'est récemment lancé dans la bataille, n'ont pas brillé, et c'est aussi le défi auquel Baidu sera inévitablement confronté ensuite.
Pourquoi? La première est que la modélisation générale du traitement sémantique naturel est trop coûteuse. En fait, brûler de l'argent n'est généralement pas l'apanage des grandes entreprises, mais le privilège des startups. Les géants de la technologie sont presque tous des sociétés cotées en bourse. L'investissement de dizaines de milliards de dollars est investi dans quelque chose qui ne rapportera pas avant longtemps. La pression sur le directeur financier face au conseil d'administration et aux assemblées d'actionnaires est très élevée, et ils sont souvent punis par le cours de l'action. Cela fait que les grandes entreprises n'osent pas prendre de gros risques. Qu'est-ce que "Faire des miracles vigoureusement" ? C'est de dépenser beaucoup d'argent et de faire d'abord de grands efforts, puis de prier pour que des miracles se produisent, au lieu d'accepter qu'un miracle doit se produire, puis de décider de dépenser de l'argent et de faire de grands efforts.
Malheureusement, les grandes entreprises ne peuvent être que ces dernières. C'est pourquoi même Microsoft, qui a beaucoup profité de ChatGPT, n'a osé partir que d'un milliard de dollars au début, qui a duré quatre ans, jusqu'à 10 milliards de dollars cette année, et a continué à augmenter les investissements un par un pour soutenir OpenAI dans "in vitro" de Microsoft, entraînant le modèle GPT pendant de nombreuses années. Les fonds propres acquis par Microsoft en investissant dans OpenAI ont pour priorité d'intégrer la capacité du modèle ChatGPT dans son Office et ses moteurs de recherche.Il n'est peut-être pas facile de dire s'il mangera OpenAI à l'avenir, mais au moins Microsoft, qui a une valeur marchande de près d'un billion de dollars américains et un revenu annuel de dizaines de milliards de dollars américains, n'ose absolument pas "faire des miracles vigoureusement" au début et former ce modèle tout seul.
Deuxièmement, parce que les gens sont moins tolérants envers les géants de la technologie qui s'engagent dans l'innovation, et plus tolérants envers les erreurs et les déviations des startups. Afin de faire face à la pression de ChatGPT, Google a lancé à la hâte la version de test de dialogue homme-ordinateur Bard. Il a été constaté que certains dialogues contenaient des erreurs factuelles de base, il a donc été amplifié à l'infini et la valeur marchande s'est évaporée de centaines de milliards de dollars du jour au lendemain. En fait, ce n'est pas que Google ne le sache pas, s'il n'était pas pressé, ce ne serait pas si téméraire. Le modèle LaMDA annoncé par Google en 2021 a des niveaux de paramètres et des capacités de recherche d'informations nettement plus élevés que le GPT-3 formé par OpenAI à l'époque, mais Google a hésité à tester publiquement son effet car il a peur qu'il fasse des erreurs, provoquant la méfiance du public et la baisse du cours des actions.
Ce dont Google se soucie, OpenAI ne s'en soucie pas. Dès le premier jour de la sortie de ChatGPT, il a déclaré publiquement qu'il n'avait aucune capacité de récupération d'informations et que son corpus n'était que jusqu'en décembre 2021. Il ne peut pas répondre à de nombreuses questions sur la valeur et les jugements moraux, et fait souvent des erreurs factuelles. Les testeurs ont accepté avec tolérance l'auto-"mauvaise performance" de ChatGPT et ont été étonnés de sa capacité d'association d'informations, d'expression émotionnelle, de structure logique et de cohérence de pensée dans les domaines de la programmation, de la création littéraire, de l'écriture formatée et de la consultation médicale, et ont légèrement ignoré les erreurs qu'il a commises.
En mars 2019, après le succès sans précédent du modèle GPT-2, OpenAI, âgé de quatre ans, a décidé de passer d'une fondation à but non lucratif à une société commerciale. Après tout, aucune fondation ne peut supporter le salaire annuel de 1,5 million de dollars de son scientifique en chef.En mai 2019, Sam Altman (Sam Altman) est devenu le PDG d'OpenAI. Ensuite, OpenAI a reçu un investissement de 1 milliard de dollars de Microsoft. En mai 2020, le modèle GPT-3 lancé par OpenAI a des paramètres qui ont fortement augmenté, passant de 1,5 milliard en GPT-2 à 175 milliards, formant un système d'apprentissage automatique d'une puissance sans précédent.
On peut voir qu'une start-up d'intelligence artificielle qui est née avec une cuillère en or dans la bouche, a levé une énorme somme d'argent et est liée à des entreprises géantes, est engagée dans la construction et le développement de modèles sémantiques naturels d'intelligence artificielle à usage général et investit dans la formation de modèles quel que soit le coût, ce qui est l'état le plus idéal. Les retours imaginatifs et commerciaux qui accompagnent les modèles les plus puissants sont suffisants pour stimuler Microsoft et d'autres investisseurs.
Alors, pourquoi cette logique ne fonctionne-t-elle pas en Chine ? La Chine a-t-elle jamais eu un puissant modèle d'intelligence artificielle sémantique naturelle à usage général, même s'il ne s'agissait que d'un prototype ?
Pour répondre à cette question, regardez quand Microsoft a investi pour la première fois dans OpenAI : juillet 2019. Quatre mois après que Microsoft a parié sur le modèle GPT d'OpenAI, c'est-à-dire en novembre 2019, Shen Xiangyang, le vice-président senior mondial de Microsoft qui est en charge de l'activité de recherche Bing et le principal responsable de l'intelligence artificielle de Microsoft, et un informaticien de Hong Kong, Chine, a annoncé qu'il avait quitté Microsoft depuis plus de 20 ans. Et la dernière contribution de Shen Xiangyang au modèle général d'intelligence artificielle de Microsoft est le robot de chat Xiaobing développé par Microsoft Asia Internet Engineering Institute en 2014.
En juillet 2020, Xiaoice est devenue indépendante de Microsoft et est devenue une start-up chinoise d'intelligence artificielle. Shen Xiangyang en a été le président et Li Di, l'ancien vice-président exécutif de Microsoft Asia Internet Engineering Academy, en a été le PDG. Xiaoice est passée à plus de la sixième génération lorsqu'elle est devenue indépendante, et ses formes de produits impliquent des robots d'intelligence artificielle conversationnels, des assistants vocaux intelligents, des fournisseurs de contenu créés par l'intelligence artificielle et une série de solutions de champ vertical. Xiaoice a jadis suscité un débat public, en plus d'être un robot de chat plein d'émotions et de sexualité féminine, il a aussi ses performances étonnantes dans le domaine de la création poétique chinoise - elle a publié un recueil de poèmes "Sunshine Lost the Glass Window", qui a reçu beaucoup d'éloges et plus de controverses.
Il ne fait aucun doute qu'un robot XiaoIce capable d'écrire des poèmes et de mener des conversations simples basées sur l'émotion et le bon sens était le modèle d'intelligence artificielle générale conversationnelle le plus performant au monde il y a quelques années.
Il est impossible pour l'équipe dirigée par Shen Xiangyang de comprendre la recherche, et encore moins l'intelligence artificielle. Et le départ de Shen Xiangyang de Microsoft et de "l'indépendance" de Xiaobing, couplé à l'investissement et à la coopération du PDG de Microsoft, Nadella, avec OpenAI, est en fait le premier négociant en intelligence artificielle en Chine et aux États-Unis. Une séparation formelle des chemins dans le domaine des modèles généraux d'intelligence artificielle.
Alors, Xiaobing écrit-il encore de la poésie aujourd'hui ? Qu'est-ce que ça fait
Au cours des deux dernières années, Xiaobing a depuis longtemps cessé d'écrire des poèmes. Il est occupé à commercialiser. Il a créé un studio de jeux pour fournir du contenu de dialogue scénarisé aux PNJ pour les jeux ; il a coopéré avec les Jeux olympiques d'hiver pour fournir un système de notation visuel pour les compétences aériennes en ski acrobatique ; il a fourni à Wind Information des résumés textuels générés par l'intelligence artificielle des annonces des sociétés cotées en bourse ;
En un mot, par le passé, l'équipe d'intelligence artificielle qui représentait le niveau supérieur du modèle général d'intelligence artificielle sémantique naturelle, et les Chinois soutenaient l'ensemble de la structure, est maintenant devenue un fournisseur d'intelligence artificielle qui mélange l'intelligence artificielle générative et l'intelligence artificielle décisionnelle et fournit des solutions spécifiques pour des scénarios spécifiques.
Vous ne pouvez pas dire que c'est la "chute" de Xiaoice, après tout, elle n'a levé que des centaines de millions de yuans sur le marché des capitaux. Selon la méthode de formation modèle de ChatGPT, l'argent sera dépensé en une journée. Sans la protection de Microsoft, Xiaobing doit prendre soin de sa propre vie. Cependant, je n'ai jamais entendu parler de Baidu, Tencent ou ByteDance, j'ai pensé à investir dans Xiaoice et à le soutenir pour continuer à développer un modèle à grande échelle d'intelligence artificielle sémantique naturelle générale.
Pas seulement Xiaobing. Au cours des dernières années, d'autres équipes entrepreneuriales en Chine se sont également engagées dans la modélisation automatique de l'intelligence artificielle générale et de l'informatique hétérogène, permettant à 7 à 8 types de puces nationales et étrangères d'être connectées à des logiciels via ce modèle. Les institutions d'investissement chinoises n'ont jamais montré d'intérêt pour les modèles généraux d'intelligence artificielle, et même un peu d'imagination.
"Plus de 85% des investisseurs nous ont demandé de présenter le scénario du produit. Nous avons dit que nous aidions le GPU à se connecter à l'écosystème logiciel, et même Nvidia utilise notre modèle. Les investisseurs ont dit que ce n'était pas un scénario. Nous avons dit que nous avions aussi des clients, des recherches sur les satellites, les docks, les villes intelligentes et les industries intelligentes. Ils ont dit que votre travail était trop dispersé, donc nous n'investirons pas." C'est ce que j'ai entendu de la part d'entrepreneurs qui font des modèles généraux d'intelligence artificielle.
Comme nous le savons tous, les VC en Chine aiment le plus "éduquer" les entrepreneurs, et bien sûr éduquer les scientifiques qui sont engagés dans l'entrepreneuriat en intelligence artificielle. "Vous devez avoir des données dans cette industrie", c'est leur phrase préférée pour éduquer les entrepreneurs en IA.
Il existe des données dans une certaine industrie, et il est nécessaire de se concentrer sur la fourniture de solutions dans un certain domaine segmenté.C'est l'état d'esprit de la plupart des VC et PE en Chine qui prétendent investir dans l'intelligence artificielle. Ensuite, nous regardons "quelle est la taille de la scène", la scène de la caméra de sécurité est assez grande, donc le modèle d'évaluation devient la taille de la Chine, combien de caméras peuvent être installées ? Combien coûte chaque caméra ? Quelle est la taille totale de la plaque de caméra ? Eh bien, la plaque est assez grande, et nous avons voté dans la subdivision de la caméra. Revenons à la logistique portuaire intelligente : combien y a-t-il de ports en Chine ? Combien y a-t-il de ports en eau profonde ? Combien chaque terminal portuaire peut-il payer pour des solutions d'IA ? Il s'est avéré que nous avons payé une si petite somme d'argent. Il semble que la scène du "port" n'est pas assez grande, donc nous ne voterons pas. L'homme numérique virtuel de l'IA comme service client ? Il peut être lié au métavers, il a une histoire et de l'imagination, eh bien, nous pouvons l'essayer.
Donc, ce que vous voyez, c'est que les "quatre tigres" de l'intelligence artificielle chinoise sont essentiellement engagés dans le domaine des caméras et de la reconnaissance faciale, et ils sont tous devenus des exécutants et des intégrateurs de projets d'IA. Le modèle commercial est le même que celui de Neusoft et iSoftStone il y a 30 ans.
Pendant une assez longue période, peu d'investisseurs dans le domaine de l'intelligence artificielle ont cru sincèrement qu'un modèle général pouvait être réutilisé dans diverses industries. Parfois, il y en a quelques-uns qui sont un peu patients et intéressés par le modèle général, et ce sont essentiellement des fonds en RMB. Le fonds en dollars américains n'est vraiment pas intéressé par la tentative de l'équipe chinoise de développer un modèle général. Pensez-vous qu'en comparant la difficulté et le niveau de formation des modèles d'entreprises comme OpenAI et Google, ils sentent qu'il y a un fossé entre l'équipe chinoise en la matière ? Alors vous pensez vraiment trop. Ils connaissent le moment où le développement du modèle GPT est en cours, c'est-à-dire les deux derniers mois.
Ces gestionnaires d'investissement de première ligne qui se sont vantés que "SenseTime et Megvii vendent des caméras de sécurité à mes yeux", ces partenaires d'investissement de première ligne qui ont fièrement dit aux entrepreneurs que "votre modèle n'est pas une scène", sans parler de ces partenaires de fonds d'investissement en dollars américains qui n'ont guère investi dans l'intelligence artificielle dans l'histoire et qui ont bricolé avec des entrepreneurs chinois pour "aller à l'étranger" pour s'engager dans la crypto-monnaie pendant tant d'années, ont soudainement changé d'apparence aujourd'hui et ont déclaré qu'ils soutiendraient les entrepreneurs du "ChatGPT chinois". Ensuite, vous pouvez y réfléchir, leurs vœux et leur suffisance contiennent une certaine compréhension et sincérité du modèle général de l'intelligence artificielle, et certains sont des spéculations et des calculs.
Vous pouvez même y penser, l'entraînement d'un modèle sémantique super naturel peut coûter des dizaines de millions voire des centaines de millions de yuans par jour, sans parler du module de puissance de calcul qui assure l'entraînement des grands modèles - le meilleur GPU au monde, à cause de l'embargo déraisonnable des États-Unis. Il devient de plus en plus difficile à obtenir. Avec l'attitude et le style de comportement de ces investisseurs au cours des dernières années, ils peuvent persister pendant quelques jours, combien d'argent sont-ils prêts à persuader le comité d'investissement d'investir, ou peuvent-ils aider ces équipes entrepreneuriales à résoudre le problème du GPU ? Peut-être qu'un jour, peut-être six mois plus tard, ils commenceront à exhorter ces équipes de modèles généraux à "réaliser la commercialisation dans des domaines subdivisés" dès que possible.
Avec l'insistance de Baidu à investir dans le modèle PaddlePaddle, il est inévitable qu'il pratique cette industrie modèle dès le début et poursuive la commercialisation dans différentes industries dès que possible. Dans une large mesure, la formation de grands modèles d'intelligence artificielle générale comporte un "triangle impossible" de données massives, de production de contenu créatif et de haute qualité et d'application industrielle.
Pour obtenir des données massives et une production de contenu créatif de haute qualité, il est inévitable qu'il ne puisse pas être appliqué rapidement à la mise en œuvre spécifique d'une certaine industrie - telle que ChatGPT.
Si vous souhaitez créer des scénarios d'atterrissage industriel spécifiques dans les plus grandes données de masse créées par les humains sur Internet, vous ne pourrez certainement pas fournir des résultats de la plus haute qualité, car il doit y avoir des conflits entre la génération de contenu basée sur des données de masse et des systèmes de prise de décision précis - c'est en fait un gaspillage.
Si vous souhaitez obtenir une sortie de contenu de haute qualité pour aider à la prise de décision précise dans les scénarios d'atterrissage industriel, vous devez sacrifier la plus grande quantité de données, et les données détenues par les scénarios industriels les plus précis ne peuvent pas prendre en charge la formation et la recherche de modèles à grande échelle.
Ces entrepreneurs et investisseurs qui se préparent aujourd'hui à entrer dans le "ChatGPT chinois", sans parler de combien d'argent et combien de GPU vous avez dans vos poches, puisque vous êtes tous sur ce bateau, vous sentez que vous détenez un ticket. Quel coin du "triangle impossible" de l'intelligence artificielle générale déciderez-vous d'écarter ? C'est une question qui doit d'abord être résolue.
En d'autres termes, quelle institution d'investissement - qu'il s'agisse d'une institution financière d'investissement ou d'un département d'investissement d'une grande entreprise - a la volonté d'investir dans la formation de modèles sémantiques naturels à grande échelle pendant plusieurs années et d'allonger à l'infini le cycle de retour ? Après tout, l'histoire nous dit qu'il s'agit du groupe de personnes les moins déterminées et les plus anxieuses de trouver un successeur.
La Chine n'a jamais manqué d'entrepreneurs et de scientifiques exceptionnels, et le domaine de l'intelligence artificielle ne fait pas exception. Le niveau et l'accumulation d'entreprises technologiques chinoises et américaines dans le domaine de l'intelligence artificielle sont les plus proches au monde.Il y a au moins quelques années, il n'y avait pas un grand écart entre la Chine et les États-Unis dans la construction et la formation de grands modèles sémantiques naturels. Cependant, la Chine manque d'institutions d'investissement et d'investisseurs qui ont une vision plus large, ne suivent pas les opinions des autres, sont déterminés et clairvoyants.
Des gens comme Shen Xiangyang, Li Di, Ma Weiying, Wang Xiaochuan et Li Zhifei, qui sont sortis pour lancer des modèles sémantiques naturels génériques à grande échelle, sont assez fiables, mais le problème est qu'ils doivent changer un groupe d'institutions d'investissement et d'investisseurs qui les soutiennent.
Pour être honnête, bien qu'aucune institution d'investissement sérieuse n'ait examiné les modèles généraux d'intelligence artificielle depuis tant d'années, certaines institutions ont encore investi dans de nombreuses sociétés d'intelligence artificielle avec des cycles de récupération extrêmement longs. Par exemple, les VC qui ont investi dans les solutions lidar locales et de conduite autonome de la Chine ont contribué à l'établissement de la toute nouvelle compétitivité de la Chine dans les changements sans précédent de l'industrie automobile mondiale en un siècle. Par exemple, ces VC qui ont investi dans les GPU locaux de la Chine - cela est destiné à être une piste pleine de dangers, face à l'interdiction et à la suppression des États-Unis, et le cycle de retour est extrêmement long ; mais ces nouveaux acteurs de GPU locaux émergents - qu'il s'agisse de Hanbo, de Biren ou d'autres, ils pourraient fournir des munitions pour le modèle général de traitement sémantique naturel de la Chine à l'avenir. Les investisseurs derrière eux, s'ils se décident un jour à soutenir le projet de modèle sémantique naturel à grande échelle de la Chine, j'aurai peut-être des attentes et une confiance différentes en eux.
C'est juste qu'il n'y a pas trop d'investisseurs et d'institutions d'investissement qui ne se vantent pas, ne se retiennent pas et ne se précipitent pas pour un succès rapide, mais ils sont trop peu nombreux.Cependant, la construction et la formation du modèle sémantique naturel de la Chine ont besoin de tels investisseurs et institutions d'investissement, qu'il s'agisse d'un investisseur financier, d'un investisseur stratégique ou d'une institution financière soutenue par la volonté de l'État.
La Chine doit avoir son propre modèle sémantique naturel à grande échelle à usage général. Elle doit avoir la vision de fournir la sagesse chinoise, le système de valeurs chinois et des solutions chinoises pour l'intelligence artificielle globale à usage général. Elle doit éviter les risques et les problèmes juridiques, moraux et éthiques dans l'ensemble du processus de sélection de corpus, de construction et de formation de modèles et d'ajustement des paramètres. Elle a également besoin de détermination et de patience.
En aucun cas, il ne peut être spéculé.