ChatGPT став, безсумнівно, феноменальним продуктом у світовій індустрії інформаційних технологій.
В ім’я «загального штучного інтелекту» він спілкується з людьми, допомагає людям складати електронні листи та листи до юристів, відповідає на деякі езотеричні остаточні філософські запитання, пише придатний код Python, відповідає на деякі запитання, які, здається, вимагають складної та прогресивної логіки, пише сценарій фільму на основі деяких персонажів, пише гарний вірш про кохання, ловить дипломні роботи студентів коледжу... Здається, що є в історії людства не було такого універсального виду ШІ. Білл Гейтс сказав, що значення появи ChatGPT «не менше, ніж народження Інтернету». Генеральний директор Microsoft Сатья Наделла сказав, що це можна порівняти з промисловою революцією. Оральні ентузіасти штучного інтелекту знову вигукнули, що «сингулярність» наближається. Звичайні люди знову хвилюються, що їхню роботу замінять універсальні помічники ШІ, такі як ChatGPT... Від IBM «Deep Blue» від AlphaGo від Google, а потім від ChatGPT від OpenAI минуло 25 років. Розумова зрілість — це справді те, що робить ШІ щасливим.
Я використовував ChatGPT, щоб робити багато невимовних речей, і виявив, що це не завжди зручно, але може дати кращі відповіді та рішення для деяких, здавалося б, складніших проблем. Наприклад, якщо ви запитаєте, чи може BYD перемогти Tesla, він може дати деякі чіткі та непримітні заяви з багатьма фактичними помилками та без індивідуальності; але якщо ви запитаєте, як автономне водіння змінить промисловий дизайн автомобіля, це може дати дискусію, повну уяви зсередини назовні щодо інновацій шасі, змін інтер’єру, цифрових розваг та прориву зовнішнього вигляду. Загалом ChatGPT досить недосконалий, особливо з точки зору переконливої точності, але він часто дивує людей у таких сферах, як надання структурованого інформаційного дискурсу, розкриття уяви та звільнення творчості. Ви не можете сказати, яку конкретну користь він має для вас, але він може допомогти вам досягти та завершити деякі тривіальні, зайві та навіть творчі речі.
Саме такий, здавалося б, марний, але корисний ChatGPT, який здається корисним, але марним, змусив його материнську компанію OpenAI отримати додаткові інвестиції в розмірі понад 10 мільярдів доларів США від Microsoft. Знадобилося два дні, щоб пробитися через 1 мільйон користувачів, а Facebook знадобилося 305 днів; Великомасштабна нейронна мережа, що містить 175 мільярдів параметрів, коли вона має преференційну ліцензію Microsoft на інтеграцію офісного програмного забезпечення та служб пошукової системи, таких як Office і Bing , це дійсно стає «придатним» продуктом.
Але цього достатньо, щоб китайські штучні єдинороги позаздрили.
З 500 співробітниками загальна оцінка компанії наближається до 30 мільярдів доларів США. Це OpenAI; з тисячами людей оцінка/ринкова вартість компанії становить у кращому випадку 1-2 мільярди доларів США. Це низка «маленьких гігантів» ШІ в Китаї.
Через величезний розрив між ефективністю та цінністю людини, а також через раптовий вплив ChatGPT на реальне суспільство всіх людей, народження ChatGPT значно стимулювало сферу штучного інтелекту в Китаї. Багато людей знову вирвалися, відчуваючи, що розрив між Китаєм і Сполученими Штатами у сфері штучного інтелекту ще більше збільшився, і Китаю потрібно пройти довгий шлях, щоб наздогнати цю хвилю. Є також люди, які прагнуть обговорити, чому в Китаї немає власного ChatGPT, і висновок все одно полягає в тому, що «Китаю бракує ґрунту для інновацій» і «китайські інтернет-компанії займаються прямими трансляціями та купівлею продуктів», які водночас безвідповідальні та не знають фактів.
Китайські інтернет-компанії не всі займаються прямими трансляціями та покупками продуктів. Вони займаються розробкою напівпровідників, дослідженням моделей штучного інтелекту та автономним водінням.Американські інтернет-компанії також дуже популярні в прямих трансляціях, покупках продуктів і особливо в Інтернет-фінансах.
Як китайська інтернет-компанія з найбільшим накопиченням у сфері штучного інтелекту та природної семантичної обробки, Baidu протягом останніх п’яти років працювала над власною великою моделлю глибокого навчання «Paddle Paddle» (Paddle Paddle) і навіть використовувала власний чіп загального призначення «Kunlun Core» для навчання власної моделі – це базове середовище та передумова для Baidu для навчання власного «ChatGPT». Alibaba, ByteDance і Didi також мають природні семантичні моделі навчання, засновані на власних потребах. Можна сказати, що в плані навчання складних природних семантичних моделей з десятками мільярдів параметрів китайські компанії та науково-дослідні установи не слабкі, і їх стартова точка не нижче, ніж у американських колег — принаймні, приблизно в 2016 році. В останні роки розрив між китайськими та американськими колами штучного інтелекту в області великомасштабних моделей є не питанням обізнаності, відправної точки та здібностей, а питанням шляхів і методів.
Розрив між Китаєм і Сполученими Штатами в області ChatGPT-подібних моделей діалогу між людиною та комп’ютером не спричинений так званим регулюванням. Якщо ви відверто спілкувалися з ChatGPT щодо більш багатих релігійних, культурних, етнічних і геополітичних питань, ви зрозумієте, що за його, здавалося б, відмовою та розсудливим обговоренням цих питань існують певні специфічні позиційні тенденції, які тонко збігаються з основними цінностями, загальновизнаними в американському суспільстві. Можна сказати, що для будь-якої складної моделі природної семантики процес побудови моделі, збору корпусу, навчання та налаштування параметрів є процесом «перегляду змісту» на основі певної системи цінностей, і кожен має свідомість підтримувати свою систему цінностей. Питання не в тому, чи слід нам «генерувати» ціннісну позицію Китаю в природній семантичній моделі, а в тому, як її слід створити, щоб справді перевірити та збалансувати світогляд і культурну гегемонію, що англійська мова домінує в глобальному корпусі Інтернету, посилити вагу стандартів розуміння китайської мови в глобальній системі природної семантичної обробки та забезпечити культурне розмаїття для розвитку штучного інтелекту та діалогу між людиною та комп’ютером у світі.
Я також серйозно не згоден із твердженням про те, що якість китайської Інтернет-інформації надто погана, оскільки джерело корпусу китайської моделі ChatGPT «забруднене». Це також ліниве та розумне судження. Через загальну кількість інформації в Інтернеті англійський вміст, безсумнівно, є найбільшим у світі, а екстремальний вміст тривожної якості також найбільше, і все це вплине на процес і результати навчання природної семантичної моделі. На ранньому тренінгу ChatGPT надавав пріоритет високо оціненому контенту на соціальному форумі Reddit із високою якістю контенту, який має особливу тенденцію відбору корпусу. Якщо Китай надаватиме пріоритет таким спільнотам знань, як Zhihu та Dede, а основні засоби масової інформації віддадуть пріоритет корпусу семантичних моделей, проблеми забруднення корпусу не буде. Не кажучи вже про володіння іноземною мовою та навички читання більшості людей, які вважають, що «якість китайського контенту низька» недостатньо для підтвердження своїх висновків.
Але в будь-якому випадку, народження ChatGPT справді є свого роду стимулом і концептуальним викликом для мене, який уже багато років закликає «прощатися з поклонінням Кремнієвій долині».
Це не тому, що я вважаю, що розрив між Китаєм і Сполученими Штатами у сфері штучного інтелекту збільшився, а тому, що загальна модель діалогу між людиною та комп’ютером на основі штучного інтелекту, така як ChatGPT, є інструментом, який справді може сприяти співпраці у суспільному виробництві та цивілізації з точки зору всіх людей, а не окремої сфери чи галузі. Його значення є більшим, ніж поява мобільного Інтернету, яке можна порівняти з народженням електронної пошти та пошукових систем. Як потужний центр штучного інтелекту, Китай більше не є країною з поганою індустрією інформаційних технологій, коли народжувалися електронні листи та пошукові системи.Однак ми не дозволили подібним загальним інноваціям штучного інтелекту, які можуть вплинути на розвиток людської цивілізації, вперше з’явитися в Китаї, і підготували модель, основний корпус якої побудований на основі китайської культури та системи цінностей.
Більше того, метод навчання моделі ChatGPT значною мірою покладається на оновлення параметрів «посилення чудес», повторне навчання та безперервну ітераційну оптимізацію моделі на основі зворотного зв’язку згенерованого вмісту — спочатку це був робочий метод, у якому китайська команда була найкращою. Коли американська нова компанія використовує гроші, зібрані від Microsoft, щоб інвестувати величезні витрати на обчислювальну потужність за будь-яку ціну, наймає велику кількість працівників обробки даних в Африці та на Близькому Сході для маркування інформації та використовує найефективніші ітерації для проведення власно розробленої семантичної обробки великомасштабної моделі «гонки озброєнь» з такими гігантами, як Google, у вас все одно виникає дуже нереальне відчуття — чи це компанія з Сан-Франциско, чи з Шеньчженя.
Природна модель семантичної обробки, така як ChatGPT, мала народитися в Китаї, але вона народилася не в Китаї. Причина полягає в тому, що китайські технологічні компанії займаються штучним інтелектом, незалежно від того, чим займаються гіганти чи стартапи в ці роки.
Проблема, яку багато людей, можливо, ніколи не усвідомлять, полягає в тому, що супервеликомасштабна природна модель семантичної обробки загального призначення, така як ChatGPT, швидше за все, створить чудеса, якщо її створить компанія-стартап ШІ, а кращих результатів зазвичай не досягають у технологічному гіганті. Ось чому модель діалогового додатка Google LaMDA та Bard, який нещодавно кинувся у бій, не сяяли, і це також виклик, з яким Baidu неминуче зіткнеться.
чому Перше тому, що загальне моделювання природної семантичної обробки занадто дороге. Насправді спалювання грошей зазвичай не є вмінням великих компаній, а привілеєм стартапів. Майже всі технічні гіганти — це компанії, зареєстровані на біржі. Інвестиції в десятки мільярдів доларів інвестуються в те, що довго не повертатиметься. Тиск на головного фінансового директора з боку ради директорів і зборів акціонерів дуже високий, і вони часто караються ціною акцій. Це змушує великі компанії не наважуватися на великі ризики. Без великих ризиків не буде великих ітерацій. Що таке «Енергійне творіння чудес»? Це означає спочатку витратити багато грошей і докласти великих зусиль, а потім молитися, щоб сталися чудеса, замість того, щоб мовчазно погоджуватися з тим, що диво має статися, а потім вирішити витратити гроші і докласти великих зусиль.
На жаль, великі компанії можуть бути лише останніми. Ось чому навіть Microsoft, яка отримала велику вигоду від ChatGPT, наважилася почати лише з 1 мільярда доларів на початку, який тривав чотири роки, до цьогорічних 10 мільярдів доларів, і продовжувала збільшувати інвестиції одну за одною для підтримки OpenAI у Microsoft «in vitro», тренуючи модель GPT протягом багатьох років. Акціонерний капітал, отриманий Microsoft шляхом інвестування в OpenAI, користується пріоритетом інтеграції здатності моделі ChatGPT до свого Office і пошукових систем.Можливо, непросто сказати, чи з’їсть він OpenAI у майбутньому, але принаймні Microsoft, ринкова вартість якої становить майже один трильйон доларів США та річний дохід у десятки мільярдів доларів США, абсолютно не наважується спочатку «робити чудеса» та тренувати це модель сама по собі.
По-друге, тому що люди менш терпимі до технологічних гігантів, які займаються інноваціями, і більш терпимі до помилок і відхилень у стартапах. Щоб впоратися з тиском ChatGPT, Google поспішно запустив тестову версію діалогу між людиною та комп’ютером Bard. Було виявлено, що деякі діалоги містять основні фактичні помилки, тому їх нескінченно збільшували, а ринкова вартість випарувалася за одну ніч на сотні мільярдів доларів. Справа не в тому, що Google цього не знає. Якби його не поспішали, це було б не так поспішно. Модель LaMDA, анонсована Google у 2021 році, має значно вищі рівні параметрів і можливості пошуку інформації, ніж GPT-3, навчений OpenAI на той час, але Google не бажає публічно тестувати її ефект, оскільки побоюється, що вона припуститься помилок, що спричинить недовіру громадськості та падіння цін на акції.
Те, що дбає Google, не хвилює OpenAI. З першого дня випуску ChatGPT публічно заявлялося, що він не має можливостей пошуку інформації, а його корпус діє лише до грудня 2021 року. Він не може відповісти на багато питань щодо ціннісних і моральних суджень і часто допускає фактичні помилки. Тестувальники толерантно сприйняли «погану роботу» ChatGPT і були вражені його здатністю асоціювати інформацію, емоційно виражати, логічній структурі та узгодженості мислення в сферах програмування, літературної творчості, форматованого письма та медичних консультацій, і легковажно ігнорували зроблені помилки.
У березні 2019 року, після безпрецедентного успіху моделі GPT-2, чотирирічна OpenAI вирішила перетворитися з некомерційної організації на комерційну компанію. Адже жоден фонд не витримає річну зарплату свого головного вченого в $1,5 млн. У травні 2019 року Сем Альтман (Sam Altman) став генеральним директором OpenAI. Тоді OpenAI отримав 1 мільярд доларів інвестицій від Microsoft. У травні 2020 року модель GPT-3, запущена OpenAI, має параметри, які різко зросли з 1,5 мільярда в GPT-2 до 175 мільярдів, утворюючи безпрецедентно потужну систему автоматичного навчання.
Можна побачити, що стартап-компанія зі штучного інтелекту, яка народилася із золотою ложкою в роті, зібрала величезну суму грошей і має гігантський бізнес, займається створенням і розробкою природних семантичних моделей штучного інтелекту загального призначення та інвестує в навчання моделей незалежно від вартості, що є найбільш ідеальним станом. Творчі та комерційні прибутки, які приносять найпотужніші моделі, достатні, щоб підштовхнути Microsoft та інших інвесторів.
Отже, чому ця логіка не працює в Китаї? Чи була в Китаї колись потужна природна семантична модель штучного інтелекту загального призначення, навіть якщо це був лише прототип?
Щоб відповісти на це запитання, подивіться, коли Microsoft вперше інвестувала в OpenAI: липень 2019 року. Через чотири місяці після того, як Microsoft зробила ставку на модель GPT OpenAI, тобто в листопаді 2019 року, Шен Сян'ян, глобальний старший віце-президент Microsoft, який відповідає за пошуковий бізнес Bing і головна особа, відповідальна за штучний інтелект Microsoft, і комп'ютерний вчений з Гонконгу, Китай, оголосив, що залишив Microsoft на більш ніж 20 років. І останнім внеском Шень Сян’ян у загальну модель штучного інтелекту Microsoft є чат-робот Xiaobing, розроблений Microsoft Asia Internet Engineering Institute у 2014 році.
У липні 2020 року Xiaoice стала незалежною від Microsoft і стала китайською стартап-компанією зі штучного інтелекту. Шень Сяньян обіймав посаду голови правління, а Лі Ді, колишній виконавчий віце-президент Microsoft Asia Internet Engineering Academy, обіймав посаду генерального директора. Коли Xiaoice став незалежним, він розвинувся до більш ніж шостого покоління. Його форми продуктів включали розмовних роботів зі штучним інтелектом, інтелектуальних голосових помічників, контент-провайдерів, створених штучним інтелектом, і ряд рішень для вертикального поля. Одного разу Xiaoice викликала громадське обговорення, окрім того, що вона була сповненим емоцій і жіночої сексуальності чат-роботом, вона також має дивовижну продуктивність у сфері створення китайської поезії – вона опублікувала збірку віршів «Sunshine Lost the Glass Window», яка отримала багато похвал і більше суперечок.
Немає сумніву, що кілька років тому робот XiaoIce, який може писати вірші та вести прості емоційні та здорові розмови, був найефективнішою загальною моделлю штучного інтелекту для розмов у світі.
Команда на чолі з Шень Сян'яном не може зрозуміти пошук, не кажучи вже про штучний інтелект. А відхід Шень Сян’яна з Microsoft і «незалежність» Сяобінга в поєднанні з інвестиціями генерального директора Microsoft Наделли та співпраці з OpenAI фактично є найкращим трейдером штучного інтелекту в Китаї та Сполучених Штатах. Офіційне розставання шляхів у сфері загальних моделей штучного інтелекту.
Отже, чи пише Сяобін вірші сьогодні? що воно робить
За останні два роки Сяобін давно перестав писати вірші. Він зайнятий комерціалізацією. Вона створила ігрову студію, щоб надавати вміст діалогів, написаних NPC, для ігор; вона співпрацювала із Зимовими Олімпійськими іграми, щоб створити візуальну систему підрахунку балів для навичок фристайлу на лижах у повітрі; вона надала Wind Information створені штучним інтелектом текстові підсумки повідомлень про зареєстровані компанії;
Одним словом, у минулому команда штучного інтелекту, яка представляла вищий рівень загальної природної семантичної моделі штучного інтелекту, а китайці підтримували всю структуру, тепер стала постачальником штучного інтелекту, який поєднує генеративний штучний інтелект і штучний інтелект для прийняття рішень і надає конкретні рішення для конкретних сценаріїв.
Ви не можете сказати, що це «занепад» Xiaoice, зрештою, він залучив лише сотні мільйонів юанів з ринку капіталу. Відповідно до моделі навчання ChatGPT, гроші будуть витрачені за один день. Без захисту Microsoft Сяобін змушений подбати про своє життя. Однак я ніколи не чув про Baidu, Tencent або ByteDance. Я думав про інвестування в Xiaoice та його підтримку, щоб продовжити розробку великомасштабної моделі загального природного семантичного штучного інтелекту.
Не тільки Сяобін. За останні кілька років у Китаї також з’явилися інші підприємницькі команди, які займаються автоматичним моделюванням загального штучного інтелекту та гетерогенних обчислень, що дозволяє підключати до програмного забезпечення через цю модель 7-8 типів чіпів у країні та за кордоном. Китайські інвестиційні інститути ніколи не проявляли інтересу до загальних моделей штучного інтелекту і навіть трохи фантазії.
«Понад 85% інвесторів попросили нас представити сценарій продукту. Ми сказали, що ми допомагаємо графічному процесору зв’язатися з екосистемою програмного забезпечення, і навіть Nvidia використовує нашу модель. Інвестори сказали, що це не сценарій. Ми сказали, що у нас також є клієнти, дослідження супутників, доків, розумних міст і розумних галузей. Вони сказали, що ваша робота надто розпорошена, тому ми не будемо інвестувати». Це те, що я чув від підприємців, які розробляють загальні моделі штучного інтелекту.
Як ми всі знаємо, венчурні капіталісти в Китаї найбільше люблять «навчати» підприємців, і, звичайно, навчати науковців, які займаються підприємницькою діяльністю на основі штучного інтелекту. «Ви повинні мати деякі дані в цій галузі», це їхнє улюблене речення для навчання підприємців ШІ.
Є дані в певній галузі, і необхідно зосередитись на наданні рішень у певній сегментованій галузі. Це спосіб мислення більшості венчурних капітальних капіталів і інвестиційних компаній у Китаї, які стверджують, що інвестують у штучний інтелект. Потім ми дивимося на те, «наскільки велика сцена», сцена камери спостереження достатньо велика, тому модель оцінки стає розміром із Китай, скільки камер можна встановити? Скільки коштує кожна камера? Наскільки велика загальна пластина камери? Ну, тарілка досить велика, і ми проголосували в підрозділі камери. Давайте знову подивимося на інтелектуальну логістику портів. Скільки портів у Китаї? Скільки глибоководних портів? Скільки кожен портовий термінал може заплатити за рішення ШІ? Виявилося, що ми заплатили такі невеликі гроші, начебто сцена «порту» замала, тому голосувати не будемо. ШІ віртуальна цифрова людина як обслуговування клієнтів? Його можна пов’язати з метавсесвітом, у нього є історія та уява, що ж, ми можемо спробувати.
Отже, ви бачите, що китайські штучні інтелектуальні «чотири тигри» в основному займаються камерами та розпізнаванням облич, і всі вони стали розробниками та інтеграторами проектів ШІ. Бізнес-модель така ж, як у Neusoft та iSoftStone 30 років тому.
Протягом досить тривалого періоду часу небагато інвесторів у сфері штучного інтелекту щиро вірили, що загальну модель можна повторно використовувати в різних галузях. Час від часу є кілька терплячих і зацікавлених у загальній моделі, і вони, в основному, є фондами юанів.Фонд у доларах США насправді не зацікавлений у спробі китайської команди розробити загальну модель. Як ви думаєте, порівнюючи складність і рівень підготовки моделі таких компаній, як OpenAI і Google, вони відчувають, що між китайською командою в цьому питанні є розрив? Тоді ти справді забагато думаєш. Вони знають час, коли йде розробка моделі GPT, тобто останні два місяці.
Ті першорядні інвестиційні менеджери, які хвалилися, що «SenseTime і Megvii продають камери безпеки на моїх очах», ті перші інвестиційні партнери, які з гордістю казали підприємцям, що «ваша модель — це не сцена», не кажучи вже про тих партнерів інвестиційних фондів у доларах США, які майже не інвестували в штучний інтелект в історії та стільки років колупалися з китайськими підприємцями, щоб «поїхати за кордон», щоб займатися криптовалютою. , сьогодні раптово змінили вигляд і заявили, що підтримуватимуть підприємців у «China's ChatGPT». Тоді ви можете подумати про це, їхні клятви та самовдоволення містять певне розуміння та щирість загальної моделі штучного інтелекту, а деякі є спекуляціями та розрахунками.
Ви можете навіть подумати про це. Навчання суперприродної семантичної моделі може коштувати десятки мільйонів або навіть сотні мільйонів юанів на день, не кажучи вже про модуль обчислювальної потужності, який забезпечує навчання великої моделі - найкращий графічний процесор у світі, через необґрунтоване ембарго Сполучених Штатів. Його стає все важче отримати. З огляду на ставлення та стиль поведінки цих інвесторів за останні стільки років, вони можуть наполягати кілька днів, скільки грошей вони готові переконати інвестиційний комітет інвестувати, чи можуть вони допомогти цим підприємницьким командам вирішити проблему GPU? Можливо, колись, а може, через півроку вони почнуть спонукати ці загальні модельні команди якнайшвидше «здійснити комерціалізацію в розділених областях».
Оскільки Baidu наполягає на інвестуванні в модель PaddlePaddle, неминуче буде практикувати цю модельну галузь із самого початку та якомога швидше розпочне комерціалізацію в різних галузях. Значною мірою навчання великих моделей загального штучного інтелекту має «неможливий трикутник» масивних даних, високоякісного та креативного контенту та промислового застосування.
Для отримання масивних даних і високоякісного креативного контенту його не можна буде швидко застосувати до конкретної реалізації певної галузі, наприклад ChatGPT.
Якщо ви хочете створити конкретні сценарії промислової посадки в найбільшій масі даних, створених людьми в Інтернеті, ви точно не зможете забезпечити результати найвищої якості, тому що повинні існувати конфлікти між створенням контенту на основі масових даних і точними системами прийняття рішень – це насправді марна трата.
Якщо ви хочете досягти високоякісного вмісту, щоб допомогти точному прийняттю рішень у промислових сценаріях посадки, ви повинні пожертвувати найбільшим обсягом даних, а дані, що володіють найбільш точними промисловими сценаріями, не можуть підтримувати реальну масштабну модельну модель.
Ті підприємці та інвестори, які готуються сьогодні увійти в «China's ChatGPT», не кажучи вже про те, скільки грошей і графічних процесорів у вас у кишенях, оскільки ви всі на цьому човні, ви відчуваєте, що тримаєте квиток. Який кут «неможливого трикутника» загального штучного інтелекту ви вирішите відкинути? Це питання, яке потрібно з’ясувати спочатку.
Іншими словами, яка інвестиційна установа — будь то фінансова інвестиційна установа чи інвестиційний відділ великої компанії — має рішучість інвестувати в навчання великомасштабних природних семантичних моделей протягом кількох років і нескінченно продовжувати цикл повернення? Зрештою, історія говорить нам, що це група людей, яка найменш рішуча і найбільше прагне знайти наступника.
У Китаї ніколи не бракувало видатних підприємців і вчених, і сфера штучного інтелекту не є винятком. Рівень і накопичення китайських і американських технологічних компаній у сфері штучного інтелекту є найближчими у світі.Принаймні кілька років тому між Китаєм і Сполученими Штатами не було великого розриву в побудові та навчанні великих природних семантичних моделей. Проте в Китаї не вистачає інвестиційних інститутів та інвесторів, які мають ширше бачення, не дотримуються чужої думки, рішучі та далекоглядні.
Такі люди, як Шен Сян’ян, Лі Ді, Ма Вейін, Ван Сяочуань і Лі Чжіфей, які почали створювати широкомасштабні загальні природні семантичні моделі, є досить надійними, але проблема полягає в тому, що їм потрібно змінити групу інвестиційних установ та інвесторів, які їх підтримують. Деякі інвестиційні установи, які надто добре «грають в ігри» та спекулюють, а також занадто занурені в криптовалюти та інші треки, повинні бути занесені в чорний список.
Чесно кажучи, хоча жодна серйозна інвестиційна установа не розглядала загальні моделі штучного інтелекту стільки років, все ще є деякі установи, які інвестували в багато компаній штучного інтелекту з надзвичайно довгими циклами окупності. Наприклад, ті венчурні інвестори, які інвестували в місцевий лідар і рішення для автономного водіння в Китаї, зробили внесок у створення абсолютно нової конкурентоспроможності Китаю в безпрецедентних змінах глобальної автомобільної промисловості за століття. Наприклад, ті венчурні інвестиції, які інвестували в місцеві графічні процесори Китаю, — це шлях, повний небезпек, зіткнувшись із забороною та придушенням Сполучених Штатів, і цикл повернення надзвичайно довгий; але ці нещодавно з’явилися місцеві гравці на графічних процесорах — чи то Ханбо, Бірен чи інші, вони можуть стати боєприпасами для загальної природної моделі семантичної обробки Китаю в майбутньому. Інвестори, які стоять за ними, якщо одного дня вони дійсно вирішать і зроблять крок, щоб підтримати природний семантичний великомасштабний модельний проект Китаю, я можу мати дещо інші очікування та впевненість у них.
Просто інвесторів та інвестиційних інститутів, які не вихваляються, не стримуються та не квапляться до швидкого успіху, небагато, але надто мало, але для побудови та навчання природної семантичної моделі Китаю потрібні такі інвестори та інвестиційні інститути — будь то фінансовий інвестор, стратегічний інвестор чи капітальна установа, підтримана волею держави.
Китаю потрібна власна природна семантична широкомасштабна модель загального призначення. Він повинен мати бачення надання китайської мудрості, китайської системи цінностей і китайських рішень для глобального штучного інтелекту загального призначення. Йому потрібно уникати ризиків і правових, моральних і етичних проблем у всьому процесі відбору корпусу, побудови моделі та навчання, а також налаштування параметрів. Йому також потрібні рішучість і терпіння.
У будь-якому разі не можна спекулювати.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Хто стримує китайський ChatGPT?
ChatGPT став, безсумнівно, феноменальним продуктом у світовій індустрії інформаційних технологій.
В ім’я «загального штучного інтелекту» він спілкується з людьми, допомагає людям складати електронні листи та листи до юристів, відповідає на деякі езотеричні остаточні філософські запитання, пише придатний код Python, відповідає на деякі запитання, які, здається, вимагають складної та прогресивної логіки, пише сценарій фільму на основі деяких персонажів, пише гарний вірш про кохання, ловить дипломні роботи студентів коледжу... Здається, що є в історії людства не було такого універсального виду ШІ. Білл Гейтс сказав, що значення появи ChatGPT «не менше, ніж народження Інтернету». Генеральний директор Microsoft Сатья Наделла сказав, що це можна порівняти з промисловою революцією. Оральні ентузіасти штучного інтелекту знову вигукнули, що «сингулярність» наближається. Звичайні люди знову хвилюються, що їхню роботу замінять універсальні помічники ШІ, такі як ChatGPT... Від IBM «Deep Blue» від AlphaGo від Google, а потім від ChatGPT від OpenAI минуло 25 років. Розумова зрілість — це справді те, що робить ШІ щасливим.
Я використовував ChatGPT, щоб робити багато невимовних речей, і виявив, що це не завжди зручно, але може дати кращі відповіді та рішення для деяких, здавалося б, складніших проблем. Наприклад, якщо ви запитаєте, чи може BYD перемогти Tesla, він може дати деякі чіткі та непримітні заяви з багатьма фактичними помилками та без індивідуальності; але якщо ви запитаєте, як автономне водіння змінить промисловий дизайн автомобіля, це може дати дискусію, повну уяви зсередини назовні щодо інновацій шасі, змін інтер’єру, цифрових розваг та прориву зовнішнього вигляду. Загалом ChatGPT досить недосконалий, особливо з точки зору переконливої точності, але він часто дивує людей у таких сферах, як надання структурованого інформаційного дискурсу, розкриття уяви та звільнення творчості. Ви не можете сказати, яку конкретну користь він має для вас, але він може допомогти вам досягти та завершити деякі тривіальні, зайві та навіть творчі речі.
Саме такий, здавалося б, марний, але корисний ChatGPT, який здається корисним, але марним, змусив його материнську компанію OpenAI отримати додаткові інвестиції в розмірі понад 10 мільярдів доларів США від Microsoft. Знадобилося два дні, щоб пробитися через 1 мільйон користувачів, а Facebook знадобилося 305 днів; Великомасштабна нейронна мережа, що містить 175 мільярдів параметрів, коли вона має преференційну ліцензію Microsoft на інтеграцію офісного програмного забезпечення та служб пошукової системи, таких як Office і Bing , це дійсно стає «придатним» продуктом.
Але цього достатньо, щоб китайські штучні єдинороги позаздрили.
З 500 співробітниками загальна оцінка компанії наближається до 30 мільярдів доларів США. Це OpenAI; з тисячами людей оцінка/ринкова вартість компанії становить у кращому випадку 1-2 мільярди доларів США. Це низка «маленьких гігантів» ШІ в Китаї.
Через величезний розрив між ефективністю та цінністю людини, а також через раптовий вплив ChatGPT на реальне суспільство всіх людей, народження ChatGPT значно стимулювало сферу штучного інтелекту в Китаї. Багато людей знову вирвалися, відчуваючи, що розрив між Китаєм і Сполученими Штатами у сфері штучного інтелекту ще більше збільшився, і Китаю потрібно пройти довгий шлях, щоб наздогнати цю хвилю. Є також люди, які прагнуть обговорити, чому в Китаї немає власного ChatGPT, і висновок все одно полягає в тому, що «Китаю бракує ґрунту для інновацій» і «китайські інтернет-компанії займаються прямими трансляціями та купівлею продуктів», які водночас безвідповідальні та не знають фактів.
Китайські інтернет-компанії не всі займаються прямими трансляціями та покупками продуктів. Вони займаються розробкою напівпровідників, дослідженням моделей штучного інтелекту та автономним водінням.Американські інтернет-компанії також дуже популярні в прямих трансляціях, покупках продуктів і особливо в Інтернет-фінансах.
Як китайська інтернет-компанія з найбільшим накопиченням у сфері штучного інтелекту та природної семантичної обробки, Baidu протягом останніх п’яти років працювала над власною великою моделлю глибокого навчання «Paddle Paddle» (Paddle Paddle) і навіть використовувала власний чіп загального призначення «Kunlun Core» для навчання власної моделі – це базове середовище та передумова для Baidu для навчання власного «ChatGPT». Alibaba, ByteDance і Didi також мають природні семантичні моделі навчання, засновані на власних потребах. Можна сказати, що в плані навчання складних природних семантичних моделей з десятками мільярдів параметрів китайські компанії та науково-дослідні установи не слабкі, і їх стартова точка не нижче, ніж у американських колег — принаймні, приблизно в 2016 році. В останні роки розрив між китайськими та американськими колами штучного інтелекту в області великомасштабних моделей є не питанням обізнаності, відправної точки та здібностей, а питанням шляхів і методів.
Розрив між Китаєм і Сполученими Штатами в області ChatGPT-подібних моделей діалогу між людиною та комп’ютером не спричинений так званим регулюванням. Якщо ви відверто спілкувалися з ChatGPT щодо більш багатих релігійних, культурних, етнічних і геополітичних питань, ви зрозумієте, що за його, здавалося б, відмовою та розсудливим обговоренням цих питань існують певні специфічні позиційні тенденції, які тонко збігаються з основними цінностями, загальновизнаними в американському суспільстві. Можна сказати, що для будь-якої складної моделі природної семантики процес побудови моделі, збору корпусу, навчання та налаштування параметрів є процесом «перегляду змісту» на основі певної системи цінностей, і кожен має свідомість підтримувати свою систему цінностей. Питання не в тому, чи слід нам «генерувати» ціннісну позицію Китаю в природній семантичній моделі, а в тому, як її слід створити, щоб справді перевірити та збалансувати світогляд і культурну гегемонію, що англійська мова домінує в глобальному корпусі Інтернету, посилити вагу стандартів розуміння китайської мови в глобальній системі природної семантичної обробки та забезпечити культурне розмаїття для розвитку штучного інтелекту та діалогу між людиною та комп’ютером у світі.
Я також серйозно не згоден із твердженням про те, що якість китайської Інтернет-інформації надто погана, оскільки джерело корпусу китайської моделі ChatGPT «забруднене». Це також ліниве та розумне судження. Через загальну кількість інформації в Інтернеті англійський вміст, безсумнівно, є найбільшим у світі, а екстремальний вміст тривожної якості також найбільше, і все це вплине на процес і результати навчання природної семантичної моделі. На ранньому тренінгу ChatGPT надавав пріоритет високо оціненому контенту на соціальному форумі Reddit із високою якістю контенту, який має особливу тенденцію відбору корпусу. Якщо Китай надаватиме пріоритет таким спільнотам знань, як Zhihu та Dede, а основні засоби масової інформації віддадуть пріоритет корпусу семантичних моделей, проблеми забруднення корпусу не буде. Не кажучи вже про володіння іноземною мовою та навички читання більшості людей, які вважають, що «якість китайського контенту низька» недостатньо для підтвердження своїх висновків.
Але в будь-якому випадку, народження ChatGPT справді є свого роду стимулом і концептуальним викликом для мене, який уже багато років закликає «прощатися з поклонінням Кремнієвій долині».
Це не тому, що я вважаю, що розрив між Китаєм і Сполученими Штатами у сфері штучного інтелекту збільшився, а тому, що загальна модель діалогу між людиною та комп’ютером на основі штучного інтелекту, така як ChatGPT, є інструментом, який справді може сприяти співпраці у суспільному виробництві та цивілізації з точки зору всіх людей, а не окремої сфери чи галузі. Його значення є більшим, ніж поява мобільного Інтернету, яке можна порівняти з народженням електронної пошти та пошукових систем. Як потужний центр штучного інтелекту, Китай більше не є країною з поганою індустрією інформаційних технологій, коли народжувалися електронні листи та пошукові системи.Однак ми не дозволили подібним загальним інноваціям штучного інтелекту, які можуть вплинути на розвиток людської цивілізації, вперше з’явитися в Китаї, і підготували модель, основний корпус якої побудований на основі китайської культури та системи цінностей.
Більше того, метод навчання моделі ChatGPT значною мірою покладається на оновлення параметрів «посилення чудес», повторне навчання та безперервну ітераційну оптимізацію моделі на основі зворотного зв’язку згенерованого вмісту — спочатку це був робочий метод, у якому китайська команда була найкращою. Коли американська нова компанія використовує гроші, зібрані від Microsoft, щоб інвестувати величезні витрати на обчислювальну потужність за будь-яку ціну, наймає велику кількість працівників обробки даних в Африці та на Близькому Сході для маркування інформації та використовує найефективніші ітерації для проведення власно розробленої семантичної обробки великомасштабної моделі «гонки озброєнь» з такими гігантами, як Google, у вас все одно виникає дуже нереальне відчуття — чи це компанія з Сан-Франциско, чи з Шеньчженя.
Природна модель семантичної обробки, така як ChatGPT, мала народитися в Китаї, але вона народилася не в Китаї. Причина полягає в тому, що китайські технологічні компанії займаються штучним інтелектом, незалежно від того, чим займаються гіганти чи стартапи в ці роки.
Проблема, яку багато людей, можливо, ніколи не усвідомлять, полягає в тому, що супервеликомасштабна природна модель семантичної обробки загального призначення, така як ChatGPT, швидше за все, створить чудеса, якщо її створить компанія-стартап ШІ, а кращих результатів зазвичай не досягають у технологічному гіганті. Ось чому модель діалогового додатка Google LaMDA та Bard, який нещодавно кинувся у бій, не сяяли, і це також виклик, з яким Baidu неминуче зіткнеться.
чому Перше тому, що загальне моделювання природної семантичної обробки занадто дороге. Насправді спалювання грошей зазвичай не є вмінням великих компаній, а привілеєм стартапів. Майже всі технічні гіганти — це компанії, зареєстровані на біржі. Інвестиції в десятки мільярдів доларів інвестуються в те, що довго не повертатиметься. Тиск на головного фінансового директора з боку ради директорів і зборів акціонерів дуже високий, і вони часто караються ціною акцій. Це змушує великі компанії не наважуватися на великі ризики. Без великих ризиків не буде великих ітерацій. Що таке «Енергійне творіння чудес»? Це означає спочатку витратити багато грошей і докласти великих зусиль, а потім молитися, щоб сталися чудеса, замість того, щоб мовчазно погоджуватися з тим, що диво має статися, а потім вирішити витратити гроші і докласти великих зусиль.
На жаль, великі компанії можуть бути лише останніми. Ось чому навіть Microsoft, яка отримала велику вигоду від ChatGPT, наважилася почати лише з 1 мільярда доларів на початку, який тривав чотири роки, до цьогорічних 10 мільярдів доларів, і продовжувала збільшувати інвестиції одну за одною для підтримки OpenAI у Microsoft «in vitro», тренуючи модель GPT протягом багатьох років. Акціонерний капітал, отриманий Microsoft шляхом інвестування в OpenAI, користується пріоритетом інтеграції здатності моделі ChatGPT до свого Office і пошукових систем.Можливо, непросто сказати, чи з’їсть він OpenAI у майбутньому, але принаймні Microsoft, ринкова вартість якої становить майже один трильйон доларів США та річний дохід у десятки мільярдів доларів США, абсолютно не наважується спочатку «робити чудеса» та тренувати це модель сама по собі.
По-друге, тому що люди менш терпимі до технологічних гігантів, які займаються інноваціями, і більш терпимі до помилок і відхилень у стартапах. Щоб впоратися з тиском ChatGPT, Google поспішно запустив тестову версію діалогу між людиною та комп’ютером Bard. Було виявлено, що деякі діалоги містять основні фактичні помилки, тому їх нескінченно збільшували, а ринкова вартість випарувалася за одну ніч на сотні мільярдів доларів. Справа не в тому, що Google цього не знає. Якби його не поспішали, це було б не так поспішно. Модель LaMDA, анонсована Google у 2021 році, має значно вищі рівні параметрів і можливості пошуку інформації, ніж GPT-3, навчений OpenAI на той час, але Google не бажає публічно тестувати її ефект, оскільки побоюється, що вона припуститься помилок, що спричинить недовіру громадськості та падіння цін на акції.
Те, що дбає Google, не хвилює OpenAI. З першого дня випуску ChatGPT публічно заявлялося, що він не має можливостей пошуку інформації, а його корпус діє лише до грудня 2021 року. Він не може відповісти на багато питань щодо ціннісних і моральних суджень і часто допускає фактичні помилки. Тестувальники толерантно сприйняли «погану роботу» ChatGPT і були вражені його здатністю асоціювати інформацію, емоційно виражати, логічній структурі та узгодженості мислення в сферах програмування, літературної творчості, форматованого письма та медичних консультацій, і легковажно ігнорували зроблені помилки.
У березні 2019 року, після безпрецедентного успіху моделі GPT-2, чотирирічна OpenAI вирішила перетворитися з некомерційної організації на комерційну компанію. Адже жоден фонд не витримає річну зарплату свого головного вченого в $1,5 млн. У травні 2019 року Сем Альтман (Sam Altman) став генеральним директором OpenAI. Тоді OpenAI отримав 1 мільярд доларів інвестицій від Microsoft. У травні 2020 року модель GPT-3, запущена OpenAI, має параметри, які різко зросли з 1,5 мільярда в GPT-2 до 175 мільярдів, утворюючи безпрецедентно потужну систему автоматичного навчання.
Можна побачити, що стартап-компанія зі штучного інтелекту, яка народилася із золотою ложкою в роті, зібрала величезну суму грошей і має гігантський бізнес, займається створенням і розробкою природних семантичних моделей штучного інтелекту загального призначення та інвестує в навчання моделей незалежно від вартості, що є найбільш ідеальним станом. Творчі та комерційні прибутки, які приносять найпотужніші моделі, достатні, щоб підштовхнути Microsoft та інших інвесторів.
Отже, чому ця логіка не працює в Китаї? Чи була в Китаї колись потужна природна семантична модель штучного інтелекту загального призначення, навіть якщо це був лише прототип?
Щоб відповісти на це запитання, подивіться, коли Microsoft вперше інвестувала в OpenAI: липень 2019 року. Через чотири місяці після того, як Microsoft зробила ставку на модель GPT OpenAI, тобто в листопаді 2019 року, Шен Сян'ян, глобальний старший віце-президент Microsoft, який відповідає за пошуковий бізнес Bing і головна особа, відповідальна за штучний інтелект Microsoft, і комп'ютерний вчений з Гонконгу, Китай, оголосив, що залишив Microsoft на більш ніж 20 років. І останнім внеском Шень Сян’ян у загальну модель штучного інтелекту Microsoft є чат-робот Xiaobing, розроблений Microsoft Asia Internet Engineering Institute у 2014 році.
У липні 2020 року Xiaoice стала незалежною від Microsoft і стала китайською стартап-компанією зі штучного інтелекту. Шень Сяньян обіймав посаду голови правління, а Лі Ді, колишній виконавчий віце-президент Microsoft Asia Internet Engineering Academy, обіймав посаду генерального директора. Коли Xiaoice став незалежним, він розвинувся до більш ніж шостого покоління. Його форми продуктів включали розмовних роботів зі штучним інтелектом, інтелектуальних голосових помічників, контент-провайдерів, створених штучним інтелектом, і ряд рішень для вертикального поля. Одного разу Xiaoice викликала громадське обговорення, окрім того, що вона була сповненим емоцій і жіночої сексуальності чат-роботом, вона також має дивовижну продуктивність у сфері створення китайської поезії – вона опублікувала збірку віршів «Sunshine Lost the Glass Window», яка отримала багато похвал і більше суперечок.
Немає сумніву, що кілька років тому робот XiaoIce, який може писати вірші та вести прості емоційні та здорові розмови, був найефективнішою загальною моделлю штучного інтелекту для розмов у світі.
Команда на чолі з Шень Сян'яном не може зрозуміти пошук, не кажучи вже про штучний інтелект. А відхід Шень Сян’яна з Microsoft і «незалежність» Сяобінга в поєднанні з інвестиціями генерального директора Microsoft Наделли та співпраці з OpenAI фактично є найкращим трейдером штучного інтелекту в Китаї та Сполучених Штатах. Офіційне розставання шляхів у сфері загальних моделей штучного інтелекту.
Отже, чи пише Сяобін вірші сьогодні? що воно робить
За останні два роки Сяобін давно перестав писати вірші. Він зайнятий комерціалізацією. Вона створила ігрову студію, щоб надавати вміст діалогів, написаних NPC, для ігор; вона співпрацювала із Зимовими Олімпійськими іграми, щоб створити візуальну систему підрахунку балів для навичок фристайлу на лижах у повітрі; вона надала Wind Information створені штучним інтелектом текстові підсумки повідомлень про зареєстровані компанії;
Одним словом, у минулому команда штучного інтелекту, яка представляла вищий рівень загальної природної семантичної моделі штучного інтелекту, а китайці підтримували всю структуру, тепер стала постачальником штучного інтелекту, який поєднує генеративний штучний інтелект і штучний інтелект для прийняття рішень і надає конкретні рішення для конкретних сценаріїв.
Ви не можете сказати, що це «занепад» Xiaoice, зрештою, він залучив лише сотні мільйонів юанів з ринку капіталу. Відповідно до моделі навчання ChatGPT, гроші будуть витрачені за один день. Без захисту Microsoft Сяобін змушений подбати про своє життя. Однак я ніколи не чув про Baidu, Tencent або ByteDance. Я думав про інвестування в Xiaoice та його підтримку, щоб продовжити розробку великомасштабної моделі загального природного семантичного штучного інтелекту.
Не тільки Сяобін. За останні кілька років у Китаї також з’явилися інші підприємницькі команди, які займаються автоматичним моделюванням загального штучного інтелекту та гетерогенних обчислень, що дозволяє підключати до програмного забезпечення через цю модель 7-8 типів чіпів у країні та за кордоном. Китайські інвестиційні інститути ніколи не проявляли інтересу до загальних моделей штучного інтелекту і навіть трохи фантазії.
«Понад 85% інвесторів попросили нас представити сценарій продукту. Ми сказали, що ми допомагаємо графічному процесору зв’язатися з екосистемою програмного забезпечення, і навіть Nvidia використовує нашу модель. Інвестори сказали, що це не сценарій. Ми сказали, що у нас також є клієнти, дослідження супутників, доків, розумних міст і розумних галузей. Вони сказали, що ваша робота надто розпорошена, тому ми не будемо інвестувати». Це те, що я чув від підприємців, які розробляють загальні моделі штучного інтелекту.
Як ми всі знаємо, венчурні капіталісти в Китаї найбільше люблять «навчати» підприємців, і, звичайно, навчати науковців, які займаються підприємницькою діяльністю на основі штучного інтелекту. «Ви повинні мати деякі дані в цій галузі», це їхнє улюблене речення для навчання підприємців ШІ.
Є дані в певній галузі, і необхідно зосередитись на наданні рішень у певній сегментованій галузі. Це спосіб мислення більшості венчурних капітальних капіталів і інвестиційних компаній у Китаї, які стверджують, що інвестують у штучний інтелект. Потім ми дивимося на те, «наскільки велика сцена», сцена камери спостереження достатньо велика, тому модель оцінки стає розміром із Китай, скільки камер можна встановити? Скільки коштує кожна камера? Наскільки велика загальна пластина камери? Ну, тарілка досить велика, і ми проголосували в підрозділі камери. Давайте знову подивимося на інтелектуальну логістику портів. Скільки портів у Китаї? Скільки глибоководних портів? Скільки кожен портовий термінал може заплатити за рішення ШІ? Виявилося, що ми заплатили такі невеликі гроші, начебто сцена «порту» замала, тому голосувати не будемо. ШІ віртуальна цифрова людина як обслуговування клієнтів? Його можна пов’язати з метавсесвітом, у нього є історія та уява, що ж, ми можемо спробувати.
Отже, ви бачите, що китайські штучні інтелектуальні «чотири тигри» в основному займаються камерами та розпізнаванням облич, і всі вони стали розробниками та інтеграторами проектів ШІ. Бізнес-модель така ж, як у Neusoft та iSoftStone 30 років тому.
Протягом досить тривалого періоду часу небагато інвесторів у сфері штучного інтелекту щиро вірили, що загальну модель можна повторно використовувати в різних галузях. Час від часу є кілька терплячих і зацікавлених у загальній моделі, і вони, в основному, є фондами юанів.Фонд у доларах США насправді не зацікавлений у спробі китайської команди розробити загальну модель. Як ви думаєте, порівнюючи складність і рівень підготовки моделі таких компаній, як OpenAI і Google, вони відчувають, що між китайською командою в цьому питанні є розрив? Тоді ти справді забагато думаєш. Вони знають час, коли йде розробка моделі GPT, тобто останні два місяці.
Ті першорядні інвестиційні менеджери, які хвалилися, що «SenseTime і Megvii продають камери безпеки на моїх очах», ті перші інвестиційні партнери, які з гордістю казали підприємцям, що «ваша модель — це не сцена», не кажучи вже про тих партнерів інвестиційних фондів у доларах США, які майже не інвестували в штучний інтелект в історії та стільки років колупалися з китайськими підприємцями, щоб «поїхати за кордон», щоб займатися криптовалютою. , сьогодні раптово змінили вигляд і заявили, що підтримуватимуть підприємців у «China's ChatGPT». Тоді ви можете подумати про це, їхні клятви та самовдоволення містять певне розуміння та щирість загальної моделі штучного інтелекту, а деякі є спекуляціями та розрахунками.
Ви можете навіть подумати про це. Навчання суперприродної семантичної моделі може коштувати десятки мільйонів або навіть сотні мільйонів юанів на день, не кажучи вже про модуль обчислювальної потужності, який забезпечує навчання великої моделі - найкращий графічний процесор у світі, через необґрунтоване ембарго Сполучених Штатів. Його стає все важче отримати. З огляду на ставлення та стиль поведінки цих інвесторів за останні стільки років, вони можуть наполягати кілька днів, скільки грошей вони готові переконати інвестиційний комітет інвестувати, чи можуть вони допомогти цим підприємницьким командам вирішити проблему GPU? Можливо, колись, а може, через півроку вони почнуть спонукати ці загальні модельні команди якнайшвидше «здійснити комерціалізацію в розділених областях».
Оскільки Baidu наполягає на інвестуванні в модель PaddlePaddle, неминуче буде практикувати цю модельну галузь із самого початку та якомога швидше розпочне комерціалізацію в різних галузях. Значною мірою навчання великих моделей загального штучного інтелекту має «неможливий трикутник» масивних даних, високоякісного та креативного контенту та промислового застосування.
Для отримання масивних даних і високоякісного креативного контенту його не можна буде швидко застосувати до конкретної реалізації певної галузі, наприклад ChatGPT.
Якщо ви хочете створити конкретні сценарії промислової посадки в найбільшій масі даних, створених людьми в Інтернеті, ви точно не зможете забезпечити результати найвищої якості, тому що повинні існувати конфлікти між створенням контенту на основі масових даних і точними системами прийняття рішень – це насправді марна трата.
Якщо ви хочете досягти високоякісного вмісту, щоб допомогти точному прийняттю рішень у промислових сценаріях посадки, ви повинні пожертвувати найбільшим обсягом даних, а дані, що володіють найбільш точними промисловими сценаріями, не можуть підтримувати реальну масштабну модельну модель.
Ті підприємці та інвестори, які готуються сьогодні увійти в «China's ChatGPT», не кажучи вже про те, скільки грошей і графічних процесорів у вас у кишенях, оскільки ви всі на цьому човні, ви відчуваєте, що тримаєте квиток. Який кут «неможливого трикутника» загального штучного інтелекту ви вирішите відкинути? Це питання, яке потрібно з’ясувати спочатку.
Іншими словами, яка інвестиційна установа — будь то фінансова інвестиційна установа чи інвестиційний відділ великої компанії — має рішучість інвестувати в навчання великомасштабних природних семантичних моделей протягом кількох років і нескінченно продовжувати цикл повернення? Зрештою, історія говорить нам, що це група людей, яка найменш рішуча і найбільше прагне знайти наступника.
У Китаї ніколи не бракувало видатних підприємців і вчених, і сфера штучного інтелекту не є винятком. Рівень і накопичення китайських і американських технологічних компаній у сфері штучного інтелекту є найближчими у світі.Принаймні кілька років тому між Китаєм і Сполученими Штатами не було великого розриву в побудові та навчанні великих природних семантичних моделей. Проте в Китаї не вистачає інвестиційних інститутів та інвесторів, які мають ширше бачення, не дотримуються чужої думки, рішучі та далекоглядні.
Такі люди, як Шен Сян’ян, Лі Ді, Ма Вейін, Ван Сяочуань і Лі Чжіфей, які почали створювати широкомасштабні загальні природні семантичні моделі, є досить надійними, але проблема полягає в тому, що їм потрібно змінити групу інвестиційних установ та інвесторів, які їх підтримують. Деякі інвестиційні установи, які надто добре «грають в ігри» та спекулюють, а також занадто занурені в криптовалюти та інші треки, повинні бути занесені в чорний список.
Чесно кажучи, хоча жодна серйозна інвестиційна установа не розглядала загальні моделі штучного інтелекту стільки років, все ще є деякі установи, які інвестували в багато компаній штучного інтелекту з надзвичайно довгими циклами окупності. Наприклад, ті венчурні інвестори, які інвестували в місцевий лідар і рішення для автономного водіння в Китаї, зробили внесок у створення абсолютно нової конкурентоспроможності Китаю в безпрецедентних змінах глобальної автомобільної промисловості за століття. Наприклад, ті венчурні інвестиції, які інвестували в місцеві графічні процесори Китаю, — це шлях, повний небезпек, зіткнувшись із забороною та придушенням Сполучених Штатів, і цикл повернення надзвичайно довгий; але ці нещодавно з’явилися місцеві гравці на графічних процесорах — чи то Ханбо, Бірен чи інші, вони можуть стати боєприпасами для загальної природної моделі семантичної обробки Китаю в майбутньому. Інвестори, які стоять за ними, якщо одного дня вони дійсно вирішать і зроблять крок, щоб підтримати природний семантичний великомасштабний модельний проект Китаю, я можу мати дещо інші очікування та впевненість у них.
Просто інвесторів та інвестиційних інститутів, які не вихваляються, не стримуються та не квапляться до швидкого успіху, небагато, але надто мало, але для побудови та навчання природної семантичної моделі Китаю потрібні такі інвестори та інвестиційні інститути — будь то фінансовий інвестор, стратегічний інвестор чи капітальна установа, підтримана волею держави.
Китаю потрібна власна природна семантична широкомасштабна модель загального призначення. Він повинен мати бачення надання китайської мудрості, китайської системи цінностей і китайських рішень для глобального штучного інтелекту загального призначення. Йому потрібно уникати ризиків і правових, моральних і етичних проблем у всьому процесі відбору корпусу, побудови моделі та навчання, а також налаштування параметрів. Йому також потрібні рішучість і терпіння.
У будь-якому разі не можна спекулювати.