Усі говорять про велику модель, яка є справжнім зображенням світу технологій у першій половині цього року.
Судячи з хвилювання ринку, великомасштабні моделі стали треком для різних виробників техніки. Чи то інтернет-гіганти, технологічні компанії чи навіть дослідницькі установи, усі вони приєдналися до цієї великомасштабної модельної сутички. -масштабні моделі стали «Полем битви».
Саме тоді, коли внутрішній ринок великомасштабних моделей у розпалі, ChatGPT, який одним махом призвів до популярності великомасштабних моделей, зазнав зниження відвідувань. Згідно з останніми даними SimilarWeb, стороннього моніторингового агентства, у травні цього року ChatGPT почав демонструвати уповільнення зростання, при цьому темпи зростання становили лише 2,8% у цьому місяці, тоді як за перші чотири місяці 2023 року він становив 131,6%. %, 62,5 %, 55,8 %, 12,6 %. Це перший раз, коли ChatGPT зазнав негативного зростання трафіку з моменту його випуску 30 листопада 2022 року.
Це явище може відображати важливу галузеву тенденцію. Усі сторони змінюють початковий технічний ентузіазм щодо великих моделей до спокійних думок про комерціалізацію. І посадка великомасштабних моделей також є темою, яку всі компанії, що займаються великими моделями, повинні серйозно розглянути.
** «JD.com вважає, що цінність великої моделі = алгоритм × обчислювальна потужність × дані × квадрат промислової товщини», — сказав Сюй Ран, генеральний директор JD.com. JD.com не тільки переслідує розвиток технологій, але також приділяє особливу увагу товщині галузі - він оцінює, скільки промислових сценаріїв технологія може бути практично застосована та може створити різні цінності для суспільства. **
13 липня JD.com представив велику модель Yanxi. За даними JD.com, це модель нового покоління з параметрами, що сягають сотень мільярдів доларів, і вона буде активно використовуватися в роздрібній торгівлі, фінансах, логістиці, охороні здоров’я, промисловості та інших промислових сценаріях у майбутньому.
Коли промислова ефективність і розширення промислових кордонів якісно покращуються, велика модель матиме більшу практичну цінність і значення. У суєті великогабаритних моделей варто повернутися до раціональності та серйозно замислитися над справжньою цінністю великих моделей. Яка велика модель потрібна галузі? Як використовувати велику модель для комерційного використання, щоб зменшити витрати та підвищити ефективність галузі?
Змагання за велику модель: консенсус від загального до галузевого
За одну ніч одна за одною «спливли» вітчизняні масштабні моделі.
Відповідно до «Звіту про дослідження великомасштабної моделі штучного інтелекту Китаю», опублікованого Китайським інститутом науково-технічної інформації при Міністерстві науки і технологій, станом на 28 травня щонайменше 79 основних великомасштабних моделей із масштабом було опубліковано понад 1 мільярд параметрів у Китаї. Кількість великих моделей, розроблених у моїй країні, посідає друге місце у світі.
Однак, незважаючи на стрімку кількість досліджень і розробок, варто дослідити, як реалізувати комерційну цінність великих моделей.
Наразі з’являються великі моделі загального призначення. Цей тип великомасштабної моделі має потужні можливості розуміння природної мови, генерації мови та розпізнавання мовлення, а також добре працює в сценаріях із сильними загальними атрибутами, такими як спілкування в чаті та розваги. , ці сценарії все ще важко досягти широкомасштабної комерціалізації.
У поділених галузевих сценаріях точність відповіді загальної великої моделі є низькою. Це пояснюється тим, що сама галузь має малий розмір вибірки, нерівномірний розподіл даних і мінливі сценарії застосування, через що велика модель не може самостійно оптимізуватись і вдосконалюватися. Точність, природно, не висока.
З точки зору комерціалізації, підприємствам може не знадобитися «універсальна» великомасштабна модель загального призначення, а більше потрібна промислова великомасштабна модель, яка орієнтована на сценарії з розділеними полями та вирішує практичні проблеми.
Ву Хецюань, академік Китайської інженерної академії, якось зазначив, що «великі моделі, схожі на чат, викликали новий виток підйому, але діалог, написання віршів і малювання — це далеко не всі великі моделі. Нам потрібно глибоко продумайте напрямок застосування великих моделей, і ми повинні фактично впроваджувати великі моделі в галузі міського розвитку, фінансових технологій, біомедицини, промислового виробництва та наукових досліджень, професійні підприємства та організації також необхідні для прискорення їх впровадження в справжньої промисловості, приносячи реальну цінність нагальним потребам галузі та справді служачи суспільству у великих масштабах».
Зараз на ринку великомасштабних моделей формується консенсус, що великомасштабні моделі, які не можна використовувати в комерційних цілях, є лише «інструментами розваги», а лише великомасштабні моделі, які глибоко входять у галузь і вирішують практичні завдання. значення. Глибоко розмірковуючи про цінність великих моделей, формула, запропонована JD.com, більше відповідає тенденціям ринку великих моделей, а саме: вартість великих моделей = алгоритм × обчислювальна потужність × дані × квадрат товщини галузі.
** З формули значення великої моделі ми бачимо, що велика промислова модель і загальна велика модель не протистоять. Велика промислова модель базується на загальній великій моделі та навчається. Зміст більш узгоджується з потребами промислових вертикальних сценаріїв і більш цілеспрямованими. **
З огляду на шлях еволюції великої моделі, не дивно, що JD.com дивиться у майбутнє. З моменту свого заснування Jingdong вкорінився в індустрії та, природно, приділяє більше уваги цінності великих моделей у галузі.
«Jingdong приділяє увагу великим моделям та іншим технологічним інноваціям. Окрім просування технологій, він також приділяє особливу увагу товщині галузі — скількох промислових сценаріїв технологія може бути практично застосована для справжнього створення цінності для суспільства». сказав Сюй Ран, генеральний директор Jingdong.
**Насправді розробка великих моделей на даному етапі рухається від «універсальних» до «індустріальних». **
В останньому дослідницькому звіті, опублікованому Minsheng Securities, зазначено, що після інтенсивного періоду випуску великих моделей з лютого по березень, періоду розробки продукту з квітня по травень і напрям політики були поступово уточнені, продукти та програми великих моделей почнуться в червні Очікується, що це стане початком централізованого випуску. Нова хвиля випусків базується на широкомасштабних моделях прикладних продуктів, і масштабні оновлення почали виходити в Інтернет, готуючи вихід у тисячі домогосподарств.
Останнім часом більшість останніх великомасштабних моделей, випущених вітчизняними технологічними компаніями, орієнтовані на вертикальні галузі. За кордоном різні компанії послідовно випускають великомасштабні промислові моделі різних масштабів з метою застосування їх у промисловій сфері.
Виходячи з реальних тенденцій основних виробників у країні та за кордоном, не важко зрозуміти, що промислова модель зможе більше допомогти промисловим партнерам завершити цифрову трансформацію, зменшити витрати та підвищити ефективність, а також створити більшу цінність для галузі та суспільства. .
Велика промислова модель, важко закласти міцний фундамент для галузі
Складність побудови промислових великомасштабних моделей набагато вище, ніж у великомасштабних моделей загального призначення.
Якщо загальна великомасштабна модель перевіряє обчислювальну потужність і накопичення алгоритмів підприємства, то промислова великомасштабна модель перевіряє доступ підприємства до бізнес-сценаріїв і їх розуміння, а також накопичення та застосування промислових даних.
Індустріальний консенсус полягає в тому, що під час навчання промислових великих моделей найважче отримати промислові дані. Промислові дані часто знаходяться в руках підприємств. Через безпеку даних та інші міркування небагато підприємств готові розкривати приватні дані. Однак ці промислові дані часто прямо чи опосередковано впливають на швидкість технічної ітерації, точність моделі та бізнес-професіоналізм промислової великої моделі.
«Промислові дані також поділяються на статичні та динамічні. Статичні дані відносно стабільні, не змінюються миттєво, а шлях отримання відносно чіткий. Динамічні дані — це дані, що генеруються щомиті в різних промислових сценаріях. Ця частина даних "Живі" сценічні дані. Отримати їх нелегко, але це один із необхідних елементів промислової моделі", - підкреслив Хе Сяодун, президент дослідницького інституту JD і президент відділу інтелектуальних послуг і продуктів JD Technology.
Однак під час навчання промислових великих моделей не можна використовувати лише промислові дані, але все ще потрібно використовувати велику кількість загальних даних, щоб надати знання здорового глузду. Причини такі: по-перше, узагальнення промислових даних є недостатнім, і велика модель потребує перенавчання кожного разу, коли змінюється сцена, що дорого коштує; Застрягання в стані зависання.
Хе Сяодун порівняв навчання великої промислової моделі з навчанням людини: «Якщо людина йде працювати відразу після закінчення середньої школи, це здається нормальним, але професіоналізм буде менш професійним. Якщо ви зможете закінчити чотирирічну школу ступінь бакалавра, перш ніж приступити до роботи, у вас є як загальні знання, так і достатні професійні знання — це можливості, якими повинна володіти велика промислова модель».
З цієї причини дані великої моделі JD Yanxi складаються з 70% загальних даних і 30% необроблених даних про зростання ланцюга постачання.
Варто зазначити, що ці промислові дані надходять із самого JD.com. JD.com сама по собі є компанією, яка базується на ланцюжку поставок. Вона працює в багатьох галузях. Вона не лише має практичні дані в роздрібній торгівлі, логістиці, фінансах, охороні здоров’я, промисловості та інших галузях, але також має дані про міста, державні справи, фінанси, виробництво, промисловість, авіація, транспорт тощо. Десенсибілізовані дані таких галузей, як індустріальні парки, промислові парки та енергетика, а також високоякісні дані, що генеруються щороку, досягають 10 мільярдів одиниць.
На додаток до безперервної подачі високоякісних промислових даних, промислова велика модель також повинна розуміти галузеве ноу-хау, тобто мати унікальні знання про галузь і мати вищі вимоги до розуміння. Наприклад, галузь роздрібної торгівлі приділяє більше уваги ефекту маркетингу та рекомендацій, а фінансова індустрія приділяє більше уваги ефекту контролю ризиків, надійності та безпеки.
Для цього попиту ключову роль відіграв довгостроковий ланцюжок поставок цифрового інтелекту JD.com, і він став центром зусиль JD.com у застосуванні великих моделей. Велика модель також може базуватися на цифровому інтелекті ланцюга поставок і проникати глибоко в фізичну галузь.
Повідомляється, що ланцюжок поставок цифрового інтелекту JD.com охоплює понад 10 мільйонів артикулів продуктів JD.com, які самостійно керують, обслуговуючи понад 8 мільйонів активних корпоративних клієнтів, у тому числі понад 90% із 500 провідних компаній світу в Китаї та майже 70% спеціалізованих спеціальних нових МСП країни. У той же час ланцюжок поставок цифрового інтелекту JD.com все ще знаходиться в країні та має поглиблену співпрацю з більш ніж 2000 промисловими стрічками.
Такий ланцюжок поставок цифрового інтелекту з довшими зв’язками, складнішими сценаріями та багатшими даними є чудовим «полігоном» для великих моделей. На думку Дж. Д. Клауда, цінність великої моделі можна усвідомити лише шляхом глибокого розуміння ланцюжка поставок і дозволу великій моделі «працювати» в ланцюзі поставок.
На додаток до накопичення на промисловій стороні, не можна недооцінювати силу JD.com у базових алгоритмах і обчислювальній потужності.
У 2021 році дослідницький інститут JD Discovery запустив перший у країні надвеликий обчислювальний кластер на основі архітектури DGX SuperPOD у Chongqing-Tianqin α, який збільшив швидкість міркувань у 6,2 рази та знизив вартість міркувань на 90%. Це надає JD.com базову гарантію для масштабного навчання моделей.
У тому ж році JD.com запустив модель K-PLUG із мільярдним рівнем. Копія продукту, створена K-PLUG, охопила понад 3000 категорій на JD.com, створивши загалом 3 мільярди слів, а перевірка вручну проходила показник перевищує 95%. До 2022 року велика модель JD.com буде оновлена до десятків мільярдів моделей Vega, які можна буде широко використовувати в різноманітних завданнях обробки природної мови, таких як аналіз настроїв, семантична відповідність, виправлення граматичних помилок, інтелектуальні відповіді на запитання та здоровий глузд. міркування.
Завдяки попередньому накопиченню цього року JD.com зробив ще один технологічний прорив і запустив нове покоління великомасштабної моделі JD.com із сотнями мільярдів параметрів, зосереджених на кількох основних завданнях, таких як створення контенту, діалог між людиною та машиною, розуміння намірів користувача, вилучення інформації та класифікація емоцій. , реалізував точне налаштування базової моделі + моделі вертикальної області та застосував глибокі вертикальні сценарії, такі як роздрібна торгівля, логістика, фінанси, охорона здоров’я та державні справи.
Зараз велика промислова модель, яку представляє JD.com, навчає велику модель за допомогою накопичених індустріалізованих і сценарних даних і знань, а також коригує велику модель на основі накопичених галузевих ноу-хау, щоб покращити продуктивність великих моделей. у конкретних галузях і сценаріях застосування, а також для покращення керованості. Це еквівалентно завершенню «загальної освіти» для ШІ.
** Велика модель Jingdong поступово заглиблюється в різні галузі, щоб покращити рівень інтелекту в ланцюжку постачання. І навпаки, модернізація цифрового інтелекту в ланцюжку постачання також сприяє промисловій трансформації, яка, у свою чергу, забезпечує багатший ґрунт даних для великих моделей, утворюючи позитивний цикл. **
«Розрізання великомасштабної моделі з промислової сторони схоже на сходження на технічну гору Еверест з північного схилу: хоча дорога складніша, краєвиди більш чудові. Jingdong наполягає на тому, щоб робити «важкі, але правильні речі», наполягаючи на робити практичні, цінні та це довгострокова справа. У технічній сфері та у великих моделях це наше постійне зобов’язання», – сказав Сюй Ран.
** «Важкі і правильні речі» потребують тривалого накопичення. Однак, з точки зору побудови промислової моделі, JD.com явно заклав основу. **
Jingdong, народжений у галузі, створює промислову цінність за допомогою великих моделей
«В епоху великої моделі все варто робити знову з великою моделлю».
Під хвилею великих моделей індустрія швидко досягла зазначеного вище консенсусу. Однак у той час як інші великі виробники шукають бізнес-моделі за допомогою різних стратегій, напрямок лендінг-індустрії Jingdong ніколи не змінювався.
«Промислові атрибути є відмінними рисами технології JD.com. Кожна технологія, розроблена JD.com, випливає з промислових потреб, досвіду в промислових сценаріях і створює промислову цінність», — сказав Сю Ран.
Наразі широкомасштабна модель JD Yanxi рухається вперед відповідно до стратегії «трьох кроків»: на даний момент JD Cloud побудував велику модель загального призначення на основі внутрішньої практики; до кінця цього року JD. Надійні галузеві послуги; очікується, що на початку 2024 року можливості великомасштабної моделі будуть відкриті для зовнішніх серйозних бізнес-сценаріїв.
З практичної точки зору, велика модель JD.com досягла другого кроку. JD.com застосовує можливості великої моделі до найвідоміших сценаріїв, таких як роздрібна торгівля, фінанси, логістика та охорона здоров’я, і проникає в різні посилання.
Наприклад, Jingdong покращує можливості інтелектуального обслуговування клієнтів за допомогою великих моделей. Сфера обслуговування клієнтів відрізняється від щоденних чатів і розмов, це серйозна діалогова сцена, заснована на завданнях, яка потребує вирішення різноманітних складних проблем між покупцями та продавцями в реальному світі.
«Коли користувач спілкується з ChatGPT, не має значення, навіть якщо відповідь буде неправильною, і це не вплине на прийняття будь-яких рішень. Але якщо в серйозному бізнес-сценарії інтелектуальна служба підтримки клієнтів відповість неправильно, наслідки будуть неймовірними. Тому точність відповіді дуже важлива", - сказав Цао Пен, голова та президент JD Cloud Division, технічний комітет Jingdong Group.
Для сценаріїв інтелектуального обслуговування клієнтів JD.com не лише створив велику модель із базовим семантичним розумінням і логікою запитань і відповідей, але й відшліфував невелику модель для конкретних сценаріїв. Якщо проблема клієнта стосується звичайних повернень та обмінів тощо, інтелектуальна служба обслуговування клієнтів викличе більш загальну велику модель. І як тільки питання стосується гарантійної політики та правил захисту цін на конкретні продукти, інтелектуальна служба обслуговування клієнтів зателефонує більш цілеспрямованій маленькій моделі, щоб дати відповідь. Різні моделі можуть брати на себе різну відповідальність.
Тепер інтелектуальне обслуговування клієнтів працює всередині JD.com, допомагаючи більш ніж 20 000 власних співробітників служби підтримки клієнтів зменшити витрати та підвищити ефективність, а також постійно оптимізувати роботу з клієнтами. JD.com також відкрив свої можливості інтелектуального обслуговування клієнтів для зовнішнього світу, щоб допомогти більшій кількості державних установ і підприємств здійснити цифрову та інтелектуальну трансформацію та модернізацію.
Що стосується зовнішніх сервісів для великих моделей, JD.com все ще зберігає свій «повільний» темп і не поспішає «продавати» великі моделі підприємствам. Причина в тому, що штучний інтелект є дуже серйозною технологічною зміною: якщо його правильно використовувати, він може трансформувати галузь, але якщо використовувати його неправильно, він також може мати серйозні наслідки. За таких обставин Jingdong дотримується довгострокового менталітету і є відмінним вибором.
«JD.com не подаватиме страви, які не досягли «повного кольору, аромату та смаку». Після того, як великомасштабна модель завершить досвід і практику в ключових внутрішніх сценах, вона буде відкрита для партнерів, щоб допомогти всій галузі знизити витрати і підвищити ефективність." Xu Ran express.
У плані JD.com велика модель Yanxi стане технічною підтримкою найнижчого рівня. Виходячи зі своїх можливостей, галузь вироблятиме серію продуктів, а продукти в тій самій галузі будуть об’єднані в платформу та, нарешті, створюватимуть цінність для галузі.
Наприклад, у сфері генерації контенту JD.com створив маркетингову платформу JD Cloud AIGC. Завдяки багатим накопиченням даних про продукти всієї категорії JD.com велика модель може краще розуміти характеристики продукту, допомагати торговцям автоматично створювати зображення продуктів, пункти продажу та інші маркетингові матеріали, а також покращувати операційну ефективність торговців і якість маркетингового контенту.
Іншими словами, торговцям потрібно лише завантажити зображення продукту, і вони можуть швидко отримати кілька типів зображень, таких як зображення основного продукту, зображення маркетингових плакатів і зображення деталей бізнесу, необхідних для операцій електронної комерції, що відповідає потребам швидкого відкриття магазину, список продуктів і маркетинг. Ці можливості можуть заощадити продавцям 90% вартості креслення та скоротити виробничий цикл із 7 днів до півдня.
Використовуючи можливості великомасштабної моделі, торговцям навіть не потрібно продавати власні товари, їм потрібно лише використовувати багатомодальний цифровий оператор JD Cloud, щоб доставляти товари 24 години на добу за низькою ціною.
Окрім цих додатків, JD.com також продемонстрував платформу маркетингових операцій ШІ у фінансовій сфері. За допомогою простого діалогу користувачі можуть одночасно генерувати маркетингові дії, охоплюючи формулювання операційної стратегії, планування маркетингових завдань, створення сторінок активності, створення пакетів маркетингових копірайтингу та матеріалів, цифрову доставку тощо. Згідно з відповідними даними JD.com, у минулому цей набір процесів вимагав п’яти типів функціонального персоналу: продукт, R&D, алгоритм, дизайн і аналітик, але тепер його скоротили до однієї особи; у минулому процес вимагало 2000 взаємодій людини з комп’ютером, але їх також було скорочено до менше 50. Завдяки підтримці великих можливостей моделі ефективність виробництва маркетингового плану була значно покращена.
** Можна сказати, що велика промислова модель JD.com стає основою для промислового застосування в різних галузях. В даний час він проник у роздрібну торгівлю, логістику, охорону здоров'я, промисловість, виробництво, фінанси, маркетинг та інші галузі, а також пішов у промисловість і практичне застосування. **
Через півроку після того, як велика модель розійшлася, виробники зрозуміли, що «великий масштаб» або «високі параметри» не можуть вирішити практичних проблем. Коли період бульбашки закінчиться, великі моделі повинні повернутися в галузь, повернутися до реальних сценаріїв і врешті-решт вирішити практичні проблеми. Це кінцеве призначення технологій і початок доброго розвитку великих моделей. Почали виходити на сцену компанії з надійними промисловими даними та практикою сценаріїв.
Очевидно, що велика модель Jingdong Yanxi відпливла на інший кінець промислової цінності.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Від божевілля до раціональності, масштабні моделі започаткували «переломний момент» галузі
Усі говорять про велику модель, яка є справжнім зображенням світу технологій у першій половині цього року.
Судячи з хвилювання ринку, великомасштабні моделі стали треком для різних виробників техніки. Чи то інтернет-гіганти, технологічні компанії чи навіть дослідницькі установи, усі вони приєдналися до цієї великомасштабної модельної сутички. -масштабні моделі стали «Полем битви».
Саме тоді, коли внутрішній ринок великомасштабних моделей у розпалі, ChatGPT, який одним махом призвів до популярності великомасштабних моделей, зазнав зниження відвідувань. Згідно з останніми даними SimilarWeb, стороннього моніторингового агентства, у травні цього року ChatGPT почав демонструвати уповільнення зростання, при цьому темпи зростання становили лише 2,8% у цьому місяці, тоді як за перші чотири місяці 2023 року він становив 131,6%. %, 62,5 %, 55,8 %, 12,6 %. Це перший раз, коли ChatGPT зазнав негативного зростання трафіку з моменту його випуску 30 листопада 2022 року.
Це явище може відображати важливу галузеву тенденцію. Усі сторони змінюють початковий технічний ентузіазм щодо великих моделей до спокійних думок про комерціалізацію. І посадка великомасштабних моделей також є темою, яку всі компанії, що займаються великими моделями, повинні серйозно розглянути.
** «JD.com вважає, що цінність великої моделі = алгоритм × обчислювальна потужність × дані × квадрат промислової товщини», — сказав Сюй Ран, генеральний директор JD.com. JD.com не тільки переслідує розвиток технологій, але також приділяє особливу увагу товщині галузі - він оцінює, скільки промислових сценаріїв технологія може бути практично застосована та може створити різні цінності для суспільства. **
13 липня JD.com представив велику модель Yanxi. За даними JD.com, це модель нового покоління з параметрами, що сягають сотень мільярдів доларів, і вона буде активно використовуватися в роздрібній торгівлі, фінансах, логістиці, охороні здоров’я, промисловості та інших промислових сценаріях у майбутньому.
Коли промислова ефективність і розширення промислових кордонів якісно покращуються, велика модель матиме більшу практичну цінність і значення. У суєті великогабаритних моделей варто повернутися до раціональності та серйозно замислитися над справжньою цінністю великих моделей. Яка велика модель потрібна галузі? Як використовувати велику модель для комерційного використання, щоб зменшити витрати та підвищити ефективність галузі?
Змагання за велику модель: консенсус від загального до галузевого
За одну ніч одна за одною «спливли» вітчизняні масштабні моделі.
Відповідно до «Звіту про дослідження великомасштабної моделі штучного інтелекту Китаю», опублікованого Китайським інститутом науково-технічної інформації при Міністерстві науки і технологій, станом на 28 травня щонайменше 79 основних великомасштабних моделей із масштабом було опубліковано понад 1 мільярд параметрів у Китаї. Кількість великих моделей, розроблених у моїй країні, посідає друге місце у світі.
Однак, незважаючи на стрімку кількість досліджень і розробок, варто дослідити, як реалізувати комерційну цінність великих моделей.
Наразі з’являються великі моделі загального призначення. Цей тип великомасштабної моделі має потужні можливості розуміння природної мови, генерації мови та розпізнавання мовлення, а також добре працює в сценаріях із сильними загальними атрибутами, такими як спілкування в чаті та розваги. , ці сценарії все ще важко досягти широкомасштабної комерціалізації.
У поділених галузевих сценаріях точність відповіді загальної великої моделі є низькою. Це пояснюється тим, що сама галузь має малий розмір вибірки, нерівномірний розподіл даних і мінливі сценарії застосування, через що велика модель не може самостійно оптимізуватись і вдосконалюватися. Точність, природно, не висока.
З точки зору комерціалізації, підприємствам може не знадобитися «універсальна» великомасштабна модель загального призначення, а більше потрібна промислова великомасштабна модель, яка орієнтована на сценарії з розділеними полями та вирішує практичні проблеми.
Ву Хецюань, академік Китайської інженерної академії, якось зазначив, що «великі моделі, схожі на чат, викликали новий виток підйому, але діалог, написання віршів і малювання — це далеко не всі великі моделі. Нам потрібно глибоко продумайте напрямок застосування великих моделей, і ми повинні фактично впроваджувати великі моделі в галузі міського розвитку, фінансових технологій, біомедицини, промислового виробництва та наукових досліджень, професійні підприємства та організації також необхідні для прискорення їх впровадження в справжньої промисловості, приносячи реальну цінність нагальним потребам галузі та справді служачи суспільству у великих масштабах».
Зараз на ринку великомасштабних моделей формується консенсус, що великомасштабні моделі, які не можна використовувати в комерційних цілях, є лише «інструментами розваги», а лише великомасштабні моделі, які глибоко входять у галузь і вирішують практичні завдання. значення. Глибоко розмірковуючи про цінність великих моделей, формула, запропонована JD.com, більше відповідає тенденціям ринку великих моделей, а саме: вартість великих моделей = алгоритм × обчислювальна потужність × дані × квадрат товщини галузі.
** З формули значення великої моделі ми бачимо, що велика промислова модель і загальна велика модель не протистоять. Велика промислова модель базується на загальній великій моделі та навчається. Зміст більш узгоджується з потребами промислових вертикальних сценаріїв і більш цілеспрямованими. **
З огляду на шлях еволюції великої моделі, не дивно, що JD.com дивиться у майбутнє. З моменту свого заснування Jingdong вкорінився в індустрії та, природно, приділяє більше уваги цінності великих моделей у галузі.
«Jingdong приділяє увагу великим моделям та іншим технологічним інноваціям. Окрім просування технологій, він також приділяє особливу увагу товщині галузі — скількох промислових сценаріїв технологія може бути практично застосована для справжнього створення цінності для суспільства». сказав Сюй Ран, генеральний директор Jingdong.
**Насправді розробка великих моделей на даному етапі рухається від «універсальних» до «індустріальних». **
В останньому дослідницькому звіті, опублікованому Minsheng Securities, зазначено, що після інтенсивного періоду випуску великих моделей з лютого по березень, періоду розробки продукту з квітня по травень і напрям політики були поступово уточнені, продукти та програми великих моделей почнуться в червні Очікується, що це стане початком централізованого випуску. Нова хвиля випусків базується на широкомасштабних моделях прикладних продуктів, і масштабні оновлення почали виходити в Інтернет, готуючи вихід у тисячі домогосподарств.
Останнім часом більшість останніх великомасштабних моделей, випущених вітчизняними технологічними компаніями, орієнтовані на вертикальні галузі. За кордоном різні компанії послідовно випускають великомасштабні промислові моделі різних масштабів з метою застосування їх у промисловій сфері.
Виходячи з реальних тенденцій основних виробників у країні та за кордоном, не важко зрозуміти, що промислова модель зможе більше допомогти промисловим партнерам завершити цифрову трансформацію, зменшити витрати та підвищити ефективність, а також створити більшу цінність для галузі та суспільства. .
Велика промислова модель, важко закласти міцний фундамент для галузі
Складність побудови промислових великомасштабних моделей набагато вище, ніж у великомасштабних моделей загального призначення.
Якщо загальна великомасштабна модель перевіряє обчислювальну потужність і накопичення алгоритмів підприємства, то промислова великомасштабна модель перевіряє доступ підприємства до бізнес-сценаріїв і їх розуміння, а також накопичення та застосування промислових даних.
Індустріальний консенсус полягає в тому, що під час навчання промислових великих моделей найважче отримати промислові дані. Промислові дані часто знаходяться в руках підприємств. Через безпеку даних та інші міркування небагато підприємств готові розкривати приватні дані. Однак ці промислові дані часто прямо чи опосередковано впливають на швидкість технічної ітерації, точність моделі та бізнес-професіоналізм промислової великої моделі.
«Промислові дані також поділяються на статичні та динамічні. Статичні дані відносно стабільні, не змінюються миттєво, а шлях отримання відносно чіткий. Динамічні дані — це дані, що генеруються щомиті в різних промислових сценаріях. Ця частина даних "Живі" сценічні дані. Отримати їх нелегко, але це один із необхідних елементів промислової моделі", - підкреслив Хе Сяодун, президент дослідницького інституту JD і президент відділу інтелектуальних послуг і продуктів JD Technology.
Однак під час навчання промислових великих моделей не можна використовувати лише промислові дані, але все ще потрібно використовувати велику кількість загальних даних, щоб надати знання здорового глузду. Причини такі: по-перше, узагальнення промислових даних є недостатнім, і велика модель потребує перенавчання кожного разу, коли змінюється сцена, що дорого коштує; Застрягання в стані зависання.
Хе Сяодун порівняв навчання великої промислової моделі з навчанням людини: «Якщо людина йде працювати відразу після закінчення середньої школи, це здається нормальним, але професіоналізм буде менш професійним. Якщо ви зможете закінчити чотирирічну школу ступінь бакалавра, перш ніж приступити до роботи, у вас є як загальні знання, так і достатні професійні знання — це можливості, якими повинна володіти велика промислова модель».
З цієї причини дані великої моделі JD Yanxi складаються з 70% загальних даних і 30% необроблених даних про зростання ланцюга постачання.
Варто зазначити, що ці промислові дані надходять із самого JD.com. JD.com сама по собі є компанією, яка базується на ланцюжку поставок. Вона працює в багатьох галузях. Вона не лише має практичні дані в роздрібній торгівлі, логістиці, фінансах, охороні здоров’я, промисловості та інших галузях, але також має дані про міста, державні справи, фінанси, виробництво, промисловість, авіація, транспорт тощо. Десенсибілізовані дані таких галузей, як індустріальні парки, промислові парки та енергетика, а також високоякісні дані, що генеруються щороку, досягають 10 мільярдів одиниць.
На додаток до безперервної подачі високоякісних промислових даних, промислова велика модель також повинна розуміти галузеве ноу-хау, тобто мати унікальні знання про галузь і мати вищі вимоги до розуміння. Наприклад, галузь роздрібної торгівлі приділяє більше уваги ефекту маркетингу та рекомендацій, а фінансова індустрія приділяє більше уваги ефекту контролю ризиків, надійності та безпеки.
Для цього попиту ключову роль відіграв довгостроковий ланцюжок поставок цифрового інтелекту JD.com, і він став центром зусиль JD.com у застосуванні великих моделей. Велика модель також може базуватися на цифровому інтелекті ланцюга поставок і проникати глибоко в фізичну галузь.
Повідомляється, що ланцюжок поставок цифрового інтелекту JD.com охоплює понад 10 мільйонів артикулів продуктів JD.com, які самостійно керують, обслуговуючи понад 8 мільйонів активних корпоративних клієнтів, у тому числі понад 90% із 500 провідних компаній світу в Китаї та майже 70% спеціалізованих спеціальних нових МСП країни. У той же час ланцюжок поставок цифрового інтелекту JD.com все ще знаходиться в країні та має поглиблену співпрацю з більш ніж 2000 промисловими стрічками.
Такий ланцюжок поставок цифрового інтелекту з довшими зв’язками, складнішими сценаріями та багатшими даними є чудовим «полігоном» для великих моделей. На думку Дж. Д. Клауда, цінність великої моделі можна усвідомити лише шляхом глибокого розуміння ланцюжка поставок і дозволу великій моделі «працювати» в ланцюзі поставок.
На додаток до накопичення на промисловій стороні, не можна недооцінювати силу JD.com у базових алгоритмах і обчислювальній потужності.
У 2021 році дослідницький інститут JD Discovery запустив перший у країні надвеликий обчислювальний кластер на основі архітектури DGX SuperPOD у Chongqing-Tianqin α, який збільшив швидкість міркувань у 6,2 рази та знизив вартість міркувань на 90%. Це надає JD.com базову гарантію для масштабного навчання моделей.
У тому ж році JD.com запустив модель K-PLUG із мільярдним рівнем. Копія продукту, створена K-PLUG, охопила понад 3000 категорій на JD.com, створивши загалом 3 мільярди слів, а перевірка вручну проходила показник перевищує 95%. До 2022 року велика модель JD.com буде оновлена до десятків мільярдів моделей Vega, які можна буде широко використовувати в різноманітних завданнях обробки природної мови, таких як аналіз настроїв, семантична відповідність, виправлення граматичних помилок, інтелектуальні відповіді на запитання та здоровий глузд. міркування.
Завдяки попередньому накопиченню цього року JD.com зробив ще один технологічний прорив і запустив нове покоління великомасштабної моделі JD.com із сотнями мільярдів параметрів, зосереджених на кількох основних завданнях, таких як створення контенту, діалог між людиною та машиною, розуміння намірів користувача, вилучення інформації та класифікація емоцій. , реалізував точне налаштування базової моделі + моделі вертикальної області та застосував глибокі вертикальні сценарії, такі як роздрібна торгівля, логістика, фінанси, охорона здоров’я та державні справи.
Зараз велика промислова модель, яку представляє JD.com, навчає велику модель за допомогою накопичених індустріалізованих і сценарних даних і знань, а також коригує велику модель на основі накопичених галузевих ноу-хау, щоб покращити продуктивність великих моделей. у конкретних галузях і сценаріях застосування, а також для покращення керованості. Це еквівалентно завершенню «загальної освіти» для ШІ.
** Велика модель Jingdong поступово заглиблюється в різні галузі, щоб покращити рівень інтелекту в ланцюжку постачання. І навпаки, модернізація цифрового інтелекту в ланцюжку постачання також сприяє промисловій трансформації, яка, у свою чергу, забезпечує багатший ґрунт даних для великих моделей, утворюючи позитивний цикл. **
«Розрізання великомасштабної моделі з промислової сторони схоже на сходження на технічну гору Еверест з північного схилу: хоча дорога складніша, краєвиди більш чудові. Jingdong наполягає на тому, щоб робити «важкі, але правильні речі», наполягаючи на робити практичні, цінні та це довгострокова справа. У технічній сфері та у великих моделях це наше постійне зобов’язання», – сказав Сюй Ран.
** «Важкі і правильні речі» потребують тривалого накопичення. Однак, з точки зору побудови промислової моделі, JD.com явно заклав основу. **
Jingdong, народжений у галузі, створює промислову цінність за допомогою великих моделей
«В епоху великої моделі все варто робити знову з великою моделлю».
Під хвилею великих моделей індустрія швидко досягла зазначеного вище консенсусу. Однак у той час як інші великі виробники шукають бізнес-моделі за допомогою різних стратегій, напрямок лендінг-індустрії Jingdong ніколи не змінювався.
«Промислові атрибути є відмінними рисами технології JD.com. Кожна технологія, розроблена JD.com, випливає з промислових потреб, досвіду в промислових сценаріях і створює промислову цінність», — сказав Сю Ран.
Наразі широкомасштабна модель JD Yanxi рухається вперед відповідно до стратегії «трьох кроків»: на даний момент JD Cloud побудував велику модель загального призначення на основі внутрішньої практики; до кінця цього року JD. Надійні галузеві послуги; очікується, що на початку 2024 року можливості великомасштабної моделі будуть відкриті для зовнішніх серйозних бізнес-сценаріїв.
З практичної точки зору, велика модель JD.com досягла другого кроку. JD.com застосовує можливості великої моделі до найвідоміших сценаріїв, таких як роздрібна торгівля, фінанси, логістика та охорона здоров’я, і проникає в різні посилання.
Наприклад, Jingdong покращує можливості інтелектуального обслуговування клієнтів за допомогою великих моделей. Сфера обслуговування клієнтів відрізняється від щоденних чатів і розмов, це серйозна діалогова сцена, заснована на завданнях, яка потребує вирішення різноманітних складних проблем між покупцями та продавцями в реальному світі.
«Коли користувач спілкується з ChatGPT, не має значення, навіть якщо відповідь буде неправильною, і це не вплине на прийняття будь-яких рішень. Але якщо в серйозному бізнес-сценарії інтелектуальна служба підтримки клієнтів відповість неправильно, наслідки будуть неймовірними. Тому точність відповіді дуже важлива", - сказав Цао Пен, голова та президент JD Cloud Division, технічний комітет Jingdong Group.
Для сценаріїв інтелектуального обслуговування клієнтів JD.com не лише створив велику модель із базовим семантичним розумінням і логікою запитань і відповідей, але й відшліфував невелику модель для конкретних сценаріїв. Якщо проблема клієнта стосується звичайних повернень та обмінів тощо, інтелектуальна служба обслуговування клієнтів викличе більш загальну велику модель. І як тільки питання стосується гарантійної політики та правил захисту цін на конкретні продукти, інтелектуальна служба обслуговування клієнтів зателефонує більш цілеспрямованій маленькій моделі, щоб дати відповідь. Різні моделі можуть брати на себе різну відповідальність.
Тепер інтелектуальне обслуговування клієнтів працює всередині JD.com, допомагаючи більш ніж 20 000 власних співробітників служби підтримки клієнтів зменшити витрати та підвищити ефективність, а також постійно оптимізувати роботу з клієнтами. JD.com також відкрив свої можливості інтелектуального обслуговування клієнтів для зовнішнього світу, щоб допомогти більшій кількості державних установ і підприємств здійснити цифрову та інтелектуальну трансформацію та модернізацію.
Що стосується зовнішніх сервісів для великих моделей, JD.com все ще зберігає свій «повільний» темп і не поспішає «продавати» великі моделі підприємствам. Причина в тому, що штучний інтелект є дуже серйозною технологічною зміною: якщо його правильно використовувати, він може трансформувати галузь, але якщо використовувати його неправильно, він також може мати серйозні наслідки. За таких обставин Jingdong дотримується довгострокового менталітету і є відмінним вибором.
«JD.com не подаватиме страви, які не досягли «повного кольору, аромату та смаку». Після того, як великомасштабна модель завершить досвід і практику в ключових внутрішніх сценах, вона буде відкрита для партнерів, щоб допомогти всій галузі знизити витрати і підвищити ефективність." Xu Ran express.
У плані JD.com велика модель Yanxi стане технічною підтримкою найнижчого рівня. Виходячи зі своїх можливостей, галузь вироблятиме серію продуктів, а продукти в тій самій галузі будуть об’єднані в платформу та, нарешті, створюватимуть цінність для галузі.
Наприклад, у сфері генерації контенту JD.com створив маркетингову платформу JD Cloud AIGC. Завдяки багатим накопиченням даних про продукти всієї категорії JD.com велика модель може краще розуміти характеристики продукту, допомагати торговцям автоматично створювати зображення продуктів, пункти продажу та інші маркетингові матеріали, а також покращувати операційну ефективність торговців і якість маркетингового контенту.
Іншими словами, торговцям потрібно лише завантажити зображення продукту, і вони можуть швидко отримати кілька типів зображень, таких як зображення основного продукту, зображення маркетингових плакатів і зображення деталей бізнесу, необхідних для операцій електронної комерції, що відповідає потребам швидкого відкриття магазину, список продуктів і маркетинг. Ці можливості можуть заощадити продавцям 90% вартості креслення та скоротити виробничий цикл із 7 днів до півдня.
Використовуючи можливості великомасштабної моделі, торговцям навіть не потрібно продавати власні товари, їм потрібно лише використовувати багатомодальний цифровий оператор JD Cloud, щоб доставляти товари 24 години на добу за низькою ціною.
Окрім цих додатків, JD.com також продемонстрував платформу маркетингових операцій ШІ у фінансовій сфері. За допомогою простого діалогу користувачі можуть одночасно генерувати маркетингові дії, охоплюючи формулювання операційної стратегії, планування маркетингових завдань, створення сторінок активності, створення пакетів маркетингових копірайтингу та матеріалів, цифрову доставку тощо. Згідно з відповідними даними JD.com, у минулому цей набір процесів вимагав п’яти типів функціонального персоналу: продукт, R&D, алгоритм, дизайн і аналітик, але тепер його скоротили до однієї особи; у минулому процес вимагало 2000 взаємодій людини з комп’ютером, але їх також було скорочено до менше 50. Завдяки підтримці великих можливостей моделі ефективність виробництва маркетингового плану була значно покращена.
** Можна сказати, що велика промислова модель JD.com стає основою для промислового застосування в різних галузях. В даний час він проник у роздрібну торгівлю, логістику, охорону здоров'я, промисловість, виробництво, фінанси, маркетинг та інші галузі, а також пішов у промисловість і практичне застосування. **
Через півроку після того, як велика модель розійшлася, виробники зрозуміли, що «великий масштаб» або «високі параметри» не можуть вирішити практичних проблем. Коли період бульбашки закінчиться, великі моделі повинні повернутися в галузь, повернутися до реальних сценаріїв і врешті-решт вирішити практичні проблеми. Це кінцеве призначення технологій і початок доброго розвитку великих моделей. Почали виходити на сцену компанії з надійними промисловими даними та практикою сценаріїв.
Очевидно, що велика модель Jingdong Yanxi відпливла на інший кінець промислової цінності.