От безумия к рациональности: крупномасштабные модели возвестили о «поворотном моменте» отрасли.

Источник изображения: сгенерировано Unbounded AI

Все говорят о большой модели, которая является истинным изображением мира технологий в первой половине этого года.

Судя по рыночному ажиотажу, крупномасштабные модели стали трассой, на которую устремились различные производители техники, будь то интернет-гиганты, технологические компании или даже исследовательские институты, все они присоединились к этой крупномасштабной модельной схватке. Масштабные модели стали «полем боя».

Как раз в то время, когда внутренний рынок крупномасштабных моделей находится в самом разгаре, ChatGPT, который одним махом увеличил популярность крупномасштабных моделей, испытал снижение посещений. Согласно последним данным независимого мониторингового агентства SimilarWeb, в мае этого года ChatGPT начал демонстрировать замедление роста, при этом темпы роста в этом месяце составили всего 2,8%, в то время как за первые четыре месяца 2023 года они составили 131,6%. %, 62,5%, 55,8%, 12,6%. Это первый случай, когда ChatGPT испытывает отрицательный рост трафика с момента его выпуска 30 ноября 2022 года.

Это явление может отражать важную отраслевую тенденцию: все стороны переходят от первоначального технического энтузиазма в отношении больших моделей к спокойным размышлениям о коммерциализации. И посадка масштабных моделей — это тоже тема, над которой нужно серьезно подумать всем крупным модельным компаниям.

** «JD.com считает, что ценность большой модели = алгоритм × вычислительная мощность × данные × квадрат плотности отрасли», — сказал Сюй Ран, генеральный директор JD.com. JD.com не только занимается продвижением технологий, но и уделяет особое внимание толщине отрасли — она оценивает, сколько промышленных сценариев может применяться на практике и может создавать различные ценности для общества. **

13 июля JD.com запустил большую модель Yanxi. Согласно JD.com, это модель нового поколения с параметрами, достигающими сотен миллиардов долларов, и в будущем она будет широко использоваться в розничной торговле, финансах, логистике, здравоохранении, промышленности и других промышленных сценариях.

Когда эффективность производства и расширение границ промышленности будут качественно улучшены, большая модель будет иметь более важное практическое значение и значение. В суете больших моделей нам следует вернуться к рациональности и серьезно задуматься об истинной ценности больших моделей. Какая большая модель нужна отрасли? Как следует ввести большую модель в коммерческое использование, чтобы снизить затраты и повысить эффективность отрасли?

Конкуренция за большую модель: консенсус между генералами и отраслью

В одночасье отечественные масштабные модели «появились» одна за другой.

Согласно «Отчету об исследованиях крупномасштабных моделей искусственного интеллекта Китая», опубликованному Китайским институтом науки и технической информации при Министерстве науки и технологий, по состоянию на 28 мая по крайней мере 79 базовых крупномасштабных моделей с масштабом было выпущено более 1 миллиарда параметров в Китае. По количеству крупных моделей, разработанных в моей стране, она занимает второе место в мире.

Однако за растущим числом исследований и разработок стоит изучить вопрос о том, как реализовать коммерческую ценность больших моделей.

В настоящее время появляются более универсальные большие модели.Этот тип крупномасштабной модели обладает мощными возможностями понимания естественного языка, генерации языка и распознавания речи и хорошо работает в сценариях с сильными общими атрибутами, такими как общение в чате и развлечения. , эти сценарии по-прежнему трудно добиться широкомасштабной коммерциализации.

В разделенных отраслевых сценариях точность ответов общей большой модели низка из-за того, что сама отрасль имеет небольшой размер выборки, неравномерное распределение данных и изменяющиеся сценарии приложений, из-за чего большая модель не может самооптимизироваться и улучшаться. Точность естественно не высокая.

С точки зрения коммерциализации предприятиям может быть не нужна «всесторонняя» крупномасштабная модель общего назначения, а больше нужна промышленная крупномасштабная модель, которая нацелена на отдельные полевые сценарии и решает практические проблемы.

У Хэцюань, академик Китайской инженерной академии, однажды отметил, что «большие модели, похожие на чаты, вызвали новый виток подъема, но диалоги, написание стихов и рисование — это далеко не все модели больших размеров. глубоко задуматься о направлении применения больших моделей, и мы должны фактически внедрить большие модели в области городского развития, финансовых технологий, биомедицины, промышленного производства и научных исследований, профессиональные предприятия и организации также необходимы для ускорения их внедрения в реальная промышленность, приносящая реальную пользу неотложным потребностям отрасли и действительно служа обществу в больших масштабах».

В настоящее время на рынке крупномасштабных моделей формируется консенсус в отношении того, что масштабные модели, которые не могут быть введены в коммерческое использование, являются всего лишь «инструментами развлечения», а имеют значение только масштабные модели, которые уходят вглубь индустрии и решают практические задачи. ценить. Глубоко размышляя о ценности больших моделей, формула, предложенная JD.com, больше соответствует тенденции рынка больших моделей, а именно: ценность больших моделей = алгоритм × вычислительная мощность × данные × квадрат толщины отрасли.

** Из формулы значения большой модели видно, что большая промышленная модель и общая большая модель не находятся в противоположных отношениях. Большая промышленная модель основана на общей большой модели и обучена. Содержание более в соответствии с потребностями промышленных вертикальных сценариев и более целенаправленными. **

С точки зрения пути эволюции большой модели неудивительно, что JD.com смотрит в будущее. С момента своего основания компания Jingdong прочно укоренилась в отрасли и, естественно, уделяет больше внимания ценности крупных моделей в отрасли.

«Jingdong относится к большим моделям и другим технологическим инновациям. Помимо стремления к передовому характеру технологий, он также уделяет особое внимание толщине отрасли — скольким промышленным сценариям технология может быть практически применена, чтобы действительно создать ценность для общества. ", сказал Сюй Ран, генеральный директор Jingdong.

**Фактически разработка крупных моделей на данном этапе переходит от «универсальных» к «промышленным». **

В последнем исследовательском отчете, опубликованном Minsheng Securities, упоминается, что после интенсивного периода выпуска больших моделей с февраля по март, периода разработки продукта с апреля по май и направления политики постепенно уточнялись, продукты и приложения больших моделей начнутся в июне. Ожидается, что это приведет к централизованному выпуску. Новая волна выпусков основана на крупномасштабных модельных прикладных продуктах, и масштабные обновления начали выходить в онлайн, готовясь к внедрению в тысячи домохозяйств.

В последнее время большинство последних масштабных моделей, выпускаемых отечественными технологическими компаниями, нацелены на вертикальные отрасли. За рубежом различные компании последовательно выпускали крупномасштабные отраслевые модели разного масштаба с целью их применения в промышленной сфере.

Из фактических тенденций основных производителей в стране и за рубежом нетрудно увидеть, что промышленная модель будет в большей степени помогать промышленным партнерам в завершении цифровой трансформации, снижении затрат и повышении эффективности, а также создании большей ценности для отрасли и общества. .

Крупная промышленная модель, трудно заложить прочный фундамент для отрасли

Сложность построения промышленных крупномасштабных моделей намного выше, чем у крупномасштабных моделей общего назначения.

Если общая крупномасштабная модель проверяет вычислительную мощность и накопление алгоритмов предприятия, то промышленная крупномасштабная модель проверяет доступ предприятия к бизнес-сценариям и их понимание, а также накопление и применение промышленных данных.

В отрасли существует консенсус в отношении того, что при обучении промышленных крупных моделей труднее всего получить промышленные данные. Промышленные данные часто находятся в руках предприятий. Из-за безопасности данных и других соображений немногие предприятия готовы раскрывать личные данные. Однако эти промышленные данные часто прямо или косвенно влияют на скорость технической итерации, точность модели и деловой профессионализм крупной промышленной модели.

«Промышленные данные также можно разделить на статические и динамические данные. Статические данные относительно стабильны, не изменятся немедленно, а путь сбора данных относительно ясен. Динамические данные — это данные, генерируемые каждый момент в различных промышленных сценариях. данные — это «живые» данные сцены. Получить их непросто, но они являются одним из необходимых элементов промышленной модели», — подчеркнул Хэ Сяодун, президент исследовательского института JD и президент отдела интеллектуальных услуг и продуктов JD Technology.

Тем не менее, обучение промышленных крупных моделей не может использовать только промышленные данные, но все же необходимо использовать большое количество общих данных для получения знаний на основе здравого смысла. Причины следующие: во-первых, генерализация промышленных данных недостаточна, и большую модель необходимо переобучать каждый раз при смене сцены, что дорого; застрял в зависшем состоянии.

Хэ Сяодун сравнил обучение крупной промышленной модели с обучением человека: «Если человек выходит на работу сразу после окончания средней школы, вроде бы все в порядке, но профессионализм будет менее профессиональным. - год бакалавриата перед выходом на работу, у вас есть как общие знания, так и способности и достаточные профессиональные знания - это возможности, которыми должна обладать крупная промышленная модель».

По этой причине данные большой модели JD Yanxi состоят из 70% общих данных и 30% необработанных данных о росте сцены цепочки поставок.

Стоит отметить, что эти промышленные данные взяты с самого сайта JD.com. JD.com сама по себе является компанией, основанной на цепочке поставок.Она имеет корни в широком спектре отраслей.У нее есть не только практические данные по розничной торговле, логистике, финансам, здравоохранению, промышленности и другим отраслям, но и данные по городам, государственные дела, финансы, производство, промышленность, авиация, транспорт и т. д. Десенсибилизированные данные таких отраслей, как индустриальные парки, индустриальные парки и энергетика, а также высококачественные данные, генерируемые каждый год, достигают 10 миллиардов штук.

В дополнение к непрерывному поступлению высококачественных промышленных данных крупная промышленная модель также должна понимать отраслевые ноу-хау, то есть обладать уникальными знаниями об отрасли и предъявлять более высокие требования к пониманию. Например, индустрия розничной торговли больше внимания уделяет эффекту маркетинга и рекомендаций, а финансовая индустрия больше внимания уделяет эффекту контроля рисков, надежности и безопасности.

Ключевую роль в удовлетворении этого спроса сыграла долгосрочная цепочка поставок цифрового интеллекта JD.com, которая стала центром усилий JD.com по применению больших моделей. Большая модель также может быть основана на цифровом интеллекте цепочки поставок и углубляться в физическую отрасль.

Сообщается, что цепочка поставок цифрового интеллекта JD.com охватывает более 10 миллионов артикулов продуктов JD.com для самостоятельного управления, обслуживая более 8 миллионов активных корпоративных клиентов, в том числе более 90% из 500 крупнейших компаний мира в Китае, и почти 70% специализированных новых МСП страны. В то же время цепочка поставок цифрового интеллекта JD.com все еще находится в стране и тесно сотрудничает с более чем 2000 промышленных ремней.

Такая цепочка поставок цифрового интеллекта с более длинными звеньями, более сложными сценариями и более богатыми данными является отличной «тренировочной площадкой» для больших моделей. С точки зрения JD Cloud, ценность большой модели может быть реализована только путем тщательного понимания цепочки поставок и обеспечения «работы» большой модели в цепочке поставок.

В дополнение к накоплению на промышленной стороне нельзя недооценивать сильные стороны JD.com в основных алгоритмах и вычислительной мощности.

В 2021 году исследовательский институт JD Discovery запустил первый в стране сверхбольшой вычислительный кластер на базе архитектуры DGX SuperPOD в Чунцин-Тяньцинь α, что увеличило скорость рассуждений в 6,2 раза и снизило стоимость рассуждений на 90%. Это дает JD.com самую базовую гарантию для крупномасштабного обучения моделей.

В том же году JD.com запустил модель K-PLUG с миллиардным уровнем.Копия продукта, созданная K-PLUG, охватила более 3000 категорий на JD.com, сгенерировав в общей сложности 3 миллиарда слов, а ручной обзор прошел скорость превышает 95%. К 2022 году большая модель JD.com будет модернизирована до модели Vega на десятки миллиардов, которую можно будет широко использовать в различных последующих задачах обработки естественного языка, таких как анализ настроений, семантическое сопоставление, исправление грамматических ошибок, интеллектуальные ответы на вопросы и здравый смысл. рассуждения.

Благодаря предыдущему накоплению, JD.com совершил еще один технологический прорыв в этом году и запустил крупномасштабную модель JD.com нового поколения с сотнями миллиардов параметров, сосредоточив внимание на нескольких основных задачах, таких как создание контента, человеко-машинный диалог, понимание намерений пользователя, извлечение информации и классификация эмоций, реализована точная настройка базовой модели + вертикальной модели предметной области и применены углубленные вертикальные сценарии, такие как розничная торговля, логистика, финансы, здравоохранение и государственные дела.

В настоящее время крупная промышленная модель, представленная JD.com, обучает большую модель на основе накопленных промышленных и основанных на сценариях данных и знаний, а также корректирует большую модель на основе накопленного отраслевого ноу-хау для повышения производительности больших моделей. в конкретных отраслях и сценариях применения, а также для улучшения управляемости. Это эквивалентно получению «общего образования» для ИИ.

** Большая модель Jingdong постепенно углубляется в различные отрасли, чтобы повысить уровень интеллекта в цепочке поставок. И наоборот, цифровая интеллектуальная модернизация цепочки поставок также способствует промышленной трансформации, которая, в свою очередь, обеспечивает более богатую базу данных для крупных моделей, формируя положительный цикл. **

«Врезаться в большую модель с промышленной стороны — все равно, что подниматься на техническую гору Эверест с северного склона: хотя дорога сложнее, пейзажи более великолепны. Jingdong настаивает на выполнении «сложных, но правильных вещей», настаивая на практическом , ценный и долгосрочный вопрос. В технической области и в большой модели это наша постоянная приверженность ", - сказал Сюй Ран.

** «Трудные и правильные вещи» нуждаются в длительном накоплении. Однако с точки зрения построения промышленной модели JD.com четко заложил основу. **

Jingdong, рожденный в отрасли, создает промышленную ценность с помощью больших моделей

«В эпоху большой модели все стоит переделать с большой моделью».

Под волной больших моделей индустрия быстро достигла вышеуказанного консенсуса. Однако в то время как другие крупные производители ищут бизнес-модели с помощью различных стратегий, направление посадочной индустрии Jingdong никогда не менялось.

"Промышленные атрибуты являются отличительной чертой технологии JD.com. Каждая технология, разработанная JD.com, проистекает из промышленных потребностей, опыта работы в промышленных сценариях и создает промышленную ценность", - сказал Сюй Ран.

В настоящее время крупномасштабная модель JD Yanxi движется вперед в соответствии со стратегией «трех шагов»: в настоящее время JD Cloud построила крупную модель общего назначения на основе внутренних практик, к концу этого года JD. Надежные отраслевые услуги; ожидается, что в начале 2024 года возможности крупномасштабной модели будут открыты для внешних серьезных бизнес-сценариев.

С практической точки зрения, большая модель JD.com достигла второго шага. JD.com применяет возможности большой модели к наиболее знакомым сценариям, таким как розничная торговля, финансы, логистика и здравоохранение, и проникает в различные сферы. ссылки.

Например, Jingdong улучшает возможности интеллектуального обслуживания клиентов с помощью крупных моделей. Сфера обслуживания клиентов отличается от ежедневных чатов и разговоров, это серьезная диалоговая сцена, основанная на задачах, в которой необходимо решать различные сложные проблемы между покупателями и продавцами в реальном мире.

«Когда пользователь разговаривает с ChatGPT, не имеет значения, даже если ответ будет неправильным, и это не повлияет на принятие решения. Но если в серьезном бизнес-сценарии интеллектуальная служба поддержки клиентов ответит неправильно, последствия будут невообразимыми. , Поэтому точность ответа очень важна», — заявил технический комитет Jingdong Group Цао Пэн, председатель и президент JD Cloud Division.

Для интеллектуальных сценариев обслуживания клиентов JD.com не только построила большую модель с базовым семантическим пониманием и логикой вопросов и ответов, но также отшлифовала маленькую модель для конкретных сценариев. Если проблема клиента связана с обычными возвратами и обменами и т. д., интеллектуальная служба поддержки клиентов вызовет более общую большую модель. И как только вопрос касается гарантийной политики и правил ценовой защиты конкретных продуктов, интеллектуальная служба поддержки клиентов вызовет более целевую маленькую модель, чтобы дать ответ. Разные модели могут брать на себя разные обязанности.

Теперь интеллектуальная служба поддержки клиентов работает внутри JD.com, помогая более чем 20 000 сотрудников службы поддержки клиентов сократить расходы и повысить эффективность, а также постоянно оптимизировать качество обслуживания клиентов. JD.com также открыла свои интеллектуальные возможности обслуживания клиентов для внешнего мира, чтобы помочь большему количеству государственных учреждений и предприятий проводить цифровую и интеллектуальную трансформацию и модернизацию.

Что касается внешних услуг для больших моделей, JD.com по-прежнему сохраняет свой «медленный» темп и не спешит «продавать» большие модели предприятиям. Причина в том, что искусственный интеллект — это очень серьезное технологическое изменение: при правильном использовании он может трансформировать отрасль, но при неправильном использовании также может иметь серьезные последствия. В таких обстоятельствах Jingdong придерживается долгосрочного мышления и является отличным выбором.

«JD.com не будет подавать блюда, которые не достигли «полного цвета, аромата и вкуса». После того, как крупномасштабная модель завершит опыт и практику в ключевых внутренних сценах, она будет открыта для партнеров, чтобы помочь всей отрасли сократить расходы. и повысить эффективность». Экспресс Сюй Ран.

По плану JD.com, большая модель Yanxi станет технической поддержкой самого низкого уровня. Основываясь на своих возможностях, поле будет производить ряд продуктов, а продукты в одном и том же поле будут объединены в платформу и, наконец, принесут пользу отрасли.

Например, в области создания контента компания JD.com создала платформу контент-маркетинга JD Cloud AIGC. Основываясь на богатом наборе данных о продуктах всей категории JD.com, большая модель может лучше понять характеристики продукта, помочь продавцам автоматически создавать изображения продуктов, точки продажи и другие маркетинговые материалы, а также повысить эффективность работы продавцов и качество маркетингового контента.

Другими словами, продавцам нужно только загрузить изображение продукта, и они могут быстро получить несколько типов изображений, таких как изображения основного продукта, изображения маркетинговых плакатов и изображения бизнес-деталей, необходимые для операций электронной коммерции, отвечающие потребностям быстрого открытия магазина, список продуктов и маркетинг. Эти возможности могут сэкономить продавцам 90% стоимости чертежей и сократить производственный цикл с 7 дней до половины дня.

Используя возможности более масштабных моделей, продавцам даже не нужно продавать свои товары, а нужно всего лишь использовать мультимодального цифрового человека JD Cloud для доставки товаров 24 часа в сутки по низкой цене.

В дополнение к этим приложениям JD.com также продемонстрировала платформу для маркетинговых операций с искусственным интеллектом в финансовой сфере. С помощью простого диалога пользователи могут генерировать маркетинговые мероприятия в одном месте, охватывая формулировку операционной стратегии, планирование маркетинговых задач, создание страниц действий, пакетное создание маркетинговых копирайтов и материалов, цифровую доставку и т. д. Согласно актуальным данным JD.com, в прошлом для этого процесса требовалось пять типов функционального персонала: продукт, НИОКР, алгоритм, дизайнер и аналитик, но теперь он сократился до одного человека; в прошлом процесс требовал 2000 человеко-компьютерных взаимодействий, но также сократилось до менее чем 50. Благодаря поддержке больших моделей эффективность производства маркетингового плана была значительно улучшена.

** Можно сказать, что крупная промышленная модель JD.com становится основой для промышленных приложений в различных отраслях. В настоящее время он проник в розничную торговлю, логистику, здравоохранение, промышленность, производство, финансы, маркетинг и другие отрасли, а также в промышленность и практическое применение. **

Через полгода после того, как большая модель вышла из-под контроля, производители осознали, что «большой масштаб» или «высокие параметры» не могут решить практических задач. Когда период пузыря закончится, большие модели должны вернуться в промышленность, вернуться к реальным сценариям и, в конце концов, решить практические задачи.Это конечная цель технологии и начало доброкачественной разработки больших моделей. На сцену стали выходить те компании, у которых были солидные промышленные данные и сценарная практика.

Очевидно, что большая модель Jingdong Yanxi отправилась на другой конец промышленной ценности.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить