「産業データは、静的データと動的データにも分類できます。静的データは比較的安定しており、すぐには変更されず、取得経路は比較的明確です。動的データは、さまざまな産業シナリオで刻々と生成されるデータです。 「データは『生きている』シーンのデータです。入手は簡単ではありませんが、産業モデルに必要な要素の1つです」とJD Research Instituteの社長でJD Technology Intelligent Service and Product Divisionの社長である何暁東氏は強調した。
「産業側から大型モデルに切り込むことは、技術的なエベレストを北斜面から登るようなものです。道はより困難ですが、より雄大な景色があります。京東は「難しくても正しいこと」を行うことを主張し、実践的なことを行うことを主張しています。 「価値があり、長期的な問題です。技術分野でも大型モデルでも、これは私たちの絶え間ない取り組みです。」と Xu Ran 氏は言いました。
大型モデルは流行から合理化へ、業界の“転換点”を迎えた
誰もが、今年上半期のテクノロジー業界を如実に表しているこの大きなモデルについて話します。
市場の盛り上がりから判断すると、大型モデルはさまざまなテクノロジーメーカーが参入する道となっており、インターネット大手、テクノロジー企業、さらには研究機関までがこの大型モデルの混戦に加わっている。 -スケールモデルは「戦場」になりました。
国内の大型モデル市場が本格化してきた矢先、大型モデルの人気を一気に牽引してきたChatGPTのアクセス数が減少。サードパーティ監視機関であるSimilarWebの最新データによると、今年5月、ChatGPTは成長の鈍化を見せ始め、2023年の最初の4か月は131.6%であったのに対し、同月の成長率はわずか2.8%となった。 %、62.5%、55.8%、12.6%。 ChatGPT が 2022 年 11 月 30 日のリリース以来、トラフィックのマイナス成長を経験したのはこれが初めてです。
この現象は業界の重要な傾向を反映している可能性があり、関係者全員が当初の大型モデルに対する技術的な熱意から、商品化についての冷静な考え方に変わりつつあります。そして、大型モデルの上陸は、すべての大型モデル会社が真剣に検討する必要があるテーマでもあります。
** 「JD.com は、大規模モデルの価値 = アルゴリズム × コンピューティング能力 × データ × 業界の厚さの 2 乗であると信じています。」と JD.com の CEO、Xu Ran 氏は述べています。 JD.comは技術の進歩を追求するだけでなく、その技術がどれだけ多くの産業シナリオに実用化され、社会にさまざまな価値を生み出すことができるかを重視し、産業の厚みにも細心の注意を払っています。 **
7月13日、JD.comはYanxiの大型モデルを発売した。 JD.com によると、これはパラメータが数千億ドルに達する新世代モデルであり、将来的には小売、金融、物流、健康、産業、その他の産業シナリオで深く使用される予定です。
産業効率と産業境界の拡大が質的に向上すると、大型モデルはより重要な実用的価値と意義を持つようになります。大型モデルの喧騒の中で、私たちは合理に立ち戻り、大型モデルの真の価値を真剣に考えるべきです。業界はどのような大きなモデルを必要としていますか?コストを削減し、業界の効率を高めるために、大型モデルをどのように商業利用すべきでしょうか?
大きなモデルをめぐる競争: 一般から業界までのコンセンサス
一夜にして国産大型モデルが次々と“出現”した。
科学技術省傘下の中国科学技術情報研究院が発表した「中国人工知能大規模モデルマップ研究報告」によると、5月28日現在、少なくとも79の規模の基本的な大規模モデルが存在する。中国では10億以上のパラメータが公開されています。私の国で開発された大型モデルの数は世界第2位です。
しかし、研究開発の数が急増している背景では、大型モデルの商業的価値をどのように実現するかは検討する価値があります。
現在、より汎用的な大規模モデルが登場しており、この種の大規模モデルは強力な自然言語理解、言語生成、音声認識機能を備えており、チャットやエンターテイメントなどの一般的な属性が強いシナリオで優れたパフォーマンスを発揮します。 、これらのシナリオは大規模な商業化を達成するのがまだ困難です。
細分化された産業シナリオでは、一般的な大規模モデルの回答精度が低くなります。これは、業界自体のサンプル サイズが小さく、データ分布が不均一で、アプリケーション シナリオが変化するため、大規模モデルが自己最適化して改善することができないためです。当然精度は高くありません。
事業化の観点から見ると、企業は「万能」な汎用大規模モデルを必要としているのではなく、細分化されたフィールドシナリオを対象とし、現実的な問題を解決する産業用大規模モデルを必要としている。
中国工程院の院士、呉和泉氏はかつて「チャットのような大型モデルが新たな隆盛を引き起こしたが、対話、詩作、絵画は決して大型モデルのすべてではない。我々はそれを行う必要がある」と指摘した。大規模モデルの適用方向について深く考え、実際に大規模モデルを導入する必要があります。都市開発、金融テクノロジー、生物医学、工業製造、科学研究の分野では、専門的な企業や組織も、それらの導入を加速する必要があります。実際の産業に貢献し、業界の当面のニーズに真の価値をもたらし、大規模な社会に真に貢献します。」
現在、大型模型市場では、実用化できない大型模型は単なる「娯楽ツール」であり、業界の奥深くまで踏み込んで現実的な問題を解決する大型模型のみが普及するというコンセンサスが形成されつつあります。価値。大規模モデルの価値について深く考えると、JD.com が提案した式は大規模モデル市場の傾向により一致しています。つまり、大規模モデルの価値 = アルゴリズム × コンピューティング能力 × データ × 業界の厚さの 2 乗です。
** 大型モデルの値式から、産業用大型モデルと一般大型モデルは対立するものではないことがわかります 工業用大型モデルは一般大型モデルをベースにして学習されており、内容はより一致しています産業の垂直シナリオのニーズに対応し、よりターゲットを絞ったものになります。 **
大型モデルの進化路線という点では、JD.comが前向きであることは驚くべきことではない。京東は設立以来、業界に根付いており、当然のことながら業界における大型モデルの価値をより重視しています。
「京東は大型モデルやその他の技術革新を重視しています。技術の進歩を追求することに加えて、社会に真の価値を生み出すためにその技術が実際にどれだけ多くの産業シナリオに適用できるかという産業の厚みにも特別な注意を払っています。」 Jingdong CEO の Xu Ran 氏は次のように述べています。
**実際、現段階での大型モデルの開発は「汎用」から「産業」へと移行しつつあります。 **
民生証券が発表した最新の調査報告書によると、2月から3月の大型モデルの集中発売期間、4月から5月の製品開発期間と政策の方向性が徐々に明確になった後、6月に大型モデルの製品とアプリケーションが開始される予定であると述べた集中リリースの導入が期待されています。新しいリリースの波は大規模なモデル アプリケーション製品に基づいており、大規模なアップグレードがオンラインで開始され、数千世帯への導入に備えています。
最近、国内のテクノロジー企業がリリースする最新の大型モデルのほとんどは垂直産業向けです。海外では、産業分野への応用を目的として、さまざまな企業が規模の異なる大規模なインダストリモデルを次々とリリースしています。
国内外の大手製造業者の実際の傾向から、この産業モデルは産業パートナーがデジタル変革を完了し、コストを削減し、効率を向上させ、産業と社会にとってより大きな価値を生み出すのにさらに役立つことができることを理解するのは難しくありません。 。
大規模な産業モデルのため、業界の強固な基盤を築くのは困難
産業用大型モデルの構築は、汎用の大型モデルに比べて非常に難易度が高くなります。
一般的な大規模モデルが企業のコンピューティング能力とアルゴリズムの蓄積をテストする場合、産業用大規模モデルは、企業のビジネス シナリオへのアクセスと理解、および産業データの蓄積とアプリケーションをテストします。
業界のコンセンサスは、産業用の大規模モデルのトレーニングにおいて、取得するのが最も難しいのは産業用データであるということです。産業データは多くの場合企業の手に渡りますが、データのセキュリティやその他の考慮事項により、個人データを積極的に開示する企業はほとんどありません。ただし、これらの産業データは、多くの場合、産業用大規模モデルの技術的な反復速度、モデルの精度、ビジネスの専門性に直接的または間接的に影響を与えます。
「産業データは、静的データと動的データにも分類できます。静的データは比較的安定しており、すぐには変更されず、取得経路は比較的明確です。動的データは、さまざまな産業シナリオで刻々と生成されるデータです。 「データは『生きている』シーンのデータです。入手は簡単ではありませんが、産業モデルに必要な要素の1つです」とJD Research Instituteの社長でJD Technology Intelligent Service and Product Divisionの社長である何暁東氏は強調した。
ただし、産業用の大規模モデルのトレーニングでは、産業用データを使用するだけでなく、常識的な知識を提供するために大量の一般データを使用する必要があります。その理由は次のとおりです: まず、産業データの一般化が不十分であり、シーンが変更されるたびに大規模なモデルを再トレーニングする必要があり、コストがかかること、およびスタック状態に陥っていることです。
何暁東氏は、大規模な産業モデルの訓練を人間の訓練に例えて、「高校を卒業してそのまま仕事に就くのであれば、問題はないように見えるが、プロ意識は低くなってしまう。もし4つを修了できれば」と語った。 」
このため、JD Yanxi の大規模モデルのデータは、70% の一般データと 30% のサプライ チェーン シーンの成長の生データで構成されています。
これらの産業データは JD.com 自体から取得されていることに言及する価値があります。 JD.com自体はサプライチェーンを基盤とした企業であり、幅広い業界に根ざしており、小売、物流、金融、健康、産業などの実践データだけでなく、都市、政務、金融、製造、産業、航空、交通など。工業団地、工業団地、エネルギーなどの業界の減感データ、年間生成される高品質データは100億件に達します。
産業用大規模モデルは、高品質の産業データを継続的に提供することに加えて、業界のノウハウを理解する必要があります。つまり、業界に関する独自の知識を持ち、理解するためのより高い要件があります。例えば、小売業界ではマーケティングや推奨の効果が重視され、金融業界ではリスク管理、信頼性、安全性の効果が重視されます。
この需要に対しては、JD.com の長期にわたるデジタル インテリジェンス サプライ チェーンが重要な役割を果たしており、大規模モデルの適用における JD.com の取り組みの焦点となっています。大規模なモデルは、サプライ チェーンのデジタル インテリジェンスに基づいて、物理的な業界に深く入り込むこともできます。
報告によると、JD.com のデジタル インテリジェンス サプライ チェーンは、1,000 万以上の JD.com の自社運営製品 SKU をカバーしており、中国の世界トップ 500 企業の 90% 以上を含む 800 万以上のアクティブな法人顧客にサービスを提供しています。全国の特殊な新規中小企業の約 70% が占めます。同時に、JD.com のデジタル インテリジェンス サプライ チェーンは依然として国内にあり、2,000 以上の工業地帯と緊密な協力関係を築いています。
より長いリンク、より複雑なシナリオ、より豊富なデータを備えたこの種のデジタル インテリジェンス サプライ チェーンは、大規模モデルにとって優れた「訓練場」です。 JD Cloud の見解では、大型モデルの価値は、サプライ チェーンを徹底的に理解し、大型モデルをサプライ チェーン上で「実行」できるようにすることによってのみ実現されます。
産業面での蓄積に加えて、基本的なアルゴリズムとコンピューティング能力における JD.com の強みを過小評価すべきではありません。
2021 年、JD Discovery Research Institute は、DGX SuperPOD アーキテクチャに基づく国内初の超大規模コンピューティング クラスターを重慶 - 天津 α で立ち上げました。これにより、推論の速度が 6.2 倍向上し、推論のコストが 90% 削減されました。これにより、JD.com は大規模なモデルのトレーニングに対する最も基本的な保証を提供します。
同年、JD.com は 10 億レベルのモデル K-PLUG を発売しました。K-PLUG によって生成された製品コピーは、JD.com の 3,000 以上のカテゴリをカバーし、合計 30 億語を生成し、マニュアル レビュー パスを生成しました。率は95%を超えています。 2022 年までに、JD.com の大規模モデルは数百億モデルの Vega にアップグレードされ、感情分析、意味の照合、文法的誤りの修正、インテリジェントな質問応答、常識などのさまざまな下流の自然言語処理タスクで広く使用できるようになります。推論。
これまでの蓄積のおかげで、JD.com は今年、さらなる技術的進歩を遂げ、コンテンツ生成、マンマシン対話、ユーザーの意図の理解、情報の抽出、感情の分類を実現し、ベースモデル + 垂直ドメインモデルの微調整を実現し、小売、物流、金融、健康、行政などの詳細な垂直シナリオを適用しました。
現在、JD.comに代表される大規模産業モデルは、蓄積された産業化されたシナリオベースのデータと知識を通じて大規模モデルをトレーニングし、蓄積された業界ノウハウに基づいて大規模モデルを修正し、大規模モデルのパフォーマンスを向上させています。特定の業界やアプリケーションシナリオでの使用を可能にし、制御性を向上させます。これはAIに関する「一般教養」を修了したことに相当します。
**京東のビッグモデルは、サプライチェーンのインテリジェンスレベルを向上させるために、徐々にさまざまな業界に深く浸透しています。逆に、サプライチェーンのデジタルインテリジェンスのアップグレードは産業変革も促進し、それが今度は大規模モデルにより豊富なデータ土壌を提供し、好循環を形成します。 **
「産業側から大型モデルに切り込むことは、技術的なエベレストを北斜面から登るようなものです。道はより困難ですが、より雄大な景色があります。京東は「難しくても正しいこと」を行うことを主張し、実践的なことを行うことを主張しています。 「価値があり、長期的な問題です。技術分野でも大型モデルでも、これは私たちの絶え間ない取り組みです。」と Xu Ran 氏は言いました。
** 「難しくて正しいこと」には長期的な積み重ねが必要です。しかし、産業モデルの構築という点では、JD.com が明らかに基礎を築きました。 **
業界で生まれた京東は、大型モデルで産業価値を創造します
「ビッグモデルの時代には、何でもビッグモデルでやり直す価値があります。」
大型モデルの波を受けて、業界はすぐに上記のコンセンサスに達しました。しかし、他の大手メーカーがさまざまな戦略を通じてビジネスモデルを模索している中、京東の水揚げ産業の方向性は変わっていません。
「産業特性は、JD.com のテクノロジーの際立った特徴です。JD.com が開発するすべてのテクノロジーは、産業ニーズ、産業シナリオでの経験に由来し、産業価値を生み出します。」と Xu Ran 氏は述べています。
現在、JD Yanxi の大規模モデルは「3 段階」戦略に従って進められており、現在、JD Cloud は内部慣行に基づいて汎用の大規模モデルを構築しており、今年末までに JD.堅実な業界サービス。2024 年初頭には、大規模なモデル機能が外部の深刻なビジネス シナリオに開放されることが予想されます。
実用的な観点から見ると、JD.com の大規模モデルは第 2 段階に到達しており、JD.com は大規模モデルの機能を小売、金融、物流、健康などの最も身近なシナリオに適用し、さまざまな分野に浸透しています。リンク。
たとえば、Jingdong は大型モデルを通じてインテリジェントな顧客サービスの能力を向上させています。カスタマーサービスの現場は、日常の雑談や会話とは異なり、現実世界の売り手と買い手の間のさまざまな複雑な問題を解決する必要がある、タスクベースの深刻な対話の場面です。
「ユーザーが ChatGPT に話しかけるとき、たとえ答えが間違っていても問題ありませんし、意思決定にも影響しません。しかし、深刻なビジネス シナリオで、インテリジェント カスタマー サービスが間違った答えをした場合、その結果は想像を絶するものになるでしょう。」したがって、答えの正確性は非常に重要です」と京東グループ技術委員会の曹鵬・京東クラウド事業部会長兼社長は述べた。
インテリジェントな顧客サービス シナリオを実現するために、JD.com は、基本的な意味の理解と質疑応答ロジックを備えた大規模なモデルを構築しただけでなく、特定のシナリオ向けに小規模なモデルも磨き上げました。顧客の問題に一般的な返品や交換などが含まれる場合、インテリジェントな顧客サービスは、より一般的な大型モデルを呼び出します。質問に特定の製品の保証ポリシーと価格保護ルールが含まれる場合、インテリジェントなカスタマー サービスは、よりターゲットを絞った小型モデルを呼び出して答えを出します。異なるモデルは異なる責任を担うことができます。
現在、スマート カスタマー サービスは JD.com 内で稼働しており、20,000 人を超える自社カスタマー サービス従業員がコストを削減して効率を向上させ、カスタマー サービス エクスペリエンスを継続的に最適化できるように支援しています。また、JD.com は、より多くの政府機関や企業がデジタルおよびインテリジェントな変革とアップグレードを実行できるよう、そのインテリジェントな顧客サービス機能を外部の世界に開放しました。
大型モデル向けの外部サービスに関しては、JD.com は依然として独自の「遅い」ペースを維持しており、大型モデルを企業に「販売」することを急いでいません。その理由は、人工知能は非常に深刻な技術変化であるためです。うまく使用すれば業界を変革することができますが、誤って使用すると重大な結果を招く可能性もあります。このような状況において、京東は長期的な考え方を堅持しており、素晴らしい選択です。
「JD.comは、『フルカラー、風味、味』を達成していない料理は提供しません。大規模モデルが主要な社内シーンでの経験と実践を完了した後、業界全体のコスト削減を支援するためにパートナーに公開されます」効率が向上します。」 Xu Ran エクスプレス。
京東の計画では、延西の大型モデルは最下位の技術サポートとなる。その分野はその能力に基づいて一連の製品を生み出し、同じ分野の製品がプラットフォームとして集約され、最終的に業界に価値を生み出します。
たとえば、コンテンツ生成の分野では、JD.com は JD Cloud AIGC コンテンツ マーケティング プラットフォームを構築しました。 JD.com のすべてのカテゴリに関する豊富な製品データの蓄積に基づいた大規模モデルは、製品の特性をより深く理解し、販売者が製品の写真、セールス ポイント、その他のマーケティング資料を自動的に生成するのに役立ち、販売者の業務効率とマーケティング コンテンツの品質を向上させることができます。
つまり、販売者は商品写真をアップロードするだけで、主要商品写真、マーケティングポスター写真、電子商取引運営に必要なビジネス詳細写真などの多種類の写真セットを迅速に取得でき、迅速なニーズに応えます。出店、商品リスト、マーケティング。これらの機能により、販売者は描画コストを 90% 節約し、生産サイクルを 7 日から半日に短縮できます。
より大規模なモデル機能を使用することで、販売者は独自の商品を販売する必要さえなくなり、JD Cloud のマルチモーダル デジタル ヒューマンを使用するだけで、24 時間低コストで商品を配送できます。
これらのアプリケーションに加え、JD.comは金融分野におけるAIマーケティング運用プラットフォームのデモも行った。ユーザーは簡単な対話を通じて、運営戦略の策定、マーケティングタスクのスケジューリング、活動ページの構築、マーケティングコピーライティングと資料の一括生成、デジタル配信などをカバーするマーケティング活動をワンストップで生成できます。 JD.com の関連データによると、以前はこの一連のプロセスに製品、研究開発、アルゴリズム、設計、アナリストという 5 種類の機能担当者が必要でしたが、現在では 1 名に減りました。人間とコンピューターのやり取りは 2,000 回必要でしたが、それも 50 回未満に削減されました。大型モデル機能のサポートにより、マーケティング プランの生産効率が大幅に向上しました。
** JD.com の大規模産業モデルは、さまざまな業界における産業アプリケーションの基盤になりつつあると言えます。現在、小売、物流、健康、産業、製造、金融、マーケティングなどの業界に浸透し、産業および実用化に至っています。 **
大型モデルが暴走してから半年が経ち、メーカーは「大規模」や「高いパラメータ」では現実的な問題を解決できないことに気づきました。バブル期が終わり、大型モデルは業界に戻り、現実のシナリオに戻り、結局は現実的な問題を解決する必要があり、これが技術の最終目的地であり、大型モデルの健全な開発の始まりです。堅実な産業データとシナリオの実践を備えた企業が台頭し始めました。
明らかに、Jingdong Yanxi 大型モデルは産業価値の対極に向けて出発しました。