أصبح ChatGPT منتجًا استثنائيًا بلا شك في صناعة تكنولوجيا المعلومات العالمية.
باسم "الذكاء الاصطناعي العام" ، يتحدث مع البشر ، ويساعد الناس على صياغة رسائل البريد الإلكتروني ورسائل المحامين ، ويجيب على بعض الأسئلة الفلسفية النهائية الباطنية ، ويكتب كود Python القابل للاستخدام ، ويجيب على بعض الأسئلة التي يبدو أنها تتطلب منطقًا معقدًا وتقدميًا ، ويكتب سيناريو فيلمًا يعتمد على بعض إعدادات الشخصية ، ويكتب قصيدة حب جميلة ، ويلتقط مهام أطروحة لطلاب الجامعات ... قال بيل جيتس إن أهمية ظهور ChatGPT "لا تقل عن ولادة الإنترنت". قال الرئيس التنفيذي لشركة Microsoft Satya Nadella إنه يمكن مقارنته بالثورة الصناعية. هتف المتحمسون الشفويون للذكاء الاصطناعي مرة أخرى بأن "التفرد" قادم ، والناس العاديون قلقون مرة أخرى من أن وظائفهم سيتم استبدالها بمساعدين AI من جميع النواحي مثل ChatGPT ... النضج ، هذا حقًا شيء يجعل الذكاء الاصطناعي سعيدًا.
لقد استخدمت ChatGPT للقيام بالعديد من الأشياء التي لا توصف ، ووجدت أنها ليست مفيدة دائمًا ، ولكنها يمكن أن تقدم إجابات وحلول أفضل لبعض المشكلات التي تبدو أكثر صعوبة. على سبيل المثال ، إذا سألت ما إذا كان بإمكان BYD التغلب على Tesla ، فقد تقدم بعض العبارات الواضحة وغير الملحوظة مع العديد من المغالطات الواقعية وبدون شخصية ؛ ولكن إذا سألتها كيف ستغير القيادة المستقلة التصميم الصناعي للسيارة ، فيمكنها تقديم مناقشة مليئة بالخيال من الداخل إلى الخارج من حيث ابتكار الهيكل ، والتغييرات الداخلية ، والترفيه الرقمي ، واختراقات المظهر. بشكل عام ، فإن ChatGPT غير كامل تمامًا ، لا سيما من حيث تقديم دقة مقنعة ، ولكنه غالبًا ما يفاجئ البشر في مجالات مثل تقديم خطاب معلومات منظم ، وفتح الخيال وتحرير الإبداع. لا يمكنك تحديد الاستخدام المحدد الذي يوفره لك ، ولكن يمكن أن يساعدك في تحقيق وإكمال بعض الأشياء التافهة والزائدة عن الحاجة وحتى الإبداعية.
إنها عبارة عن ChatGPT تبدو عديمة الفائدة ولكنها مفيدة ، والتي تبدو مفيدة ولكنها غير مجدية ، والتي دفعت شركتها الأم OpenAI لتلقي استثمار إضافي يزيد عن 10 مليار دولار أمريكي من Microsoft. استغرق الأمر يومين لاختراق مليون مستخدم ، واستغرق Facebook 305 يومًا ؛ الشبكة العصبية واسعة النطاق التي تحتوي على 175 مليار معلمة - عندما يتم ترخيصها بشكل تفضيلي لشركة Microsoft لدمج برامج المكتب وخدمات محرك البحث لدينا ، مثل Office.
لكن هذا يكفي لجعل حيدات الذكاء الاصطناعي في الصين تشعر بالغيرة.
مع 500 موظف ، فإن التقييم الإجمالي للشركة يقترب من 30 مليار دولار أمريكي. هذا هو OpenAI ؛ مع وجود الآلاف من الأشخاص ، يبلغ تقييم الشركة / القيمة السوقية في أحسن الأحوال 1-2 مليار دولار أمريكي. هذا عدد من "عمالقة الذكاء الاصطناعي" في الصين.
بسبب الفجوة الهائلة بين الكفاءة البشرية والقيمة ، وبسبب التأثير المفاجئ لـ ChatGPT على المجتمع الحقيقي لجميع البشر ، حفز ولادة ChatGPT مجال الذكاء الاصطناعي في الصين بشكل كبير. قفز الكثير من الناس مرة أخرى ، وشعروا أن الفجوة بين الصين والولايات المتحدة في الذكاء الاصطناعي قد اتسعت بشكل أكبر ، ولا يزال أمام الصين طريق طويل للحاق بهذه الموجة. وهناك أيضًا بعض الأشخاص الذين يحرصون على مناقشة سبب عدم امتلاك الصين لبرنامج ChatGPT الخاص بها ، وما زال الاستنتاج هو أن "الصين تفتقر إلى التربة اللازمة للابتكار" و "شركات الإنترنت الصينية منخرطة في البث المباشر والتسوق من البقالة" ، وهما غير مسؤول وجاهل بالحقائق.
لا تشارك جميع شركات الإنترنت الصينية في البث المباشر والتسوق من البقالة ، فهي تعمل في تطوير أشباه الموصلات ، وأبحاث نموذج الذكاء الاصطناعي ، والقيادة الذاتية.كما تحظى شركات الإنترنت الأمريكية بشعبية كبيرة في البث المباشر ، والتسوق من البقالة ، وخاصة تمويل الإنترنت.
بصفتها شركة الإنترنت الصينية التي تمتلك أكبر قدر من التراكم في مجال الذكاء الاصطناعي والمعالجة الدلالية الطبيعية ، تعمل Baidu على نموذجها الكبير للتعلم العميق "Paddle Paddle" (Paddle Paddle) على مدار السنوات الخمس الماضية ، حتى أنها استخدمت شريحة الذكاء الاصطناعي العامة الخاصة بها "Kunlun Core" لتدريب نموذجها الخاص - فهي البيئة الأساسية والمقدمة لشركة BaidGPT لتدريب "خاصتها". لدى Alibaba و ByteDance و Didi أيضًا نماذج تدريب دلالية طبيعية بناءً على احتياجاتهم الخاصة. يمكن القول أنه فيما يتعلق بتدريب النماذج الدلالية الطبيعية المعقدة مع عشرات المليارات من المعلمات ، فإن الشركات والمؤسسات البحثية الصينية ليست ضعيفة ، ونقطة انطلاقها ليست أقل من نظيراتها الأمريكية - على الأقل حوالي عام 2016. في السنوات الأخيرة ، لم تعد الفجوة بين دوائر الذكاء الاصطناعي الصينية والأمريكية في مجال النماذج الكبيرة مسألة وعي ونقطة انطلاق وقدرة ، بل مسألة طرق وأساليب.
الفجوة بين الصين والولايات المتحدة في مجال نماذج الحوار بين الإنسان والحاسوب التي تشبه ChatGPT لا تنتج عن ما يسمى التنظيم. إذا كان لديك تبادلات صريحة مع ChatGPT حول بعض القضايا الدينية والثقافية والعرقية والجيوسياسية الأكثر ثراءً ، فسوف تدرك أنه وراء رفضها الظاهري ومناقشتها الحكيمة لهذه القضايا ، هناك اتجاهات مواقف معينة تتطابق بشكل دقيق مع القيم السائدة المعترف بها عمومًا في المجتمع الأمريكي. يمكن القول أنه بالنسبة لأي نموذج معقد من الدلالات الطبيعية ، فإن عملية بناء النموذج ، وجمع الجسم ، والتدريب ، وتعديل المعلمة هي عملية "مراجعة المحتوى" بناءً على نظام قيم محدد ، وجميعهم لديهم وعي بالحفاظ على نظام قيمهم. إنها ليست مسألة ما إذا كان ينبغي لنا أن "نولد" مكانة قيمة للصين في النموذج الدلالي الطبيعي ، ولكن كيف يجب أن يتم إنشاؤها من أجل التحقق والتوازن حقًا من النظرة العالمية والهيمنة الثقافية التي تهيمن اللغة الإنجليزية على مجموعة الإنترنت العالمية ، وتعزيز وزن معايير فهم اللغة الصينية في نظام المعالجة الدلالي الطبيعي العالمي ، وتوفير التنوع الثقافي لتطوير الذكاء الاصطناعي والحوار بين الإنسان والكمبيوتر في العالم.
كما أنني أختلف بشدة مع العبارة القائلة بأن جودة معلومات الإنترنت الصينية سيئة للغاية وأن مصدر نموذج نموذج ChatGPT الصيني "ملوث" ، وهذا أيضًا حكم كسول وذكي. نظرًا للكم الإجمالي من المعلومات على الإنترنت ، فإن المحتوى الإنجليزي هو بلا شك الأكثر شيوعًا في العالم ، والمحتوى المتطرف للجودة المقلقة هو أيضًا الأكثر أهمية ، وكل ذلك سيؤثر على عملية ونتائج تدريب النموذج الدلالي الطبيعي. في التدريب المبكر ، أعطت ChatGPT الأولوية للمحتوى الذي نال استحسانًا كبيرًا في المنتدى الاجتماعي Reddit بجودة محتوى عالية ، والتي لها اتجاه محدد لاختيار المجموعة. إذا أعطت الصين الأولوية لمجتمعات المعرفة مثل Zhihu و Dede ، وأعطت وسائل الإعلام الرئيسية الأولوية لمجموعة النماذج الدلالية ، فلن تكون هناك مشكلة تلوث الجسم. ناهيك عن إتقان اللغة الأجنبية واتساع نطاق القراءة لمعظم الناس الذين يعتقدون أن "جودة المحتوى الصيني منخفض" لا يكفي لدعم استنتاجاتهم.
ولكن على أي حال ، فإن ولادة ChatGPT هي في الواقع نوع من التحفيز والتحدي المفاهيمي بالنسبة لي ، الذي ظل يدعو إلى "وداع عبادة وادي السيليكون" لسنوات عديدة.
هذا ليس لأنني أعتقد أن الفجوة بين الصين والولايات المتحدة في مجال الذكاء الاصطناعي قد اتسعت ، ولكن لأن نموذج حوار الذكاء الاصطناعي العام بين الإنسان والكمبيوتر مثل ChatGPT هو أداة يمكنها حقًا تعزيز التعاون في الإنتاج الاجتماعي والحضارة من منظور جميع البشر - بدلاً من مجال أو صناعة معينة. أهميته أكبر من ظهور الإنترنت عبر الهاتف المحمول ، مقارنة بولادة البريد الإلكتروني ومحركات البحث. بصفتها قوة ذكاء اصطناعي ، لم تعد الصين دولة ذات صناعة تكنولوجيا معلومات ضعيفة عندما ولدت رسائل البريد الإلكتروني ومحركات البحث. ومع ذلك ، لم نسمح لهذا النوع من ابتكارات الذكاء الاصطناعي العامة التي يمكن أن تؤثر على تقدم الحضارة البشرية أن تحدث لأول مرة في الصين ، وقمنا بتدريب نموذج تم بناء مجموعته الأساسية من الثقافة الصينية ونظام القيم.
علاوة على ذلك ، تعتمد طريقة تدريب نموذج ChatGPT إلى حد كبير على ترقية المعلمة لـ "تقوية المعجزات" ، والتدريب المتكرر ، والتحسين التكراري المستمر للنموذج بناءً على ردود الفعل من المحتوى الذي تم إنشاؤه - كانت هذه في الأصل طريقة العمل التي كان الفريق الصيني الأفضل فيها. عندما تستخدم شركة أمريكية ناشئة الأموال التي تم جمعها من Microsoft لاستثمار تكاليف طاقة حوسبة ضخمة بأي ثمن ، وتوظف عددًا كبيرًا من العاملين في مجال البيانات في إفريقيا والشرق الأوسط لتصنيف المعلومات ، وتستخدم التكرارات الأكثر كفاءة لإجراء "سباق تسلح" مع عمالقة مثل Google لنماذج المعالجة الدلالية المطورة ذاتيًا ، فلا يزال لديك شعور غير واقعي للغاية - سواء كانت شركة سان فرانسيسكو أو شركة شنتشن.
كان يجب أن يكون نموذج المعالجة الدلالية الطبيعية مثل ChatGPT قد وُلد في الصين لكنه لم يولد في الصين.السبب يجب أن يبدأ بشركات التكنولوجيا الصينية العاملة في مجال الذكاء الاصطناعي - بغض النظر عما تفعله الشركات العملاقة أو الشركات الناشئة هذه السنوات.
المشكلة التي قد لا يدركها الكثير من الناس هي أن نموذج المعالجة الدلالية الطبيعية واسع النطاق للأغراض العامة مثل ChatGPT من المرجح أن ينتج المعجزات عندما يتم بناؤه من قبل شركة ناشئة تعمل بالذكاء الاصطناعي ، وعادة لا يتم تحقيق نتائج أفضل داخل عملاق التكنولوجيا. هذا هو السبب في أن نموذج تطبيق حوار LaMDA من Google و Bard ، الذي اندفع مؤخرًا إلى المعركة ، لم يتألق ، وهو أيضًا التحدي الذي سيواجهه Baidu حتمًا بعد ذلك.
لماذا؟ الأول هو أن نمذجة المعالجة الدلالية الطبيعية العامة باهظة الثمن. في الواقع ، لا يعد حرق الأموال عادةً مهارة الشركات الكبرى ، بل هو امتياز للشركات الناشئة. عمالقة التكنولوجيا جميعهم تقريبًا شركات مدرجة.يستثمر استثمار عشرات المليارات من الدولارات في شيء لن يحقق عوائد لفترة طويلة.الضغط على المدير المالي في مواجهة مجلس الإدارة واجتماعات المساهمين مرتفع جدًا ، وغالبًا ما يتم معاقبتهم بسعر السهم.هذا يجعل الشركات الكبيرة لا تجرؤ على تحمل مخاطر كبيرة. بدون مخاطر كبيرة ، لن يكون هناك تكرارات كبيرة. ما هو "صنع المعجزات بقوة"؟ هو إنفاق الكثير من المال وبذل جهود كبيرة أولاً ، ثم الدعاء من أجل حدوث المعجزات ، بدلاً من الإذعان لحدوث معجزة ، ثم تقرر إنفاق الأموال وبذل جهود كبيرة.
لسوء الحظ ، يمكن أن تكون الشركات الكبرى هي الأخيرة فقط. هذا هو السبب في أن Microsoft ، التي استفادت كثيرًا من ChatGPT ، تجرأت فقط على البدء من 1 مليار دولار في البداية ، والتي استمرت أربع سنوات ، حتى 10 مليارات دولار هذا العام ، واستمرت في زيادة الاستثمار واحدًا تلو الآخر لدعم OpenAI في Microsoft "في المختبر" ، تدريب نموذج GPT لسنوات عديدة. تتمتع الأسهم التي حصلت عليها Microsoft من خلال الاستثمار في OpenAI بأولوية دمج قدرة نموذج ChatGPT في مكتبها ومحركات البحث الخاصة بها. قد لا يكون من السهل تحديد ما إذا كانت ستأكل OpenAI في المستقبل ، ولكن على الأقل Microsoft ، التي تبلغ قيمتها السوقية ما يقرب من تريليون دولار أمريكي ودخلها السنوي بعشرات المليارات من الدولارات الأمريكية ، لا تجرؤ مطلقًا على "صنع المعجزات وتدريب هذا النموذج في البداية بقوة".
ثانيًا ، لأن الناس أقل تسامحًا مع انخراط عمالقة التكنولوجيا في الابتكار ، وأكثر تسامحًا مع الأخطاء والانحرافات في الشركات الناشئة. من أجل التعامل مع ضغط ChatGPT ، أطلقت Google على عجل النسخة التجريبية للحوار بين الإنسان والحاسوب Bard. ووجد أن بعض الحوارات بها أخطاء واقعية أساسية ، لذلك تم تضخيمها بلا حدود ، وتبخرت القيمة السوقية لمئات المليارات من الدولارات بين عشية وضحاها. في الواقع ، ليس الأمر أن Google لا تعرف هذا ، وإذا لم يتم دفعها بسرعة ، فلن يكون الأمر متسرعًا. يحتوي نموذج LaMDA الذي أعلنت عنه Google في عام 2021 على مستويات معلمات وقدرات بحث عن المعلومات أعلى بكثير من GPT-3 التي دربتها OpenAI في ذلك الوقت ، لكن Google كانت مترددة في اختبار تأثيرها علنًا لأنها تخشى ارتكاب أخطاء ، مما يتسبب في عدم ثقة الجمهور وانخفاض أسعار الأسهم.
ما تهتم به Google ، لا تهتم شركة OpenAI به. منذ اليوم الأول لإصدار ChatGPT ، صرحت علنًا أنها لا تمتلك إمكانيات لاستعادة المعلومات ، وأن مجموعتها حتى ديسمبر 2021 فقط. لا يمكنها الإجابة على العديد من الأسئلة حول القيم والأحكام الأخلاقية ، وغالبًا ما ترتكب أخطاء واقعية. قبل المختبرين بتسامح "الأداء السيئ" الذاتي لـ ChatGPT ، وقد اندهشوا من قدرتها في ترابط المعلومات ، والتعبير العاطفي ، والبنية المنطقية ، وتماسك التفكير في مجالات البرمجة ، والإبداع الأدبي ، والكتابة المنسقة ، والاستشارة الطبية ، وتجاهلوا الأخطاء التي ارتكبتها.
في مارس 2019 ، بعد النجاح غير المسبوق لنموذج GPT-2 ، قررت شركة OpenAI البالغة من العمر أربع سنوات التحول من مؤسسة غير ربحية إلى شركة تجارية. بعد كل شيء ، لا يمكن لأي مؤسسة تحمل الراتب السنوي لكبير علماءها البالغ 1.5 مليون دولار. في مايو 2019 ، أصبح Sam Altman (Sam Altman) الرئيس التنفيذي لشركة OpenAI. بعد ذلك ، تلقت شركة OpenAI استثمارًا بقيمة مليار دولار من Microsoft. في مايو 2020 ، يحتوي نموذج GPT-3 الذي أطلقته شركة OpenAI على معلمات ارتفعت بشكل حاد من 1.5 مليار في GPT-2 إلى 175 مليارًا ، مما يشكل نظامًا تعليميًا آليًا قويًا بشكل غير مسبوق.
يمكن ملاحظة أن شركة ناشئة للذكاء الاصطناعي ولدت بملعقة ذهبية في فمها ، وجمعت مبلغًا ضخمًا من المال ، وتم دمجها مع الأعمال العملاقة ، وتشارك في بناء وتطوير نماذج دلالية طبيعية للذكاء الاصطناعي للأغراض العامة ، وتستثمر في تدريب النموذج بغض النظر عن التكلفة ، وهي الحالة الأكثر مثالية. تكفي العوائد الخيالية والتجارية التي تأتي مع أقوى النماذج لتحفيز Microsoft والمستثمرين الآخرين.
إذن ، لماذا لا يعمل هذا المنطق في الصين؟ هل تمتلك الصين يومًا نموذجًا قويًا للذكاء الاصطناعي الدلالي الطبيعي للأغراض العامة ، حتى لو كان مجرد نموذج أولي؟
للإجابة على هذا السؤال ، انظر إلى متى استثمرت Microsoft لأول مرة في OpenAI: يوليو 2019. بعد أربعة أشهر من رهان Microsoft على نموذج GPT الخاص بـ OpenAI ، أي في نوفمبر 2019 ، أعلن شين Xiangyang ، نائب الرئيس العالمي الأول لشركة Microsoft والمسؤول عن أعمال بحث Bing والشخص الأعلى المسؤول عن الذكاء الاصطناعي لشركة Microsoft ، وعالم كمبيوتر من هونج كونج ، الصين ، أنه ترك Microsoft لأكثر من 20 عامًا. وآخر مساهمة قدمها Shen Xiangyang في نموذج الذكاء الاصطناعي العام لشركة Microsoft هي روبوت الدردشة Xiaobing الذي طوره معهد Microsoft Asia Internet Engineering Institute في عام 2014.
في يوليو 2020 ، أصبحت Xiaoice مستقلة عن Microsoft وأصبحت شركة صينية ناشئة في مجال الذكاء الاصطناعي ، وعمل شين Xiangyang كرئيس لها ، وشغل Li Di ، نائب الرئيس التنفيذي السابق لأكاديمية Microsoft Asia Internet Engineering Academy ، منصب الرئيس التنفيذي. نمت Xiaoice إلى أكثر من الجيل السادس عندما أصبحت مستقلة ، وتشتمل أشكال منتجاتها على روبوتات ذكاء اصطناعي للمحادثة ، ومساعدين صوتيين أذكياء ، وموفري محتوى تم إنشاؤه بواسطة الذكاء الاصطناعي ، وسلسلة من الحلول الميدانية الرأسية. أثار Xiaoice ذات مرة نقاشًا عامًا ، بالإضافة إلى كونه روبوت دردشة مليئًا بالعواطف والجنس الأنثوي ، وله أيضًا أدائه المذهل في مجال إنشاء الشعر الصيني - فقد نشرت مجموعة من القصائد "Sunshine Lost the Glass Window" ، والتي نالت الكثير من المديح والمزيد من الجدل.
ليس هناك شك في أن روبوت XiaoIce الذي يمكنه كتابة القصائد وإجراء محادثات عاطفية بسيطة ومبنية على المنطق كان أفضل نموذج للذكاء الاصطناعي العام للمحادثة أداءً في العالم منذ بضع سنوات.
من المستحيل على الفريق بقيادة شين شيانغيانغ فهم البحث ، ناهيك عن الذكاء الاصطناعي. ورحيل شين شيانغيانغ عن "استقلال" مايكروسوفت وشياوبينغ ، إلى جانب استثمار ناديلا الرئيس التنفيذي لشركة مايكروسوفت وتعاونه مع شركة أوبن إيه آي ، هو في الواقع أكبر متداول في مجال الذكاء الاصطناعي في الصين والولايات المتحدة.إنفصال رسمي عن الطرق في مجال نماذج الذكاء الاصطناعي العامة.
إذن ، هل ما زال شياو بينغ يكتب الشعر اليوم؟ ماذا يفعل
في العامين الماضيين ، توقف شياوبينغ منذ فترة طويلة عن كتابة القصائد. إنه مشغول بالتسويق. أنشأت استوديو ألعاب لتوفير محتوى حوار مكتوب من NPC للألعاب ؛ تعاونت مع الألعاب الأولمبية الشتوية لتوفير نظام تسجيل مرئي لمهارات التزلج على الجليد الحر ؛ وقدمت معلومات Wind مع ملخصات نصية تم إنشاؤها بواسطة الذكاء الاصطناعي لإعلانات الشركات المدرجة ؛
باختصار ، في الماضي ، أصبح فريق الذكاء الاصطناعي الذي يمثل المستوى الأعلى من نموذج الذكاء الاصطناعي الدلالي الطبيعي العام ، ودعم الصينيون الهيكل بأكمله ، مورد ذكاء اصطناعي يمزج بين الذكاء الاصطناعي التوليدي والذكاء الاصطناعي لصنع القرار ويقدم حلولًا محددة لسيناريوهات محددة.
لا يمكنك القول إن هذا هو "سقط" زياوايس ، بعد كل شيء ، لقد جمع مئات الملايين من اليوان فقط من سوق رأس المال. وفقًا لطريقة تدريب نموذج ChatGPT ، سيتم إنفاق الأموال في يوم واحد. بدون حماية Microsoft ، يتعين على Xiaobing أن يعتني بحياته. ومع ذلك ، لم أسمع أبدًا عن Baidu أو Tencent أو ByteDance. فكرت في الاستثمار في Xiaoice ودعمها لمواصلة تطوير نموذج واسع النطاق للذكاء الاصطناعي الدلالي الطبيعي العام.
ليس فقط شياو بينغ. في السنوات القليلة الماضية ، كانت هناك أيضًا فرق ريادية أخرى في الصين تعمل في النمذجة التلقائية للذكاء الاصطناعي العام والحوسبة غير المتجانسة ، مما يسمح بتوصيل 7-8 أنواع من الرقائق في الداخل والخارج بالبرمجيات من خلال هذا النموذج. لم تُظهر المؤسسات الاستثمارية الصينية أبدًا اهتمامًا بنماذج الذكاء الاصطناعي العامة ، وحتى القليل من الخيال.
"أكثر من 85٪ من المستثمرين طلبوا منا تقديم سيناريو المنتج. قلنا إننا نساعد وحدة معالجة الرسومات على الاتصال بالنظام البيئي للبرمجيات ، وحتى Nvidia تستخدم نموذجنا. قال المستثمرون أن هذا ليس سيناريو. قلنا أن لدينا أيضًا عملاء ، وأبحاثًا حول الأقمار الصناعية ، والموانئ ، والمدن الذكية ، والصناعات الذكية. قالوا إن عملك مبعثر للغاية ، لذلك نحن لا نستثمر." هذا ما سمعته من رواد الأعمال الذين يصنعون نماذج عامة للذكاء الاصطناعي.
كما نعلم جميعًا ، يحب رأس المال الجريء في الصين "تثقيف" رواد الأعمال أكثر من غيرهم ، وبالطبع تثقيف العلماء الذين يشاركون في ريادة الأعمال في مجال الذكاء الاصطناعي. "يجب أن يكون لديك بعض البيانات في هذه الصناعة" ، هذه هي الجملة المفضلة لديهم لتثقيف رواد الأعمال في مجال الذكاء الاصطناعي.
هناك بيانات في صناعة معينة ، ومن الضروري التركيز على تقديم حلول في مجال مجزأ معين ، هذه هي عقلية معظم رأس المال المغامر والمشاريع الخاصة في الصين الذين يزعمون أنهم يستثمرون في الذكاء الاصطناعي. ثم ننظر إلى "ما هو حجم المشهد" ، مشهد الكاميرا الأمنية كبير بما يكفي ، وبالتالي يصبح نموذج التقييم بحجم الصين ، كم عدد الكاميرات التي يمكن تركيبها؟ كم سعر كل كاميرا؟ ما هو حجم لوحة الكاميرا الإجمالية؟ حسنًا ، اللوحة كبيرة بما يكفي ، وقد صوتنا في التقسيم الفرعي للكاميرا. دعونا نلقي نظرة على الخدمات اللوجستية الذكية للميناء مرة أخرى. كم عدد الموانئ الموجودة في الصين؟ كم عدد موانئ المياه العميقة؟ ما المبلغ الذي يمكن أن تدفعه كل محطة منفذ مقابل حلول الذكاء الاصطناعي؟ اتضح أننا دفعنا مثل هذا المبلغ الضئيل ، ويبدو أن مشهد "الميناء" ليس كبيرا بما يكفي ، لذلك لن نصوت. الذكاء الاصطناعي البشري الرقمي كخدمة العملاء؟ يمكن ربطه بالميتافيرس ، لديه قصة وخيال ، حسنًا ، يمكننا تجربته.
لذا ، ما تراه هو أن "النمور الأربعة" للذكاء الاصطناعي الصيني تعمل أساسًا في مجال الكاميرات والتعرف على الوجوه ، وقد أصبحوا جميعًا منفذين ومتكاملين لمشروع الذكاء الاصطناعي. ونموذج الأعمال هو نفسه نموذج Neusoft و iSoftStone قبل 30 عامًا.
لفترة طويلة من الزمن ، اعتقد عدد قليل من المستثمرين في مجال الذكاء الاصطناعي بصدق أنه يمكن إعادة استخدام نموذج عام في مختلف الصناعات. من حين لآخر ، هناك القليل ممن يتحلى بالصبر بعض الشيء ويهتمون بالنموذج العام ، وهم في الأساس أموال رنمينبي.صندوق الدولار الأمريكي غير مهتم حقًا بمحاولة الفريق الصيني لتطوير نموذج عام. هل تعتقد أنه من خلال مقارنة صعوبة ومستوى التدريب النموذجي لشركات مثل OpenAI و Google ، فإنهم يشعرون أن هناك فجوة بين الفريق الصيني في هذا الشأن؟ إذن أنت تفكر كثيرًا حقًا. إنهم يعرفون الوقت الذي يجري فيه تطوير نموذج GPT ، أي الشهرين الماضيين.
هؤلاء مديرو الاستثمار من الصف الأول الذين تفاخروا بأن "SenseTime و Megvii يبيعون الكاميرات الأمنية في عيني" ، هؤلاء الشركاء الاستثماريون من الصف الأول الذين أخبروا رواد الأعمال بفخر أن "نموذجك ليس مشهدًا" ، ناهيك عن شركاء صندوق الاستثمار بالدولار الأمريكي الذين بالكاد استثمروا في الذكاء الاصطناعي في التاريخ وكانوا يتلاعبون برواد الأعمال الصينيين "للذهاب إلى الخارج" للانخراط في عملة مشفرة وأعلنوا أنهم سيقدمون دعمًا مفاجئًا لرجال الأعمال في الصين لسنوات عديدة. ثم يمكنك التفكير في الأمر ، فوعودهم وتعجرفهم تحتوي على بعض الفهم والصدق لنموذج الذكاء الاصطناعي العام ، وبعضها تخمين وحساب.
يمكنك حتى التفكير في الأمر.قد يكلف تدريب النموذج الدلالي الفائق الطبيعي عشرات الملايين أو حتى مئات الملايين من الرنمينبي يوميًا ، ناهيك عن وحدة طاقة الحوسبة التي توفر تدريبًا كبيرًا على النموذج - أفضل GPU في العالم ، بسبب الحظر غير المعقول الذي تفرضه الولايات المتحدة. أصبح الحصول عليه أكثر وأكثر صعوبة. مع أسلوب سلوك وسلوك هؤلاء المستثمرين في السنوات العديدة الماضية ، يمكنهم الاستمرار لبضعة أيام ، ما مقدار الأموال التي يرغبون في إقناع لجنة الاستثمار بالاستثمار فيها ، أو يمكنهم مساعدة فرق ريادة الأعمال هذه في حل مشكلة GPU؟ ربما يومًا ما ، وربما بعد نصف عام ، سيبدأون في حث فرق النموذج العام هذه على "تحقيق التسويق التجاري في الحقول المقسمة" في أسرع وقت ممكن.
مع إصرار Baidu على الاستثمار في نموذج PaddlePaddle ، من المحتم أن تمارس هذه الصناعة النموذجية منذ البداية ، وتتابع التسويق في الصناعات المختلفة في أقرب وقت ممكن. إلى حد كبير ، فإن تدريب النماذج الكبيرة للذكاء الاصطناعي العام لديه "مثلث مستحيل" من البيانات الضخمة ، ومخرجات المحتوى عالية الجودة والإبداعية ، والتطبيقات الصناعية.
لتحقيق بيانات ضخمة وإخراج محتوى إبداعي عالي الجودة ، لا بد من عدم القدرة على تطبيقها بسرعة على التنفيذ المحدد لصناعة معينة - مثل ChatGPT.
إذا كنت ترغب في إنشاء سيناريوهات هبوط صناعي محددة في أكبر البيانات الجماعية التي أنشأها البشر على الإنترنت ، فلن تكون قادرًا بالتأكيد على تقديم نتائج عالية الجودة ، لأنه يجب أن يكون هناك تعارض بين إنشاء المحتوى بناءً على البيانات الجماعية وأنظمة اتخاذ القرار الدقيقة - هذا في الواقع مضيعة.
إذا كنت ترغب في تحقيق إنتاج محتوى عالي الجودة للمساعدة في اتخاذ قرارات دقيقة في سيناريوهات الهبوط الصناعي ، فيجب عليك التضحية بأكبر قدر من البيانات ، ولا يمكن أن تدعم البيانات التي تمتلكها السيناريوهات الصناعية الأكثر دقة تدريبًا وبحثًا حقيقيًا للنماذج واسعة النطاق. هذه هي المعضلة التي تواجهها معظم حلول الذكاء الاصطناعي في الصين اليوم ، وهي أيضًا السبب وراء كون ما يسمى "اقتراح الصناعة ChatGPT" خطأ.
هؤلاء رواد الأعمال والمستثمرون الذين يستعدون لدخول "تشات جي بي تي الصين" اليوم ، ناهيك عن مقدار المال وعدد وحدات معالجة الرسومات الموجودة في جيوبك ، نظرًا لأنك جميعًا على هذا القارب ، فأنت تشعر أنك تحمل تذكرة. أي ركن من "المثلث المستحيل" للذكاء الاصطناعي العام سوف تقرر التخلص منه؟ هذا سؤال يجب حله أولاً.
بعبارة أخرى ، ما المؤسسة الاستثمارية - سواء كانت مؤسسة استثمار مالي أو قسم استثمار لشركة كبيرة - لديها العزم على الاستثمار في تدريب النماذج الدلالية الطبيعية على نطاق واسع لعدة سنوات وتمديد دورة العائد إلى ما لا نهاية؟ بعد كل شيء ، يخبرنا التاريخ أن هذه مجموعة من الأشخاص هم الأقل تصميمًا والأكثر حرصًا على العثور على خليفة.
لم تفتقر الصين أبدًا إلى رواد الأعمال والعلماء البارزين ، ولا يُستثنى من ذلك مجال الذكاء الاصطناعي. يعد مستوى وتراكم شركات التكنولوجيا الصينية والأمريكية في مجال الذكاء الاصطناعي الأقرب في العالم ، فقبل بضع سنوات على الأقل لم تكن هناك فجوة كبيرة بين الصين والولايات المتحدة في بناء وتدريب النماذج الدلالية الطبيعية الكبيرة. ومع ذلك ، تفتقر الصين إلى بعض المؤسسات الاستثمارية والمستثمرين الذين لديهم رؤية أوسع ، ولا يتبعون آراء الآخرين ، ومصممون وبعيد النظر.
الأشخاص مثل شين شيانغيانغ ، لي دي ، ما ويينغ ، وانغ شياوتشوان ، ولي زيفي ، الذين خرجوا لبدء نماذج دلالية طبيعية عامة واسعة النطاق يمكن الاعتماد عليهم تمامًا ، لكن المشكلة هي أنهم بحاجة إلى تغيير مجموعة من المؤسسات الاستثمارية والمستثمرين الذين يدعمونهم.بعض المؤسسات الاستثمارية التي تكون جيدة جدًا في "ممارسة الألعاب" والمضاربة ، ومنغمسة جدًا في قائمة العملات المشفرة والمسارات الأخرى.
لكي نكون صادقين ، على الرغم من عدم وجود مؤسسات استثمارية جادة تبحث في نماذج الذكاء الاصطناعي العامة لسنوات عديدة ، لا تزال هناك بعض المؤسسات التي استثمرت في العديد من شركات الذكاء الاصطناعي بفترات سداد طويلة للغاية. على سبيل المثال ، ساهم هؤلاء المغامرون الذين استثمروا في حلول القيادة الذاتية والقيادة المحلية في الصين في إنشاء قدرة تنافسية جديدة للصين في التغييرات غير المسبوقة في صناعة السيارات العالمية خلال قرن من الزمان. على سبيل المثال ، هؤلاء المغامرون المستثمرون الذين استثمروا في وحدات معالجة الرسومات المحلية في الصين - من المقرر أن يكون هذا المسار مليئًا بالمخاطر ، ويواجه الحظر والقمع من الولايات المتحدة ، ودورة العودة طويلة للغاية ؛ ولكن هؤلاء اللاعبين المحليين الناشئين حديثًا في GPU - سواء كانوا Hanbo أو Biren أو غيرهم ، قد يقدمون ذخيرة لنموذج المعالجة الدلالي الطبيعي العام للصين في المستقبل. المستثمرون الذين يقفون وراءهم ، إذا اتخذوا يومًا ما قرارهم حقًا واتخذوا خطوة لدعم مشروع النموذج الدلالي الطبيعي الواسع النطاق في الصين ، فقد يكون لدي بعض التوقعات المختلفة والثقة فيهم.
الأمر فقط هو أنه لا يوجد الكثير من المستثمرين والمؤسسات الاستثمارية الذين لا يتفاخرون ولا يتراجعون ولا يندفعون لتحقيق النجاح السريع ، ولكن هناك عدد قليل جدًا. ومع ذلك ، يحتاج بناء النموذج الدلالي الطبيعي في الصين والتدريب إلى مثل هؤلاء المستثمرين والمؤسسات الاستثمارية - سواء كان ذلك مستثمرًا ماليًا أو مستثمرًا استراتيجيًا أو مؤسسة رأسمالية مدعومة بإرادة الدولة.
تحتاج الصين إلى أن يكون لديها نموذجها الدلالي الطبيعي الواسع النطاق للأغراض العامة. وهي بحاجة إلى أن يكون لديها رؤية لتوفير الحكمة الصينية ونظام القيم الصيني والحلول الصينية للذكاء الاصطناعي العالمي للأغراض العامة. وهي بحاجة إلى تجنب المخاطر والمسائل القانونية والأخلاقية والأخلاقية في العملية الكاملة لاختيار المجموعة ، وبناء النموذج والتدريب ، وتعديل المعلمات. كما تحتاج إلى التصميم والصبر.
على أي حال ، لا يمكن التكهن بذلك.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
من الذي يعيق برنامج ChatGPT الصيني؟
أصبح ChatGPT منتجًا استثنائيًا بلا شك في صناعة تكنولوجيا المعلومات العالمية.
باسم "الذكاء الاصطناعي العام" ، يتحدث مع البشر ، ويساعد الناس على صياغة رسائل البريد الإلكتروني ورسائل المحامين ، ويجيب على بعض الأسئلة الفلسفية النهائية الباطنية ، ويكتب كود Python القابل للاستخدام ، ويجيب على بعض الأسئلة التي يبدو أنها تتطلب منطقًا معقدًا وتقدميًا ، ويكتب سيناريو فيلمًا يعتمد على بعض إعدادات الشخصية ، ويكتب قصيدة حب جميلة ، ويلتقط مهام أطروحة لطلاب الجامعات ... قال بيل جيتس إن أهمية ظهور ChatGPT "لا تقل عن ولادة الإنترنت". قال الرئيس التنفيذي لشركة Microsoft Satya Nadella إنه يمكن مقارنته بالثورة الصناعية. هتف المتحمسون الشفويون للذكاء الاصطناعي مرة أخرى بأن "التفرد" قادم ، والناس العاديون قلقون مرة أخرى من أن وظائفهم سيتم استبدالها بمساعدين AI من جميع النواحي مثل ChatGPT ... النضج ، هذا حقًا شيء يجعل الذكاء الاصطناعي سعيدًا.
لقد استخدمت ChatGPT للقيام بالعديد من الأشياء التي لا توصف ، ووجدت أنها ليست مفيدة دائمًا ، ولكنها يمكن أن تقدم إجابات وحلول أفضل لبعض المشكلات التي تبدو أكثر صعوبة. على سبيل المثال ، إذا سألت ما إذا كان بإمكان BYD التغلب على Tesla ، فقد تقدم بعض العبارات الواضحة وغير الملحوظة مع العديد من المغالطات الواقعية وبدون شخصية ؛ ولكن إذا سألتها كيف ستغير القيادة المستقلة التصميم الصناعي للسيارة ، فيمكنها تقديم مناقشة مليئة بالخيال من الداخل إلى الخارج من حيث ابتكار الهيكل ، والتغييرات الداخلية ، والترفيه الرقمي ، واختراقات المظهر. بشكل عام ، فإن ChatGPT غير كامل تمامًا ، لا سيما من حيث تقديم دقة مقنعة ، ولكنه غالبًا ما يفاجئ البشر في مجالات مثل تقديم خطاب معلومات منظم ، وفتح الخيال وتحرير الإبداع. لا يمكنك تحديد الاستخدام المحدد الذي يوفره لك ، ولكن يمكن أن يساعدك في تحقيق وإكمال بعض الأشياء التافهة والزائدة عن الحاجة وحتى الإبداعية.
إنها عبارة عن ChatGPT تبدو عديمة الفائدة ولكنها مفيدة ، والتي تبدو مفيدة ولكنها غير مجدية ، والتي دفعت شركتها الأم OpenAI لتلقي استثمار إضافي يزيد عن 10 مليار دولار أمريكي من Microsoft. استغرق الأمر يومين لاختراق مليون مستخدم ، واستغرق Facebook 305 يومًا ؛ الشبكة العصبية واسعة النطاق التي تحتوي على 175 مليار معلمة - عندما يتم ترخيصها بشكل تفضيلي لشركة Microsoft لدمج برامج المكتب وخدمات محرك البحث لدينا ، مثل Office.
لكن هذا يكفي لجعل حيدات الذكاء الاصطناعي في الصين تشعر بالغيرة.
مع 500 موظف ، فإن التقييم الإجمالي للشركة يقترب من 30 مليار دولار أمريكي. هذا هو OpenAI ؛ مع وجود الآلاف من الأشخاص ، يبلغ تقييم الشركة / القيمة السوقية في أحسن الأحوال 1-2 مليار دولار أمريكي. هذا عدد من "عمالقة الذكاء الاصطناعي" في الصين.
بسبب الفجوة الهائلة بين الكفاءة البشرية والقيمة ، وبسبب التأثير المفاجئ لـ ChatGPT على المجتمع الحقيقي لجميع البشر ، حفز ولادة ChatGPT مجال الذكاء الاصطناعي في الصين بشكل كبير. قفز الكثير من الناس مرة أخرى ، وشعروا أن الفجوة بين الصين والولايات المتحدة في الذكاء الاصطناعي قد اتسعت بشكل أكبر ، ولا يزال أمام الصين طريق طويل للحاق بهذه الموجة. وهناك أيضًا بعض الأشخاص الذين يحرصون على مناقشة سبب عدم امتلاك الصين لبرنامج ChatGPT الخاص بها ، وما زال الاستنتاج هو أن "الصين تفتقر إلى التربة اللازمة للابتكار" و "شركات الإنترنت الصينية منخرطة في البث المباشر والتسوق من البقالة" ، وهما غير مسؤول وجاهل بالحقائق.
لا تشارك جميع شركات الإنترنت الصينية في البث المباشر والتسوق من البقالة ، فهي تعمل في تطوير أشباه الموصلات ، وأبحاث نموذج الذكاء الاصطناعي ، والقيادة الذاتية.كما تحظى شركات الإنترنت الأمريكية بشعبية كبيرة في البث المباشر ، والتسوق من البقالة ، وخاصة تمويل الإنترنت.
بصفتها شركة الإنترنت الصينية التي تمتلك أكبر قدر من التراكم في مجال الذكاء الاصطناعي والمعالجة الدلالية الطبيعية ، تعمل Baidu على نموذجها الكبير للتعلم العميق "Paddle Paddle" (Paddle Paddle) على مدار السنوات الخمس الماضية ، حتى أنها استخدمت شريحة الذكاء الاصطناعي العامة الخاصة بها "Kunlun Core" لتدريب نموذجها الخاص - فهي البيئة الأساسية والمقدمة لشركة BaidGPT لتدريب "خاصتها". لدى Alibaba و ByteDance و Didi أيضًا نماذج تدريب دلالية طبيعية بناءً على احتياجاتهم الخاصة. يمكن القول أنه فيما يتعلق بتدريب النماذج الدلالية الطبيعية المعقدة مع عشرات المليارات من المعلمات ، فإن الشركات والمؤسسات البحثية الصينية ليست ضعيفة ، ونقطة انطلاقها ليست أقل من نظيراتها الأمريكية - على الأقل حوالي عام 2016. في السنوات الأخيرة ، لم تعد الفجوة بين دوائر الذكاء الاصطناعي الصينية والأمريكية في مجال النماذج الكبيرة مسألة وعي ونقطة انطلاق وقدرة ، بل مسألة طرق وأساليب.
الفجوة بين الصين والولايات المتحدة في مجال نماذج الحوار بين الإنسان والحاسوب التي تشبه ChatGPT لا تنتج عن ما يسمى التنظيم. إذا كان لديك تبادلات صريحة مع ChatGPT حول بعض القضايا الدينية والثقافية والعرقية والجيوسياسية الأكثر ثراءً ، فسوف تدرك أنه وراء رفضها الظاهري ومناقشتها الحكيمة لهذه القضايا ، هناك اتجاهات مواقف معينة تتطابق بشكل دقيق مع القيم السائدة المعترف بها عمومًا في المجتمع الأمريكي. يمكن القول أنه بالنسبة لأي نموذج معقد من الدلالات الطبيعية ، فإن عملية بناء النموذج ، وجمع الجسم ، والتدريب ، وتعديل المعلمة هي عملية "مراجعة المحتوى" بناءً على نظام قيم محدد ، وجميعهم لديهم وعي بالحفاظ على نظام قيمهم. إنها ليست مسألة ما إذا كان ينبغي لنا أن "نولد" مكانة قيمة للصين في النموذج الدلالي الطبيعي ، ولكن كيف يجب أن يتم إنشاؤها من أجل التحقق والتوازن حقًا من النظرة العالمية والهيمنة الثقافية التي تهيمن اللغة الإنجليزية على مجموعة الإنترنت العالمية ، وتعزيز وزن معايير فهم اللغة الصينية في نظام المعالجة الدلالي الطبيعي العالمي ، وتوفير التنوع الثقافي لتطوير الذكاء الاصطناعي والحوار بين الإنسان والكمبيوتر في العالم.
كما أنني أختلف بشدة مع العبارة القائلة بأن جودة معلومات الإنترنت الصينية سيئة للغاية وأن مصدر نموذج نموذج ChatGPT الصيني "ملوث" ، وهذا أيضًا حكم كسول وذكي. نظرًا للكم الإجمالي من المعلومات على الإنترنت ، فإن المحتوى الإنجليزي هو بلا شك الأكثر شيوعًا في العالم ، والمحتوى المتطرف للجودة المقلقة هو أيضًا الأكثر أهمية ، وكل ذلك سيؤثر على عملية ونتائج تدريب النموذج الدلالي الطبيعي. في التدريب المبكر ، أعطت ChatGPT الأولوية للمحتوى الذي نال استحسانًا كبيرًا في المنتدى الاجتماعي Reddit بجودة محتوى عالية ، والتي لها اتجاه محدد لاختيار المجموعة. إذا أعطت الصين الأولوية لمجتمعات المعرفة مثل Zhihu و Dede ، وأعطت وسائل الإعلام الرئيسية الأولوية لمجموعة النماذج الدلالية ، فلن تكون هناك مشكلة تلوث الجسم. ناهيك عن إتقان اللغة الأجنبية واتساع نطاق القراءة لمعظم الناس الذين يعتقدون أن "جودة المحتوى الصيني منخفض" لا يكفي لدعم استنتاجاتهم.
ولكن على أي حال ، فإن ولادة ChatGPT هي في الواقع نوع من التحفيز والتحدي المفاهيمي بالنسبة لي ، الذي ظل يدعو إلى "وداع عبادة وادي السيليكون" لسنوات عديدة.
هذا ليس لأنني أعتقد أن الفجوة بين الصين والولايات المتحدة في مجال الذكاء الاصطناعي قد اتسعت ، ولكن لأن نموذج حوار الذكاء الاصطناعي العام بين الإنسان والكمبيوتر مثل ChatGPT هو أداة يمكنها حقًا تعزيز التعاون في الإنتاج الاجتماعي والحضارة من منظور جميع البشر - بدلاً من مجال أو صناعة معينة. أهميته أكبر من ظهور الإنترنت عبر الهاتف المحمول ، مقارنة بولادة البريد الإلكتروني ومحركات البحث. بصفتها قوة ذكاء اصطناعي ، لم تعد الصين دولة ذات صناعة تكنولوجيا معلومات ضعيفة عندما ولدت رسائل البريد الإلكتروني ومحركات البحث. ومع ذلك ، لم نسمح لهذا النوع من ابتكارات الذكاء الاصطناعي العامة التي يمكن أن تؤثر على تقدم الحضارة البشرية أن تحدث لأول مرة في الصين ، وقمنا بتدريب نموذج تم بناء مجموعته الأساسية من الثقافة الصينية ونظام القيم.
علاوة على ذلك ، تعتمد طريقة تدريب نموذج ChatGPT إلى حد كبير على ترقية المعلمة لـ "تقوية المعجزات" ، والتدريب المتكرر ، والتحسين التكراري المستمر للنموذج بناءً على ردود الفعل من المحتوى الذي تم إنشاؤه - كانت هذه في الأصل طريقة العمل التي كان الفريق الصيني الأفضل فيها. عندما تستخدم شركة أمريكية ناشئة الأموال التي تم جمعها من Microsoft لاستثمار تكاليف طاقة حوسبة ضخمة بأي ثمن ، وتوظف عددًا كبيرًا من العاملين في مجال البيانات في إفريقيا والشرق الأوسط لتصنيف المعلومات ، وتستخدم التكرارات الأكثر كفاءة لإجراء "سباق تسلح" مع عمالقة مثل Google لنماذج المعالجة الدلالية المطورة ذاتيًا ، فلا يزال لديك شعور غير واقعي للغاية - سواء كانت شركة سان فرانسيسكو أو شركة شنتشن.
كان يجب أن يكون نموذج المعالجة الدلالية الطبيعية مثل ChatGPT قد وُلد في الصين لكنه لم يولد في الصين.السبب يجب أن يبدأ بشركات التكنولوجيا الصينية العاملة في مجال الذكاء الاصطناعي - بغض النظر عما تفعله الشركات العملاقة أو الشركات الناشئة هذه السنوات.
المشكلة التي قد لا يدركها الكثير من الناس هي أن نموذج المعالجة الدلالية الطبيعية واسع النطاق للأغراض العامة مثل ChatGPT من المرجح أن ينتج المعجزات عندما يتم بناؤه من قبل شركة ناشئة تعمل بالذكاء الاصطناعي ، وعادة لا يتم تحقيق نتائج أفضل داخل عملاق التكنولوجيا. هذا هو السبب في أن نموذج تطبيق حوار LaMDA من Google و Bard ، الذي اندفع مؤخرًا إلى المعركة ، لم يتألق ، وهو أيضًا التحدي الذي سيواجهه Baidu حتمًا بعد ذلك.
لماذا؟ الأول هو أن نمذجة المعالجة الدلالية الطبيعية العامة باهظة الثمن. في الواقع ، لا يعد حرق الأموال عادةً مهارة الشركات الكبرى ، بل هو امتياز للشركات الناشئة. عمالقة التكنولوجيا جميعهم تقريبًا شركات مدرجة.يستثمر استثمار عشرات المليارات من الدولارات في شيء لن يحقق عوائد لفترة طويلة.الضغط على المدير المالي في مواجهة مجلس الإدارة واجتماعات المساهمين مرتفع جدًا ، وغالبًا ما يتم معاقبتهم بسعر السهم.هذا يجعل الشركات الكبيرة لا تجرؤ على تحمل مخاطر كبيرة. بدون مخاطر كبيرة ، لن يكون هناك تكرارات كبيرة. ما هو "صنع المعجزات بقوة"؟ هو إنفاق الكثير من المال وبذل جهود كبيرة أولاً ، ثم الدعاء من أجل حدوث المعجزات ، بدلاً من الإذعان لحدوث معجزة ، ثم تقرر إنفاق الأموال وبذل جهود كبيرة.
لسوء الحظ ، يمكن أن تكون الشركات الكبرى هي الأخيرة فقط. هذا هو السبب في أن Microsoft ، التي استفادت كثيرًا من ChatGPT ، تجرأت فقط على البدء من 1 مليار دولار في البداية ، والتي استمرت أربع سنوات ، حتى 10 مليارات دولار هذا العام ، واستمرت في زيادة الاستثمار واحدًا تلو الآخر لدعم OpenAI في Microsoft "في المختبر" ، تدريب نموذج GPT لسنوات عديدة. تتمتع الأسهم التي حصلت عليها Microsoft من خلال الاستثمار في OpenAI بأولوية دمج قدرة نموذج ChatGPT في مكتبها ومحركات البحث الخاصة بها. قد لا يكون من السهل تحديد ما إذا كانت ستأكل OpenAI في المستقبل ، ولكن على الأقل Microsoft ، التي تبلغ قيمتها السوقية ما يقرب من تريليون دولار أمريكي ودخلها السنوي بعشرات المليارات من الدولارات الأمريكية ، لا تجرؤ مطلقًا على "صنع المعجزات وتدريب هذا النموذج في البداية بقوة".
ثانيًا ، لأن الناس أقل تسامحًا مع انخراط عمالقة التكنولوجيا في الابتكار ، وأكثر تسامحًا مع الأخطاء والانحرافات في الشركات الناشئة. من أجل التعامل مع ضغط ChatGPT ، أطلقت Google على عجل النسخة التجريبية للحوار بين الإنسان والحاسوب Bard. ووجد أن بعض الحوارات بها أخطاء واقعية أساسية ، لذلك تم تضخيمها بلا حدود ، وتبخرت القيمة السوقية لمئات المليارات من الدولارات بين عشية وضحاها. في الواقع ، ليس الأمر أن Google لا تعرف هذا ، وإذا لم يتم دفعها بسرعة ، فلن يكون الأمر متسرعًا. يحتوي نموذج LaMDA الذي أعلنت عنه Google في عام 2021 على مستويات معلمات وقدرات بحث عن المعلومات أعلى بكثير من GPT-3 التي دربتها OpenAI في ذلك الوقت ، لكن Google كانت مترددة في اختبار تأثيرها علنًا لأنها تخشى ارتكاب أخطاء ، مما يتسبب في عدم ثقة الجمهور وانخفاض أسعار الأسهم.
ما تهتم به Google ، لا تهتم شركة OpenAI به. منذ اليوم الأول لإصدار ChatGPT ، صرحت علنًا أنها لا تمتلك إمكانيات لاستعادة المعلومات ، وأن مجموعتها حتى ديسمبر 2021 فقط. لا يمكنها الإجابة على العديد من الأسئلة حول القيم والأحكام الأخلاقية ، وغالبًا ما ترتكب أخطاء واقعية. قبل المختبرين بتسامح "الأداء السيئ" الذاتي لـ ChatGPT ، وقد اندهشوا من قدرتها في ترابط المعلومات ، والتعبير العاطفي ، والبنية المنطقية ، وتماسك التفكير في مجالات البرمجة ، والإبداع الأدبي ، والكتابة المنسقة ، والاستشارة الطبية ، وتجاهلوا الأخطاء التي ارتكبتها.
في مارس 2019 ، بعد النجاح غير المسبوق لنموذج GPT-2 ، قررت شركة OpenAI البالغة من العمر أربع سنوات التحول من مؤسسة غير ربحية إلى شركة تجارية. بعد كل شيء ، لا يمكن لأي مؤسسة تحمل الراتب السنوي لكبير علماءها البالغ 1.5 مليون دولار. في مايو 2019 ، أصبح Sam Altman (Sam Altman) الرئيس التنفيذي لشركة OpenAI. بعد ذلك ، تلقت شركة OpenAI استثمارًا بقيمة مليار دولار من Microsoft. في مايو 2020 ، يحتوي نموذج GPT-3 الذي أطلقته شركة OpenAI على معلمات ارتفعت بشكل حاد من 1.5 مليار في GPT-2 إلى 175 مليارًا ، مما يشكل نظامًا تعليميًا آليًا قويًا بشكل غير مسبوق.
يمكن ملاحظة أن شركة ناشئة للذكاء الاصطناعي ولدت بملعقة ذهبية في فمها ، وجمعت مبلغًا ضخمًا من المال ، وتم دمجها مع الأعمال العملاقة ، وتشارك في بناء وتطوير نماذج دلالية طبيعية للذكاء الاصطناعي للأغراض العامة ، وتستثمر في تدريب النموذج بغض النظر عن التكلفة ، وهي الحالة الأكثر مثالية. تكفي العوائد الخيالية والتجارية التي تأتي مع أقوى النماذج لتحفيز Microsoft والمستثمرين الآخرين.
إذن ، لماذا لا يعمل هذا المنطق في الصين؟ هل تمتلك الصين يومًا نموذجًا قويًا للذكاء الاصطناعي الدلالي الطبيعي للأغراض العامة ، حتى لو كان مجرد نموذج أولي؟
للإجابة على هذا السؤال ، انظر إلى متى استثمرت Microsoft لأول مرة في OpenAI: يوليو 2019. بعد أربعة أشهر من رهان Microsoft على نموذج GPT الخاص بـ OpenAI ، أي في نوفمبر 2019 ، أعلن شين Xiangyang ، نائب الرئيس العالمي الأول لشركة Microsoft والمسؤول عن أعمال بحث Bing والشخص الأعلى المسؤول عن الذكاء الاصطناعي لشركة Microsoft ، وعالم كمبيوتر من هونج كونج ، الصين ، أنه ترك Microsoft لأكثر من 20 عامًا. وآخر مساهمة قدمها Shen Xiangyang في نموذج الذكاء الاصطناعي العام لشركة Microsoft هي روبوت الدردشة Xiaobing الذي طوره معهد Microsoft Asia Internet Engineering Institute في عام 2014.
في يوليو 2020 ، أصبحت Xiaoice مستقلة عن Microsoft وأصبحت شركة صينية ناشئة في مجال الذكاء الاصطناعي ، وعمل شين Xiangyang كرئيس لها ، وشغل Li Di ، نائب الرئيس التنفيذي السابق لأكاديمية Microsoft Asia Internet Engineering Academy ، منصب الرئيس التنفيذي. نمت Xiaoice إلى أكثر من الجيل السادس عندما أصبحت مستقلة ، وتشتمل أشكال منتجاتها على روبوتات ذكاء اصطناعي للمحادثة ، ومساعدين صوتيين أذكياء ، وموفري محتوى تم إنشاؤه بواسطة الذكاء الاصطناعي ، وسلسلة من الحلول الميدانية الرأسية. أثار Xiaoice ذات مرة نقاشًا عامًا ، بالإضافة إلى كونه روبوت دردشة مليئًا بالعواطف والجنس الأنثوي ، وله أيضًا أدائه المذهل في مجال إنشاء الشعر الصيني - فقد نشرت مجموعة من القصائد "Sunshine Lost the Glass Window" ، والتي نالت الكثير من المديح والمزيد من الجدل.
ليس هناك شك في أن روبوت XiaoIce الذي يمكنه كتابة القصائد وإجراء محادثات عاطفية بسيطة ومبنية على المنطق كان أفضل نموذج للذكاء الاصطناعي العام للمحادثة أداءً في العالم منذ بضع سنوات.
من المستحيل على الفريق بقيادة شين شيانغيانغ فهم البحث ، ناهيك عن الذكاء الاصطناعي. ورحيل شين شيانغيانغ عن "استقلال" مايكروسوفت وشياوبينغ ، إلى جانب استثمار ناديلا الرئيس التنفيذي لشركة مايكروسوفت وتعاونه مع شركة أوبن إيه آي ، هو في الواقع أكبر متداول في مجال الذكاء الاصطناعي في الصين والولايات المتحدة.إنفصال رسمي عن الطرق في مجال نماذج الذكاء الاصطناعي العامة.
إذن ، هل ما زال شياو بينغ يكتب الشعر اليوم؟ ماذا يفعل
في العامين الماضيين ، توقف شياوبينغ منذ فترة طويلة عن كتابة القصائد. إنه مشغول بالتسويق. أنشأت استوديو ألعاب لتوفير محتوى حوار مكتوب من NPC للألعاب ؛ تعاونت مع الألعاب الأولمبية الشتوية لتوفير نظام تسجيل مرئي لمهارات التزلج على الجليد الحر ؛ وقدمت معلومات Wind مع ملخصات نصية تم إنشاؤها بواسطة الذكاء الاصطناعي لإعلانات الشركات المدرجة ؛
باختصار ، في الماضي ، أصبح فريق الذكاء الاصطناعي الذي يمثل المستوى الأعلى من نموذج الذكاء الاصطناعي الدلالي الطبيعي العام ، ودعم الصينيون الهيكل بأكمله ، مورد ذكاء اصطناعي يمزج بين الذكاء الاصطناعي التوليدي والذكاء الاصطناعي لصنع القرار ويقدم حلولًا محددة لسيناريوهات محددة.
لا يمكنك القول إن هذا هو "سقط" زياوايس ، بعد كل شيء ، لقد جمع مئات الملايين من اليوان فقط من سوق رأس المال. وفقًا لطريقة تدريب نموذج ChatGPT ، سيتم إنفاق الأموال في يوم واحد. بدون حماية Microsoft ، يتعين على Xiaobing أن يعتني بحياته. ومع ذلك ، لم أسمع أبدًا عن Baidu أو Tencent أو ByteDance. فكرت في الاستثمار في Xiaoice ودعمها لمواصلة تطوير نموذج واسع النطاق للذكاء الاصطناعي الدلالي الطبيعي العام.
ليس فقط شياو بينغ. في السنوات القليلة الماضية ، كانت هناك أيضًا فرق ريادية أخرى في الصين تعمل في النمذجة التلقائية للذكاء الاصطناعي العام والحوسبة غير المتجانسة ، مما يسمح بتوصيل 7-8 أنواع من الرقائق في الداخل والخارج بالبرمجيات من خلال هذا النموذج. لم تُظهر المؤسسات الاستثمارية الصينية أبدًا اهتمامًا بنماذج الذكاء الاصطناعي العامة ، وحتى القليل من الخيال.
"أكثر من 85٪ من المستثمرين طلبوا منا تقديم سيناريو المنتج. قلنا إننا نساعد وحدة معالجة الرسومات على الاتصال بالنظام البيئي للبرمجيات ، وحتى Nvidia تستخدم نموذجنا. قال المستثمرون أن هذا ليس سيناريو. قلنا أن لدينا أيضًا عملاء ، وأبحاثًا حول الأقمار الصناعية ، والموانئ ، والمدن الذكية ، والصناعات الذكية. قالوا إن عملك مبعثر للغاية ، لذلك نحن لا نستثمر." هذا ما سمعته من رواد الأعمال الذين يصنعون نماذج عامة للذكاء الاصطناعي.
كما نعلم جميعًا ، يحب رأس المال الجريء في الصين "تثقيف" رواد الأعمال أكثر من غيرهم ، وبالطبع تثقيف العلماء الذين يشاركون في ريادة الأعمال في مجال الذكاء الاصطناعي. "يجب أن يكون لديك بعض البيانات في هذه الصناعة" ، هذه هي الجملة المفضلة لديهم لتثقيف رواد الأعمال في مجال الذكاء الاصطناعي.
هناك بيانات في صناعة معينة ، ومن الضروري التركيز على تقديم حلول في مجال مجزأ معين ، هذه هي عقلية معظم رأس المال المغامر والمشاريع الخاصة في الصين الذين يزعمون أنهم يستثمرون في الذكاء الاصطناعي. ثم ننظر إلى "ما هو حجم المشهد" ، مشهد الكاميرا الأمنية كبير بما يكفي ، وبالتالي يصبح نموذج التقييم بحجم الصين ، كم عدد الكاميرات التي يمكن تركيبها؟ كم سعر كل كاميرا؟ ما هو حجم لوحة الكاميرا الإجمالية؟ حسنًا ، اللوحة كبيرة بما يكفي ، وقد صوتنا في التقسيم الفرعي للكاميرا. دعونا نلقي نظرة على الخدمات اللوجستية الذكية للميناء مرة أخرى. كم عدد الموانئ الموجودة في الصين؟ كم عدد موانئ المياه العميقة؟ ما المبلغ الذي يمكن أن تدفعه كل محطة منفذ مقابل حلول الذكاء الاصطناعي؟ اتضح أننا دفعنا مثل هذا المبلغ الضئيل ، ويبدو أن مشهد "الميناء" ليس كبيرا بما يكفي ، لذلك لن نصوت. الذكاء الاصطناعي البشري الرقمي كخدمة العملاء؟ يمكن ربطه بالميتافيرس ، لديه قصة وخيال ، حسنًا ، يمكننا تجربته.
لذا ، ما تراه هو أن "النمور الأربعة" للذكاء الاصطناعي الصيني تعمل أساسًا في مجال الكاميرات والتعرف على الوجوه ، وقد أصبحوا جميعًا منفذين ومتكاملين لمشروع الذكاء الاصطناعي. ونموذج الأعمال هو نفسه نموذج Neusoft و iSoftStone قبل 30 عامًا.
لفترة طويلة من الزمن ، اعتقد عدد قليل من المستثمرين في مجال الذكاء الاصطناعي بصدق أنه يمكن إعادة استخدام نموذج عام في مختلف الصناعات. من حين لآخر ، هناك القليل ممن يتحلى بالصبر بعض الشيء ويهتمون بالنموذج العام ، وهم في الأساس أموال رنمينبي.صندوق الدولار الأمريكي غير مهتم حقًا بمحاولة الفريق الصيني لتطوير نموذج عام. هل تعتقد أنه من خلال مقارنة صعوبة ومستوى التدريب النموذجي لشركات مثل OpenAI و Google ، فإنهم يشعرون أن هناك فجوة بين الفريق الصيني في هذا الشأن؟ إذن أنت تفكر كثيرًا حقًا. إنهم يعرفون الوقت الذي يجري فيه تطوير نموذج GPT ، أي الشهرين الماضيين.
هؤلاء مديرو الاستثمار من الصف الأول الذين تفاخروا بأن "SenseTime و Megvii يبيعون الكاميرات الأمنية في عيني" ، هؤلاء الشركاء الاستثماريون من الصف الأول الذين أخبروا رواد الأعمال بفخر أن "نموذجك ليس مشهدًا" ، ناهيك عن شركاء صندوق الاستثمار بالدولار الأمريكي الذين بالكاد استثمروا في الذكاء الاصطناعي في التاريخ وكانوا يتلاعبون برواد الأعمال الصينيين "للذهاب إلى الخارج" للانخراط في عملة مشفرة وأعلنوا أنهم سيقدمون دعمًا مفاجئًا لرجال الأعمال في الصين لسنوات عديدة. ثم يمكنك التفكير في الأمر ، فوعودهم وتعجرفهم تحتوي على بعض الفهم والصدق لنموذج الذكاء الاصطناعي العام ، وبعضها تخمين وحساب.
يمكنك حتى التفكير في الأمر.قد يكلف تدريب النموذج الدلالي الفائق الطبيعي عشرات الملايين أو حتى مئات الملايين من الرنمينبي يوميًا ، ناهيك عن وحدة طاقة الحوسبة التي توفر تدريبًا كبيرًا على النموذج - أفضل GPU في العالم ، بسبب الحظر غير المعقول الذي تفرضه الولايات المتحدة. أصبح الحصول عليه أكثر وأكثر صعوبة. مع أسلوب سلوك وسلوك هؤلاء المستثمرين في السنوات العديدة الماضية ، يمكنهم الاستمرار لبضعة أيام ، ما مقدار الأموال التي يرغبون في إقناع لجنة الاستثمار بالاستثمار فيها ، أو يمكنهم مساعدة فرق ريادة الأعمال هذه في حل مشكلة GPU؟ ربما يومًا ما ، وربما بعد نصف عام ، سيبدأون في حث فرق النموذج العام هذه على "تحقيق التسويق التجاري في الحقول المقسمة" في أسرع وقت ممكن.
مع إصرار Baidu على الاستثمار في نموذج PaddlePaddle ، من المحتم أن تمارس هذه الصناعة النموذجية منذ البداية ، وتتابع التسويق في الصناعات المختلفة في أقرب وقت ممكن. إلى حد كبير ، فإن تدريب النماذج الكبيرة للذكاء الاصطناعي العام لديه "مثلث مستحيل" من البيانات الضخمة ، ومخرجات المحتوى عالية الجودة والإبداعية ، والتطبيقات الصناعية.
لتحقيق بيانات ضخمة وإخراج محتوى إبداعي عالي الجودة ، لا بد من عدم القدرة على تطبيقها بسرعة على التنفيذ المحدد لصناعة معينة - مثل ChatGPT.
إذا كنت ترغب في إنشاء سيناريوهات هبوط صناعي محددة في أكبر البيانات الجماعية التي أنشأها البشر على الإنترنت ، فلن تكون قادرًا بالتأكيد على تقديم نتائج عالية الجودة ، لأنه يجب أن يكون هناك تعارض بين إنشاء المحتوى بناءً على البيانات الجماعية وأنظمة اتخاذ القرار الدقيقة - هذا في الواقع مضيعة.
إذا كنت ترغب في تحقيق إنتاج محتوى عالي الجودة للمساعدة في اتخاذ قرارات دقيقة في سيناريوهات الهبوط الصناعي ، فيجب عليك التضحية بأكبر قدر من البيانات ، ولا يمكن أن تدعم البيانات التي تمتلكها السيناريوهات الصناعية الأكثر دقة تدريبًا وبحثًا حقيقيًا للنماذج واسعة النطاق. هذه هي المعضلة التي تواجهها معظم حلول الذكاء الاصطناعي في الصين اليوم ، وهي أيضًا السبب وراء كون ما يسمى "اقتراح الصناعة ChatGPT" خطأ.
هؤلاء رواد الأعمال والمستثمرون الذين يستعدون لدخول "تشات جي بي تي الصين" اليوم ، ناهيك عن مقدار المال وعدد وحدات معالجة الرسومات الموجودة في جيوبك ، نظرًا لأنك جميعًا على هذا القارب ، فأنت تشعر أنك تحمل تذكرة. أي ركن من "المثلث المستحيل" للذكاء الاصطناعي العام سوف تقرر التخلص منه؟ هذا سؤال يجب حله أولاً.
بعبارة أخرى ، ما المؤسسة الاستثمارية - سواء كانت مؤسسة استثمار مالي أو قسم استثمار لشركة كبيرة - لديها العزم على الاستثمار في تدريب النماذج الدلالية الطبيعية على نطاق واسع لعدة سنوات وتمديد دورة العائد إلى ما لا نهاية؟ بعد كل شيء ، يخبرنا التاريخ أن هذه مجموعة من الأشخاص هم الأقل تصميمًا والأكثر حرصًا على العثور على خليفة.
لم تفتقر الصين أبدًا إلى رواد الأعمال والعلماء البارزين ، ولا يُستثنى من ذلك مجال الذكاء الاصطناعي. يعد مستوى وتراكم شركات التكنولوجيا الصينية والأمريكية في مجال الذكاء الاصطناعي الأقرب في العالم ، فقبل بضع سنوات على الأقل لم تكن هناك فجوة كبيرة بين الصين والولايات المتحدة في بناء وتدريب النماذج الدلالية الطبيعية الكبيرة. ومع ذلك ، تفتقر الصين إلى بعض المؤسسات الاستثمارية والمستثمرين الذين لديهم رؤية أوسع ، ولا يتبعون آراء الآخرين ، ومصممون وبعيد النظر.
الأشخاص مثل شين شيانغيانغ ، لي دي ، ما ويينغ ، وانغ شياوتشوان ، ولي زيفي ، الذين خرجوا لبدء نماذج دلالية طبيعية عامة واسعة النطاق يمكن الاعتماد عليهم تمامًا ، لكن المشكلة هي أنهم بحاجة إلى تغيير مجموعة من المؤسسات الاستثمارية والمستثمرين الذين يدعمونهم.بعض المؤسسات الاستثمارية التي تكون جيدة جدًا في "ممارسة الألعاب" والمضاربة ، ومنغمسة جدًا في قائمة العملات المشفرة والمسارات الأخرى.
لكي نكون صادقين ، على الرغم من عدم وجود مؤسسات استثمارية جادة تبحث في نماذج الذكاء الاصطناعي العامة لسنوات عديدة ، لا تزال هناك بعض المؤسسات التي استثمرت في العديد من شركات الذكاء الاصطناعي بفترات سداد طويلة للغاية. على سبيل المثال ، ساهم هؤلاء المغامرون الذين استثمروا في حلول القيادة الذاتية والقيادة المحلية في الصين في إنشاء قدرة تنافسية جديدة للصين في التغييرات غير المسبوقة في صناعة السيارات العالمية خلال قرن من الزمان. على سبيل المثال ، هؤلاء المغامرون المستثمرون الذين استثمروا في وحدات معالجة الرسومات المحلية في الصين - من المقرر أن يكون هذا المسار مليئًا بالمخاطر ، ويواجه الحظر والقمع من الولايات المتحدة ، ودورة العودة طويلة للغاية ؛ ولكن هؤلاء اللاعبين المحليين الناشئين حديثًا في GPU - سواء كانوا Hanbo أو Biren أو غيرهم ، قد يقدمون ذخيرة لنموذج المعالجة الدلالي الطبيعي العام للصين في المستقبل. المستثمرون الذين يقفون وراءهم ، إذا اتخذوا يومًا ما قرارهم حقًا واتخذوا خطوة لدعم مشروع النموذج الدلالي الطبيعي الواسع النطاق في الصين ، فقد يكون لدي بعض التوقعات المختلفة والثقة فيهم.
الأمر فقط هو أنه لا يوجد الكثير من المستثمرين والمؤسسات الاستثمارية الذين لا يتفاخرون ولا يتراجعون ولا يندفعون لتحقيق النجاح السريع ، ولكن هناك عدد قليل جدًا. ومع ذلك ، يحتاج بناء النموذج الدلالي الطبيعي في الصين والتدريب إلى مثل هؤلاء المستثمرين والمؤسسات الاستثمارية - سواء كان ذلك مستثمرًا ماليًا أو مستثمرًا استراتيجيًا أو مؤسسة رأسمالية مدعومة بإرادة الدولة.
تحتاج الصين إلى أن يكون لديها نموذجها الدلالي الطبيعي الواسع النطاق للأغراض العامة. وهي بحاجة إلى أن يكون لديها رؤية لتوفير الحكمة الصينية ونظام القيم الصيني والحلول الصينية للذكاء الاصطناعي العالمي للأغراض العامة. وهي بحاجة إلى تجنب المخاطر والمسائل القانونية والأخلاقية والأخلاقية في العملية الكاملة لاختيار المجموعة ، وبناء النموذج والتدريب ، وتعديل المعلمات. كما تحتاج إلى التصميم والصبر.
على أي حال ، لا يمكن التكهن بذلك.