Semua orang berbicara tentang model besar, yang merupakan gambaran sebenarnya dari dunia teknologi pada paruh pertama tahun ini.
Dilihat dari kehebohan pasar, model skala besar telah menjadi jalur yang diburu oleh berbagai produsen teknologi. Baik itu raksasa internet, perusahaan teknologi, atau bahkan lembaga penelitian, mereka semua telah bergabung dalam huru-hara model skala besar ini. Besar -model skala telah menjadi "Battleground".
Tepat ketika pasar model skala besar domestik sedang berjalan lancar, ChatGPT, yang telah mendorong popularitas model skala besar dalam satu gerakan, telah mengalami penurunan kunjungan. Menurut data terbaru dari SimilarWeb, lembaga pemantau pihak ketiga, pada Mei tahun ini, ChatGPT mulai menunjukkan perlambatan pertumbuhan, dengan tingkat pertumbuhan hanya 2,8% pada bulan tersebut, sedangkan empat bulan pertama tahun 2023 adalah 131,6. %, 62,5%, 55,8%, 12,6%. Ini pertama kalinya ChatGPT mengalami pertumbuhan traffic negatif sejak dirilis pada 30 November 2022.
Fenomena ini mungkin mencerminkan tren industri yang penting, semua pihak berubah dari antusiasme teknis awal untuk model besar menjadi pemikiran tenang tentang komersialisasi. Dan pendaratan model skala besar juga merupakan topik yang perlu dipertimbangkan secara serius oleh semua perusahaan model skala besar.
** "JD.com percaya bahwa nilai model besar = algoritme × daya komputasi × data × kuadrat ketebalan industri," kata Xu Ran, CEO JD.com. JD.com tidak hanya mengejar kemajuan teknologi, tetapi juga memberikan perhatian khusus pada ketebalan industri - menghargai seberapa banyak skenario industri teknologi dapat diterapkan secara praktis dan dapat menciptakan berbagai nilai bagi masyarakat. **
Pada 13 Juli, JD.com meluncurkan model besar Yanxi. Menurut JD.com, ini adalah model generasi baru dengan parameter mencapai ratusan miliar dolar, dan akan sangat digunakan dalam skenario ritel, keuangan, logistik, kesehatan, industri, dan industri lainnya di masa mendatang.
Ketika efisiensi industri dan perluasan batas industri ditingkatkan secara kualitatif, model besar akan memiliki nilai dan signifikansi praktis yang lebih penting. Dalam hiruk pikuk model besar, kita harus kembali ke rasionalitas dan secara serius mempertimbangkan nilai sebenarnya dari model besar. Model besar seperti apa yang dibutuhkan industri? Bagaimana seharusnya model besar digunakan secara komersial untuk mengurangi biaya dan meningkatkan efisiensi industri?
Bersaing untuk model besar: konsensus dari umum ke industri
Semalam, model skala besar domestik "muncul" satu demi satu.
Menurut "Laporan Penelitian Peta Model Skala Besar Kecerdasan Buatan China" yang dirilis oleh Institut Informasi Sains dan Teknologi China di bawah Kementerian Sains dan Teknologi, pada 28 Mei, setidaknya 79 model skala besar dasar dengan skala lebih dari 1 miliar parameter di China telah dirilis. Jumlah model besar yang dikembangkan di negara saya menduduki peringkat kedua di dunia.
Namun, di balik melonjaknya jumlah R&D, bagaimana mewujudkan nilai komersial model besar patut ditelusuri.
Saat ini, lebih banyak model besar untuk keperluan umum yang keluar. Model skala besar jenis ini memiliki pemahaman bahasa alami yang kuat, pembuatan bahasa, dan kemampuan pengenalan ucapan, dan bekerja dengan baik dalam skenario dengan atribut umum yang kuat seperti obrolan dan hiburan. Namun, , skenario ini masih sulit untuk mencapai komersialisasi skala besar.
Dalam skenario industri yang terbagi, akurasi jawaban model besar umum rendah, karena industri itu sendiri memiliki ukuran sampel yang kecil, distribusi data yang tidak merata, dan skenario aplikasi yang berubah, yang membuat model besar tidak dapat mengoptimalkan dan meningkatkan diri sendiri. Akurasinya tentu saja tidak tinggi.
Dari perspektif komersialisasi, perusahaan mungkin tidak memerlukan model skala besar serba guna "serba guna", tetapi lebih membutuhkan model skala besar industri yang menargetkan skenario lapangan yang terbagi dan memecahkan masalah praktis.
Wu Hequan, seorang akademisi dari Chinese Academy of Engineering, pernah menunjukkan bahwa "Model-model besar yang seperti obrolan telah memicu babak baru kebangkitan, tetapi dialog, penulisan puisi, dan lukisan sama sekali bukan model-model besar. Kita perlu melakukannya pikirkan secara mendalam tentang arah penerapan model besar, dan kita harus benar-benar memasukkan model besar ke Dalam bidang pembangunan perkotaan, teknologi keuangan, biomedis, manufaktur industri, dan penelitian ilmiah, perusahaan dan organisasi profesional juga diperlukan untuk mempercepat implementasinya di industri nyata, membawa nilai nyata bagi kebutuhan mendesak industri, dan benar-benar melayani masyarakat dalam skala besar."
Saat ini, sebuah konsensus sedang dibentuk di pasar model skala besar bahwa model skala besar yang tidak dapat digunakan secara komersial hanyalah "alat hiburan", dan hanya model skala besar yang masuk jauh ke dalam industri dan memecahkan masalah praktis. nilai. Berpikir mendalam tentang nilai model besar, formula yang diusulkan oleh JD.com lebih sesuai dengan tren pasar model besar, yaitu: nilai model besar = algoritma × daya komputasi × data × kuadrat ketebalan industri.
** Dari rumus nilai model besar, kita dapat melihat bahwa model besar industri dan model besar umum tidak bertentangan. Model besar industri didasarkan pada model besar umum dan dilatih. Isinya lebih sesuai dengan kebutuhan skenario vertikal industri dan lebih tepat sasaran. **
Dalam hal rute evolusi model besar, tidak mengherankan jika JD.com berwawasan ke depan. Sejak didirikan, Jingdong telah mengakar di industri ini, dan secara alami lebih memperhatikan nilai model besar di industri ini.
"Jingdong memperhatikan model-model besar dan inovasi teknologi lainnya. Selain mengejar sifat teknologi yang maju, ia juga memberikan perhatian khusus pada ketebalan industri - berapa banyak skenario industri yang dapat diterapkan secara praktis oleh teknologi untuk benar-benar menciptakan nilai bagi masyarakat. "kata Xu Ran, CEO Jingdong.
**Faktanya, pengembangan model besar pada tahap ini sedang berpindah dari "universal" ke "industri". **
Laporan penelitian terbaru yang dirilis oleh Minsheng Securities menyebutkan bahwa setelah periode rilis intensif model besar dari Februari hingga Maret, periode pengembangan produk dari April hingga Mei dan arah kebijakan secara bertahap diklarifikasi, produk dan aplikasi model besar akan dimulai pada bulan Juni. . Diharapkan untuk mengantarkan rilis terpusat. Gelombang rilis baru didasarkan pada produk aplikasi model skala besar, dan peningkatan skala besar sudah mulai online, bersiap untuk memasuki ribuan rumah tangga.
Baru-baru ini, sebagian besar model skala besar terbaru yang dirilis oleh perusahaan teknologi dalam negeri ditujukan untuk industri vertikal. Di luar negeri, berbagai perusahaan berturut-turut merilis model industri skala besar dengan skala berbeda, dengan tujuan untuk menerapkannya ke bidang industri.
Dari tren aktual produsen besar di dalam dan luar negeri, tidak sulit untuk melihat bahwa model industri akan lebih dapat membantu mitra industri untuk menyelesaikan transformasi digital, mengurangi biaya dan meningkatkan efisiensi, serta menciptakan nilai yang lebih besar bagi industri dan masyarakat. .
Model industri besar, sulit untuk meletakkan dasar yang kokoh bagi industri
Kesulitan membangun model skala besar industri jauh lebih tinggi daripada model skala besar tujuan umum.
Jika model skala besar umum menguji daya komputasi dan akumulasi algoritme perusahaan, maka model skala besar industri menguji akses perusahaan ke dan pemahaman skenario bisnis, serta akumulasi dan penerapan data industri.
Konsensus industri adalah bahwa dalam pelatihan model industri besar, hal yang paling sulit diperoleh adalah data industri. Data industri seringkali berada di tangan perusahaan, karena keamanan data dan pertimbangan lainnya, hanya sedikit perusahaan yang mau mengungkapkan data pribadi. Namun, data industri ini seringkali secara langsung atau tidak langsung memengaruhi kecepatan iterasi teknis, akurasi model, dan profesionalisme bisnis model industri besar.
"Data industri juga dapat dibagi menjadi data statis dan data dinamis. Data statis relatif stabil, tidak akan segera berubah, dan jalur akuisisi relatif jelas. Data dinamis adalah data yang dihasilkan setiap saat dalam skenario industri yang berbeda. Ini bagian dari data adalah data adegan 'Hidup'. Tidak mudah untuk mendapatkannya, tetapi ini adalah salah satu elemen penting dari model industri." He Xiaodong, Presiden Lembaga Penelitian JD dan Presiden Departemen Layanan dan Produk Teknologi JD, menekankan.
Namun, pelatihan model industri besar tidak bisa hanya menggunakan data industri, tetapi masih perlu menggunakan data umum dalam jumlah besar untuk memberikan pengetahuan yang masuk akal. Alasannya adalah sebagai berikut: Pertama, generalisasi data industri tidak mencukupi, dan model besar perlu dilatih ulang setiap kali adegan diubah, yang mahal; Terjebak dalam keadaan macet.
He Xiaodong membandingkan pelatihan model industri besar dengan pelatihan seseorang, "Jika seseorang langsung bekerja setelah lulus SMA, sepertinya baik-baik saja, tetapi profesionalismenya akan kurang profesional. Jika Anda dapat menyelesaikan empat tahun gelar sarjana sebelum bekerja, Anda memiliki pengetahuan umum Kemampuan dan pengetahuan profesional yang memadai adalah kemampuan yang harus dimiliki oleh model industri besar.
Untuk alasan ini, data model besar JD Yanxi terdiri dari 70% data umum dan 30% data mentah dari pertumbuhan adegan rantai pasokan.
Perlu disebutkan bahwa data industri ini berasal dari JD.com sendiri. JD.com sendiri adalah perusahaan berbasis supply chain yang berakar dari berbagai industri, tidak hanya memiliki data praktis di bidang ritel, logistik, keuangan, kesehatan, industri dan industri lainnya, tetapi juga memiliki data kota, urusan pemerintahan, keuangan, manufaktur, industri, penerbangan, transportasi, dll. Data industri yang tidak peka seperti kawasan industri, kawasan industri, dan energi, dan data berkualitas tinggi yang dihasilkan setiap tahun mencapai 10 miliar keping.
Selain pasokan berkelanjutan data industri berkualitas tinggi, model industri besar juga perlu memahami Pengetahuan industri, yaitu memiliki pengetahuan unik tentang industri dan memiliki persyaratan pemahaman yang lebih tinggi. Misalnya, industri ritel lebih memperhatikan pengaruh pemasaran dan rekomendasi, dan industri keuangan lebih memperhatikan pengaruh pengendalian risiko, kehandalan dan keamanan.
Untuk permintaan ini, rantai pasokan intelijen digital jangka panjang JD.com telah memainkan peran kunci, dan telah menjadi fokus upaya JD.com dalam penerapan model besar. Model besar juga dapat didasarkan pada kecerdasan digital dari rantai pasokan dan masuk jauh ke dalam industri fisik.
Dilaporkan bahwa rantai pasokan intelijen digital JD.com telah mencakup lebih dari 10 juta SKU produk yang dioperasikan sendiri oleh JD.com, melayani lebih dari 8 juta pelanggan korporat aktif, termasuk lebih dari 90% dari 500 perusahaan teratas dunia di Tiongkok, dan hampir 70% dari UKM khusus baru di negara tersebut. Pada saat yang sama, rantai pasokan intelijen digital JD.com masih ada di dalam negeri, dan memiliki kerja sama yang mendalam dengan lebih dari 2.000 sabuk industri.
Rantai pasokan intelijen digital semacam ini dengan tautan yang lebih panjang, skenario yang lebih kompleks, dan data yang lebih kaya adalah "tempat pelatihan" yang sangat baik untuk model besar. Dalam pandangan JD Cloud, nilai model besar hanya dapat diwujudkan dengan memahami rantai pasokan secara menyeluruh dan membiarkan model besar "berjalan" di rantai pasokan.
Selain akumulasi di sisi industri, kekuatan JD.com dalam algoritme dasar dan daya komputasi tidak boleh diremehkan.
Pada tahun 2021, JD Discovery Research Institute meluncurkan klaster komputasi berskala ultra besar pertama di negara itu berdasarkan arsitektur DGX SuperPOD di Chongqing-Tianqin α, yang meningkatkan kecepatan penalaran sebesar 6,2 kali dan mengurangi biaya penalaran sebesar 90%. Ini memberi JD.com jaminan paling dasar untuk pelatihan model berskala besar.
Pada tahun yang sama, JD.com meluncurkan model K-PLUG tingkat miliaran.Salinan produk yang dihasilkan oleh K-PLUG telah mencakup lebih dari 3.000 kategori di JD.com, menghasilkan total 3 miliar kata, dan lulus tinjauan manual tingkat melebihi 95%. Pada tahun 2022, model besar JD.com akan ditingkatkan menjadi puluhan miliar model Vega, yang dapat digunakan secara luas dalam berbagai tugas pemrosesan bahasa alami hilir seperti analisis sentimen, pencocokan semantik, koreksi kesalahan tata bahasa, menjawab pertanyaan cerdas, dan akal sehat pemikiran.
Berkat akumulasi sebelumnya, JD.com membuat terobosan teknologi lainnya tahun ini, dan meluncurkan generasi baru model skala besar JD.com dengan ratusan miliar parameter, dengan fokus pada beberapa tugas utama seperti pembuatan konten, dialog manusia-mesin, pemahaman maksud pengguna, ekstraksi informasi, dan klasifikasi emosi. , mewujudkan penyempurnaan model dasar + model domain vertikal, dan menerapkan skenario vertikal mendalam seperti urusan ritel, logistik, keuangan, kesehatan, dan pemerintahan.
Saat ini, model industri besar yang diwakili oleh JD.com sedang melatih model besar melalui akumulasi data dan pengetahuan berbasis industri dan skenario, dan mengoreksi model besar berdasarkan akumulasi Pengetahuan industrinya, untuk meningkatkan kinerja model besar dalam industri tertentu dan skenario aplikasi, dan untuk meningkatkan kemampuan kontrol. Ini setara dengan menyelesaikan "pendidikan umum" untuk AI.
** Model besar Jingdong secara bertahap masuk ke berbagai industri untuk meningkatkan tingkat kecerdasan rantai pasokan. Sebaliknya, peningkatan kecerdasan digital rantai pasokan juga mendorong transformasi industri, yang pada gilirannya menyediakan data yang lebih kaya untuk model besar, membentuk siklus positif. **
"Memotong model skala besar dari sisi industri seperti mendaki Gunung Everest teknis dari lereng utara: meskipun jalannya lebih sulit, ada pemandangan yang lebih indah. Jingdong bersikeras melakukan 'hal-hal yang sulit tetapi benar', bersikeras pada melakukan hal yang praktis, berharga dan Ini adalah masalah jangka panjang. Di bidang teknis dan model besar, ini adalah komitmen konstan kami," kata Xu Ran.
** "Hal-hal yang sulit dan benar" membutuhkan akumulasi jangka panjang. Namun, dalam hal konstruksi model industri, JD.com telah meletakkan fondasinya dengan jelas. **
Jingdong, lahir di industri, menciptakan nilai industri dengan model besar
"Di zaman model besar, apa pun layak dilakukan lagi dengan model besar."
Di bawah gelombang model besar, industri dengan cepat mencapai konsensus di atas. Namun, sementara pabrikan besar lainnya mencari model bisnis melalui berbagai strategi, arah industri pendaratan Jingdong tidak pernah berubah.
"Atribut industri adalah fitur khas dari teknologi JD.com. Setiap teknologi yang dikembangkan oleh JD.com berasal dari kebutuhan industri, pengalaman dalam skenario industri, dan menciptakan nilai industri," kata Xu Ran.
Saat ini, model skala besar JD Yanxi bergerak maju sesuai dengan strategi "tiga langkah": saat ini, JD Cloud telah membangun model besar tujuan umum berdasarkan praktik internal; pada akhir tahun ini, JD. Layanan industri yang solid; diharapkan pada awal 2024, kapabilitas model skala besar akan dibuka untuk skenario bisnis eksternal yang serius.
Dari sudut pandang praktis, model besar JD.com telah mencapai langkah kedua JD.com menerapkan kemampuan model besar ke skenario yang paling dikenal seperti ritel, keuangan, logistik, dan kesehatan, dan telah merambah ke berbagai link.
Misalnya, Jingdong sedang meningkatkan kemampuan layanan pelanggan yang cerdas melalui model-model besar. Bidang layanan pelanggan berbeda dari obrolan dan percakapan sehari-hari, ini adalah adegan dialog berbasis tugas yang serius yang perlu menyelesaikan berbagai masalah kompleks antara pembeli dan penjual di dunia nyata.
"Ketika pengguna berbicara dengan ChatGPT, tidak masalah meskipun jawabannya salah, dan itu tidak akan memengaruhi pengambilan keputusan. Tetapi jika dalam skenario bisnis yang serius, layanan pelanggan yang cerdas menjawab salah, konsekuensinya tidak terbayangkan . Oleh karena itu, keakuratan jawaban sangat penting." Komite Teknis Grup Jingdong Cao Peng, Ketua dan Presiden Divisi JD Cloud, berkata.
Untuk skenario layanan pelanggan yang cerdas, JD.com tidak hanya membuat model besar dengan pemahaman semantik dasar dan logika tanya jawab, tetapi juga memoles model kecil untuk skenario tertentu. Jika masalah pelanggan melibatkan pengembalian dan pertukaran umum, dll., Layanan Pelanggan yang cerdas akan memanggil model besar yang lebih umum. Dan begitu pertanyaannya melibatkan kebijakan garansi dan aturan perlindungan harga produk tertentu, layanan pelanggan yang cerdas akan memanggil model kecil yang lebih bertarget untuk memberikan jawabannya. Model yang berbeda dapat mengambil tanggung jawab yang berbeda.
Sekarang, layanan pelanggan cerdas bekerja di dalam JD.com, membantu lebih dari 20.000 karyawan layanan pelanggan mandiri mengurangi biaya dan meningkatkan efisiensi, serta terus mengoptimalkan pengalaman layanan pelanggan. JD.com juga telah membuka kemampuan layanan pelanggannya yang cerdas ke dunia luar untuk membantu lebih banyak lembaga pemerintah dan perusahaan melakukan transformasi dan peningkatan digital dan cerdas.
Dalam hal layanan eksternal untuk model besar, JD.com masih mempertahankan kecepatannya yang "lambat", dan tidak terburu-buru untuk "menjual" model besar ke perusahaan. Alasannya adalah kecerdasan buatan adalah perubahan teknologi yang sangat serius: jika digunakan dengan baik, dapat mengubah industri, tetapi jika digunakan secara tidak benar, juga dapat menimbulkan konsekuensi yang serius. Dalam keadaan seperti itu, Jingdong menganut mentalitas jangka panjang dan merupakan pilihan yang sangat baik.
"JD.com tidak akan menyajikan hidangan yang belum mencapai 'penuh warna, rasa, dan cita rasa'. Setelah model skala besar menyelesaikan pengalaman dan praktik di adegan internal utama, itu akan dibuka untuk mitra untuk membantu seluruh industri mengurangi biaya dan meningkatkan efisiensi." Xu Ran mengungkapkan.
Dalam rencana JD.com, model besar Yanxi akan menjadi dukungan teknis tingkat terendah. Berdasarkan kemampuannya, bidang tersebut akan menghasilkan serangkaian produk, dan produk di bidang yang sama akan digabungkan menjadi satu platform, dan akhirnya menghasilkan nilai bagi industri.
Misalnya, di bidang pembuatan konten, JD.com telah membangun platform pemasaran konten JD Cloud AIGC. Berdasarkan akumulasi data produk yang kaya dari seluruh kategori JD.com, model besar dapat lebih memahami karakteristik produk, membantu penjual secara otomatis membuat gambar produk, titik penjualan, dan materi pemasaran lainnya, serta meningkatkan efisiensi operasional pedagang dan kualitas konten pemasaran.
Dengan kata lain, merchant hanya perlu mengunggah gambar produk, dan dapat dengan cepat memperoleh beberapa jenis gambar seperti gambar produk utama, gambar poster pemasaran, dan gambar detail bisnis yang diperlukan untuk operasional e-commerce, memenuhi kebutuhan pembukaan toko yang cepat, daftar produk dan pemasaran. Kemampuan ini dapat menghemat 90% biaya penarikan bagi pedagang, dan mempersingkat siklus produksi dari 7 hari menjadi setengah hari.
Menggunakan kemampuan model berskala lebih besar, pedagang bahkan tidak perlu menjual barang mereka sendiri, tetapi hanya perlu menggunakan manusia digital multi-modal JD Cloud untuk mengirimkan barang 24 jam sehari dengan biaya rendah.
Selain aplikasi tersebut, JD.com juga mendemonstrasikan platform operasi pemasaran AI di bidang keuangan. Melalui dialog sederhana, pengguna dapat menghasilkan aktivitas pemasaran dalam satu atap, yang mencakup perumusan strategi operasional, penjadwalan tugas pemasaran, membuat halaman aktivitas, pembuatan salinan dan materi pemasaran, pengiriman digital, dll. Menurut data yang relevan dari JD.com, di masa lalu rangkaian proses ini membutuhkan lima jenis personel fungsional: produk, R&D, algoritme, desain, dan analis, tetapi sekarang telah direduksi menjadi satu orang; di masa lalu, prosesnya membutuhkan 2.000 interaksi manusia-komputer, tetapi juga telah dikurangi menjadi kurang dari 50. Dengan dukungan kapabilitas model yang besar, efisiensi produksi dari rencana pemasaran telah meningkat secara signifikan.
** Dapat dikatakan bahwa model industri besar JD.com menjadi dasar untuk aplikasi industri di berbagai industri. Saat ini, telah merambah ke ritel, logistik, kesehatan, industri, manufaktur, keuangan, pemasaran dan industri lainnya, dan telah beralih ke industri dan aplikasi praktis. **
Setengah tahun setelah model besar menjadi liar, pabrikan menyadari bahwa "skala besar" atau "parameter tinggi" tidak dapat menyelesaikan masalah praktis. Ketika periode gelembung berakhir, model besar harus kembali ke industri, kembali ke skenario nyata, dan menyelesaikan masalah praktis.Ini adalah tujuan akhir teknologi dan awal dari pengembangan model besar yang jinak. Perusahaan-perusahaan dengan data industri yang solid dan praktik skenario mulai naik ke panggung.
Jelas, model besar Jingdong Yanxi telah berlayar ke ujung lain dari nilai industri.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Dari kegemaran hingga rasionalitas, model skala besar mengantar "titik balik" industri
Semua orang berbicara tentang model besar, yang merupakan gambaran sebenarnya dari dunia teknologi pada paruh pertama tahun ini.
Dilihat dari kehebohan pasar, model skala besar telah menjadi jalur yang diburu oleh berbagai produsen teknologi. Baik itu raksasa internet, perusahaan teknologi, atau bahkan lembaga penelitian, mereka semua telah bergabung dalam huru-hara model skala besar ini. Besar -model skala telah menjadi "Battleground".
Tepat ketika pasar model skala besar domestik sedang berjalan lancar, ChatGPT, yang telah mendorong popularitas model skala besar dalam satu gerakan, telah mengalami penurunan kunjungan. Menurut data terbaru dari SimilarWeb, lembaga pemantau pihak ketiga, pada Mei tahun ini, ChatGPT mulai menunjukkan perlambatan pertumbuhan, dengan tingkat pertumbuhan hanya 2,8% pada bulan tersebut, sedangkan empat bulan pertama tahun 2023 adalah 131,6. %, 62,5%, 55,8%, 12,6%. Ini pertama kalinya ChatGPT mengalami pertumbuhan traffic negatif sejak dirilis pada 30 November 2022.
Fenomena ini mungkin mencerminkan tren industri yang penting, semua pihak berubah dari antusiasme teknis awal untuk model besar menjadi pemikiran tenang tentang komersialisasi. Dan pendaratan model skala besar juga merupakan topik yang perlu dipertimbangkan secara serius oleh semua perusahaan model skala besar.
** "JD.com percaya bahwa nilai model besar = algoritme × daya komputasi × data × kuadrat ketebalan industri," kata Xu Ran, CEO JD.com. JD.com tidak hanya mengejar kemajuan teknologi, tetapi juga memberikan perhatian khusus pada ketebalan industri - menghargai seberapa banyak skenario industri teknologi dapat diterapkan secara praktis dan dapat menciptakan berbagai nilai bagi masyarakat. **
Pada 13 Juli, JD.com meluncurkan model besar Yanxi. Menurut JD.com, ini adalah model generasi baru dengan parameter mencapai ratusan miliar dolar, dan akan sangat digunakan dalam skenario ritel, keuangan, logistik, kesehatan, industri, dan industri lainnya di masa mendatang.
Ketika efisiensi industri dan perluasan batas industri ditingkatkan secara kualitatif, model besar akan memiliki nilai dan signifikansi praktis yang lebih penting. Dalam hiruk pikuk model besar, kita harus kembali ke rasionalitas dan secara serius mempertimbangkan nilai sebenarnya dari model besar. Model besar seperti apa yang dibutuhkan industri? Bagaimana seharusnya model besar digunakan secara komersial untuk mengurangi biaya dan meningkatkan efisiensi industri?
Bersaing untuk model besar: konsensus dari umum ke industri
Semalam, model skala besar domestik "muncul" satu demi satu.
Menurut "Laporan Penelitian Peta Model Skala Besar Kecerdasan Buatan China" yang dirilis oleh Institut Informasi Sains dan Teknologi China di bawah Kementerian Sains dan Teknologi, pada 28 Mei, setidaknya 79 model skala besar dasar dengan skala lebih dari 1 miliar parameter di China telah dirilis. Jumlah model besar yang dikembangkan di negara saya menduduki peringkat kedua di dunia.
Namun, di balik melonjaknya jumlah R&D, bagaimana mewujudkan nilai komersial model besar patut ditelusuri.
Saat ini, lebih banyak model besar untuk keperluan umum yang keluar. Model skala besar jenis ini memiliki pemahaman bahasa alami yang kuat, pembuatan bahasa, dan kemampuan pengenalan ucapan, dan bekerja dengan baik dalam skenario dengan atribut umum yang kuat seperti obrolan dan hiburan. Namun, , skenario ini masih sulit untuk mencapai komersialisasi skala besar.
Dalam skenario industri yang terbagi, akurasi jawaban model besar umum rendah, karena industri itu sendiri memiliki ukuran sampel yang kecil, distribusi data yang tidak merata, dan skenario aplikasi yang berubah, yang membuat model besar tidak dapat mengoptimalkan dan meningkatkan diri sendiri. Akurasinya tentu saja tidak tinggi.
Dari perspektif komersialisasi, perusahaan mungkin tidak memerlukan model skala besar serba guna "serba guna", tetapi lebih membutuhkan model skala besar industri yang menargetkan skenario lapangan yang terbagi dan memecahkan masalah praktis.
Wu Hequan, seorang akademisi dari Chinese Academy of Engineering, pernah menunjukkan bahwa "Model-model besar yang seperti obrolan telah memicu babak baru kebangkitan, tetapi dialog, penulisan puisi, dan lukisan sama sekali bukan model-model besar. Kita perlu melakukannya pikirkan secara mendalam tentang arah penerapan model besar, dan kita harus benar-benar memasukkan model besar ke Dalam bidang pembangunan perkotaan, teknologi keuangan, biomedis, manufaktur industri, dan penelitian ilmiah, perusahaan dan organisasi profesional juga diperlukan untuk mempercepat implementasinya di industri nyata, membawa nilai nyata bagi kebutuhan mendesak industri, dan benar-benar melayani masyarakat dalam skala besar."
Saat ini, sebuah konsensus sedang dibentuk di pasar model skala besar bahwa model skala besar yang tidak dapat digunakan secara komersial hanyalah "alat hiburan", dan hanya model skala besar yang masuk jauh ke dalam industri dan memecahkan masalah praktis. nilai. Berpikir mendalam tentang nilai model besar, formula yang diusulkan oleh JD.com lebih sesuai dengan tren pasar model besar, yaitu: nilai model besar = algoritma × daya komputasi × data × kuadrat ketebalan industri.
** Dari rumus nilai model besar, kita dapat melihat bahwa model besar industri dan model besar umum tidak bertentangan. Model besar industri didasarkan pada model besar umum dan dilatih. Isinya lebih sesuai dengan kebutuhan skenario vertikal industri dan lebih tepat sasaran. **
Dalam hal rute evolusi model besar, tidak mengherankan jika JD.com berwawasan ke depan. Sejak didirikan, Jingdong telah mengakar di industri ini, dan secara alami lebih memperhatikan nilai model besar di industri ini.
"Jingdong memperhatikan model-model besar dan inovasi teknologi lainnya. Selain mengejar sifat teknologi yang maju, ia juga memberikan perhatian khusus pada ketebalan industri - berapa banyak skenario industri yang dapat diterapkan secara praktis oleh teknologi untuk benar-benar menciptakan nilai bagi masyarakat. "kata Xu Ran, CEO Jingdong.
**Faktanya, pengembangan model besar pada tahap ini sedang berpindah dari "universal" ke "industri". **
Laporan penelitian terbaru yang dirilis oleh Minsheng Securities menyebutkan bahwa setelah periode rilis intensif model besar dari Februari hingga Maret, periode pengembangan produk dari April hingga Mei dan arah kebijakan secara bertahap diklarifikasi, produk dan aplikasi model besar akan dimulai pada bulan Juni. . Diharapkan untuk mengantarkan rilis terpusat. Gelombang rilis baru didasarkan pada produk aplikasi model skala besar, dan peningkatan skala besar sudah mulai online, bersiap untuk memasuki ribuan rumah tangga.
Baru-baru ini, sebagian besar model skala besar terbaru yang dirilis oleh perusahaan teknologi dalam negeri ditujukan untuk industri vertikal. Di luar negeri, berbagai perusahaan berturut-turut merilis model industri skala besar dengan skala berbeda, dengan tujuan untuk menerapkannya ke bidang industri.
Dari tren aktual produsen besar di dalam dan luar negeri, tidak sulit untuk melihat bahwa model industri akan lebih dapat membantu mitra industri untuk menyelesaikan transformasi digital, mengurangi biaya dan meningkatkan efisiensi, serta menciptakan nilai yang lebih besar bagi industri dan masyarakat. .
Model industri besar, sulit untuk meletakkan dasar yang kokoh bagi industri
Kesulitan membangun model skala besar industri jauh lebih tinggi daripada model skala besar tujuan umum.
Jika model skala besar umum menguji daya komputasi dan akumulasi algoritme perusahaan, maka model skala besar industri menguji akses perusahaan ke dan pemahaman skenario bisnis, serta akumulasi dan penerapan data industri.
Konsensus industri adalah bahwa dalam pelatihan model industri besar, hal yang paling sulit diperoleh adalah data industri. Data industri seringkali berada di tangan perusahaan, karena keamanan data dan pertimbangan lainnya, hanya sedikit perusahaan yang mau mengungkapkan data pribadi. Namun, data industri ini seringkali secara langsung atau tidak langsung memengaruhi kecepatan iterasi teknis, akurasi model, dan profesionalisme bisnis model industri besar.
"Data industri juga dapat dibagi menjadi data statis dan data dinamis. Data statis relatif stabil, tidak akan segera berubah, dan jalur akuisisi relatif jelas. Data dinamis adalah data yang dihasilkan setiap saat dalam skenario industri yang berbeda. Ini bagian dari data adalah data adegan 'Hidup'. Tidak mudah untuk mendapatkannya, tetapi ini adalah salah satu elemen penting dari model industri." He Xiaodong, Presiden Lembaga Penelitian JD dan Presiden Departemen Layanan dan Produk Teknologi JD, menekankan.
Namun, pelatihan model industri besar tidak bisa hanya menggunakan data industri, tetapi masih perlu menggunakan data umum dalam jumlah besar untuk memberikan pengetahuan yang masuk akal. Alasannya adalah sebagai berikut: Pertama, generalisasi data industri tidak mencukupi, dan model besar perlu dilatih ulang setiap kali adegan diubah, yang mahal; Terjebak dalam keadaan macet.
He Xiaodong membandingkan pelatihan model industri besar dengan pelatihan seseorang, "Jika seseorang langsung bekerja setelah lulus SMA, sepertinya baik-baik saja, tetapi profesionalismenya akan kurang profesional. Jika Anda dapat menyelesaikan empat tahun gelar sarjana sebelum bekerja, Anda memiliki pengetahuan umum Kemampuan dan pengetahuan profesional yang memadai adalah kemampuan yang harus dimiliki oleh model industri besar.
Untuk alasan ini, data model besar JD Yanxi terdiri dari 70% data umum dan 30% data mentah dari pertumbuhan adegan rantai pasokan.
Perlu disebutkan bahwa data industri ini berasal dari JD.com sendiri. JD.com sendiri adalah perusahaan berbasis supply chain yang berakar dari berbagai industri, tidak hanya memiliki data praktis di bidang ritel, logistik, keuangan, kesehatan, industri dan industri lainnya, tetapi juga memiliki data kota, urusan pemerintahan, keuangan, manufaktur, industri, penerbangan, transportasi, dll. Data industri yang tidak peka seperti kawasan industri, kawasan industri, dan energi, dan data berkualitas tinggi yang dihasilkan setiap tahun mencapai 10 miliar keping.
Selain pasokan berkelanjutan data industri berkualitas tinggi, model industri besar juga perlu memahami Pengetahuan industri, yaitu memiliki pengetahuan unik tentang industri dan memiliki persyaratan pemahaman yang lebih tinggi. Misalnya, industri ritel lebih memperhatikan pengaruh pemasaran dan rekomendasi, dan industri keuangan lebih memperhatikan pengaruh pengendalian risiko, kehandalan dan keamanan.
Untuk permintaan ini, rantai pasokan intelijen digital jangka panjang JD.com telah memainkan peran kunci, dan telah menjadi fokus upaya JD.com dalam penerapan model besar. Model besar juga dapat didasarkan pada kecerdasan digital dari rantai pasokan dan masuk jauh ke dalam industri fisik.
Dilaporkan bahwa rantai pasokan intelijen digital JD.com telah mencakup lebih dari 10 juta SKU produk yang dioperasikan sendiri oleh JD.com, melayani lebih dari 8 juta pelanggan korporat aktif, termasuk lebih dari 90% dari 500 perusahaan teratas dunia di Tiongkok, dan hampir 70% dari UKM khusus baru di negara tersebut. Pada saat yang sama, rantai pasokan intelijen digital JD.com masih ada di dalam negeri, dan memiliki kerja sama yang mendalam dengan lebih dari 2.000 sabuk industri.
Rantai pasokan intelijen digital semacam ini dengan tautan yang lebih panjang, skenario yang lebih kompleks, dan data yang lebih kaya adalah "tempat pelatihan" yang sangat baik untuk model besar. Dalam pandangan JD Cloud, nilai model besar hanya dapat diwujudkan dengan memahami rantai pasokan secara menyeluruh dan membiarkan model besar "berjalan" di rantai pasokan.
Selain akumulasi di sisi industri, kekuatan JD.com dalam algoritme dasar dan daya komputasi tidak boleh diremehkan.
Pada tahun 2021, JD Discovery Research Institute meluncurkan klaster komputasi berskala ultra besar pertama di negara itu berdasarkan arsitektur DGX SuperPOD di Chongqing-Tianqin α, yang meningkatkan kecepatan penalaran sebesar 6,2 kali dan mengurangi biaya penalaran sebesar 90%. Ini memberi JD.com jaminan paling dasar untuk pelatihan model berskala besar.
Pada tahun yang sama, JD.com meluncurkan model K-PLUG tingkat miliaran.Salinan produk yang dihasilkan oleh K-PLUG telah mencakup lebih dari 3.000 kategori di JD.com, menghasilkan total 3 miliar kata, dan lulus tinjauan manual tingkat melebihi 95%. Pada tahun 2022, model besar JD.com akan ditingkatkan menjadi puluhan miliar model Vega, yang dapat digunakan secara luas dalam berbagai tugas pemrosesan bahasa alami hilir seperti analisis sentimen, pencocokan semantik, koreksi kesalahan tata bahasa, menjawab pertanyaan cerdas, dan akal sehat pemikiran.
Berkat akumulasi sebelumnya, JD.com membuat terobosan teknologi lainnya tahun ini, dan meluncurkan generasi baru model skala besar JD.com dengan ratusan miliar parameter, dengan fokus pada beberapa tugas utama seperti pembuatan konten, dialog manusia-mesin, pemahaman maksud pengguna, ekstraksi informasi, dan klasifikasi emosi. , mewujudkan penyempurnaan model dasar + model domain vertikal, dan menerapkan skenario vertikal mendalam seperti urusan ritel, logistik, keuangan, kesehatan, dan pemerintahan.
Saat ini, model industri besar yang diwakili oleh JD.com sedang melatih model besar melalui akumulasi data dan pengetahuan berbasis industri dan skenario, dan mengoreksi model besar berdasarkan akumulasi Pengetahuan industrinya, untuk meningkatkan kinerja model besar dalam industri tertentu dan skenario aplikasi, dan untuk meningkatkan kemampuan kontrol. Ini setara dengan menyelesaikan "pendidikan umum" untuk AI.
** Model besar Jingdong secara bertahap masuk ke berbagai industri untuk meningkatkan tingkat kecerdasan rantai pasokan. Sebaliknya, peningkatan kecerdasan digital rantai pasokan juga mendorong transformasi industri, yang pada gilirannya menyediakan data yang lebih kaya untuk model besar, membentuk siklus positif. **
"Memotong model skala besar dari sisi industri seperti mendaki Gunung Everest teknis dari lereng utara: meskipun jalannya lebih sulit, ada pemandangan yang lebih indah. Jingdong bersikeras melakukan 'hal-hal yang sulit tetapi benar', bersikeras pada melakukan hal yang praktis, berharga dan Ini adalah masalah jangka panjang. Di bidang teknis dan model besar, ini adalah komitmen konstan kami," kata Xu Ran.
** "Hal-hal yang sulit dan benar" membutuhkan akumulasi jangka panjang. Namun, dalam hal konstruksi model industri, JD.com telah meletakkan fondasinya dengan jelas. **
Jingdong, lahir di industri, menciptakan nilai industri dengan model besar
"Di zaman model besar, apa pun layak dilakukan lagi dengan model besar."
Di bawah gelombang model besar, industri dengan cepat mencapai konsensus di atas. Namun, sementara pabrikan besar lainnya mencari model bisnis melalui berbagai strategi, arah industri pendaratan Jingdong tidak pernah berubah.
"Atribut industri adalah fitur khas dari teknologi JD.com. Setiap teknologi yang dikembangkan oleh JD.com berasal dari kebutuhan industri, pengalaman dalam skenario industri, dan menciptakan nilai industri," kata Xu Ran.
Saat ini, model skala besar JD Yanxi bergerak maju sesuai dengan strategi "tiga langkah": saat ini, JD Cloud telah membangun model besar tujuan umum berdasarkan praktik internal; pada akhir tahun ini, JD. Layanan industri yang solid; diharapkan pada awal 2024, kapabilitas model skala besar akan dibuka untuk skenario bisnis eksternal yang serius.
Dari sudut pandang praktis, model besar JD.com telah mencapai langkah kedua JD.com menerapkan kemampuan model besar ke skenario yang paling dikenal seperti ritel, keuangan, logistik, dan kesehatan, dan telah merambah ke berbagai link.
Misalnya, Jingdong sedang meningkatkan kemampuan layanan pelanggan yang cerdas melalui model-model besar. Bidang layanan pelanggan berbeda dari obrolan dan percakapan sehari-hari, ini adalah adegan dialog berbasis tugas yang serius yang perlu menyelesaikan berbagai masalah kompleks antara pembeli dan penjual di dunia nyata.
"Ketika pengguna berbicara dengan ChatGPT, tidak masalah meskipun jawabannya salah, dan itu tidak akan memengaruhi pengambilan keputusan. Tetapi jika dalam skenario bisnis yang serius, layanan pelanggan yang cerdas menjawab salah, konsekuensinya tidak terbayangkan . Oleh karena itu, keakuratan jawaban sangat penting." Komite Teknis Grup Jingdong Cao Peng, Ketua dan Presiden Divisi JD Cloud, berkata.
Untuk skenario layanan pelanggan yang cerdas, JD.com tidak hanya membuat model besar dengan pemahaman semantik dasar dan logika tanya jawab, tetapi juga memoles model kecil untuk skenario tertentu. Jika masalah pelanggan melibatkan pengembalian dan pertukaran umum, dll., Layanan Pelanggan yang cerdas akan memanggil model besar yang lebih umum. Dan begitu pertanyaannya melibatkan kebijakan garansi dan aturan perlindungan harga produk tertentu, layanan pelanggan yang cerdas akan memanggil model kecil yang lebih bertarget untuk memberikan jawabannya. Model yang berbeda dapat mengambil tanggung jawab yang berbeda.
Sekarang, layanan pelanggan cerdas bekerja di dalam JD.com, membantu lebih dari 20.000 karyawan layanan pelanggan mandiri mengurangi biaya dan meningkatkan efisiensi, serta terus mengoptimalkan pengalaman layanan pelanggan. JD.com juga telah membuka kemampuan layanan pelanggannya yang cerdas ke dunia luar untuk membantu lebih banyak lembaga pemerintah dan perusahaan melakukan transformasi dan peningkatan digital dan cerdas.
Dalam hal layanan eksternal untuk model besar, JD.com masih mempertahankan kecepatannya yang "lambat", dan tidak terburu-buru untuk "menjual" model besar ke perusahaan. Alasannya adalah kecerdasan buatan adalah perubahan teknologi yang sangat serius: jika digunakan dengan baik, dapat mengubah industri, tetapi jika digunakan secara tidak benar, juga dapat menimbulkan konsekuensi yang serius. Dalam keadaan seperti itu, Jingdong menganut mentalitas jangka panjang dan merupakan pilihan yang sangat baik.
"JD.com tidak akan menyajikan hidangan yang belum mencapai 'penuh warna, rasa, dan cita rasa'. Setelah model skala besar menyelesaikan pengalaman dan praktik di adegan internal utama, itu akan dibuka untuk mitra untuk membantu seluruh industri mengurangi biaya dan meningkatkan efisiensi." Xu Ran mengungkapkan.
Dalam rencana JD.com, model besar Yanxi akan menjadi dukungan teknis tingkat terendah. Berdasarkan kemampuannya, bidang tersebut akan menghasilkan serangkaian produk, dan produk di bidang yang sama akan digabungkan menjadi satu platform, dan akhirnya menghasilkan nilai bagi industri.
Misalnya, di bidang pembuatan konten, JD.com telah membangun platform pemasaran konten JD Cloud AIGC. Berdasarkan akumulasi data produk yang kaya dari seluruh kategori JD.com, model besar dapat lebih memahami karakteristik produk, membantu penjual secara otomatis membuat gambar produk, titik penjualan, dan materi pemasaran lainnya, serta meningkatkan efisiensi operasional pedagang dan kualitas konten pemasaran.
Dengan kata lain, merchant hanya perlu mengunggah gambar produk, dan dapat dengan cepat memperoleh beberapa jenis gambar seperti gambar produk utama, gambar poster pemasaran, dan gambar detail bisnis yang diperlukan untuk operasional e-commerce, memenuhi kebutuhan pembukaan toko yang cepat, daftar produk dan pemasaran. Kemampuan ini dapat menghemat 90% biaya penarikan bagi pedagang, dan mempersingkat siklus produksi dari 7 hari menjadi setengah hari.
Menggunakan kemampuan model berskala lebih besar, pedagang bahkan tidak perlu menjual barang mereka sendiri, tetapi hanya perlu menggunakan manusia digital multi-modal JD Cloud untuk mengirimkan barang 24 jam sehari dengan biaya rendah.
Selain aplikasi tersebut, JD.com juga mendemonstrasikan platform operasi pemasaran AI di bidang keuangan. Melalui dialog sederhana, pengguna dapat menghasilkan aktivitas pemasaran dalam satu atap, yang mencakup perumusan strategi operasional, penjadwalan tugas pemasaran, membuat halaman aktivitas, pembuatan salinan dan materi pemasaran, pengiriman digital, dll. Menurut data yang relevan dari JD.com, di masa lalu rangkaian proses ini membutuhkan lima jenis personel fungsional: produk, R&D, algoritme, desain, dan analis, tetapi sekarang telah direduksi menjadi satu orang; di masa lalu, prosesnya membutuhkan 2.000 interaksi manusia-komputer, tetapi juga telah dikurangi menjadi kurang dari 50. Dengan dukungan kapabilitas model yang besar, efisiensi produksi dari rencana pemasaran telah meningkat secara signifikan.
** Dapat dikatakan bahwa model industri besar JD.com menjadi dasar untuk aplikasi industri di berbagai industri. Saat ini, telah merambah ke ritel, logistik, kesehatan, industri, manufaktur, keuangan, pemasaran dan industri lainnya, dan telah beralih ke industri dan aplikasi praktis. **
Setengah tahun setelah model besar menjadi liar, pabrikan menyadari bahwa "skala besar" atau "parameter tinggi" tidak dapat menyelesaikan masalah praktis. Ketika periode gelembung berakhir, model besar harus kembali ke industri, kembali ke skenario nyata, dan menyelesaikan masalah praktis.Ini adalah tujuan akhir teknologi dan awal dari pengembangan model besar yang jinak. Perusahaan-perusahaan dengan data industri yang solid dan praktik skenario mulai naik ke panggung.
Jelas, model besar Jingdong Yanxi telah berlayar ke ujung lain dari nilai industri.