ChatGPT telah menjadi produk fenomenal yang tidak diragukan lagi di industri teknologi informasi global.
Atas nama "kecerdasan buatan umum", ia mengobrol dengan manusia, membantu orang membuat draf email dan surat pengacara, menjawab beberapa pertanyaan filosofis esoterik, menulis kode Python yang dapat digunakan, dan menjawab beberapa pertanyaan yang tampaknya memerlukan logika kompleks dan progresif. , Menulis naskah film berdasarkan beberapa setting karakter, menulis puisi cinta yang indah, menangkap pisau untuk pekerjaan rumah tesis mahasiswa... Sepertinya tidak ada spesies AI yang serbaguna dalam sejarah manusia. Bill Gates mengatakan bahwa signifikansi munculnya ChatGPT adalah "tidak kurang dari kelahiran Internet", CEO Microsoft Satya Nadella mengatakan bahwa itu sebanding dengan revolusi industri, penggemar kecerdasan buatan lisan sekali lagi berseru bahwa "singularitas" adalah datang, orang biasa sekali lagi khawatir pekerjaan mereka akan digantikan oleh asisten AI serba bisa seperti ChatGPT... Dari "Biru Tua" IBM, ke AlphaGo Google, dan kemudian ke ChatGPT OpenAI, 25 tahun telah berlalu, AI terus berkembang , dan kehidupan sehari-hari manusia untuk AI Menanggapi tanpa menunjukkan kedewasaan mental, ini benar-benar sesuatu yang membuat AI senang.
Saya telah menggunakan ChatGPT untuk melakukan banyak hal yang tak terlukiskan, dan menemukan bahwa itu tidak selalu berguna, tetapi dapat memberikan jawaban dan solusi yang lebih baik untuk beberapa masalah yang tampaknya lebih sulit. Misalnya, jika Anda bertanya apakah BYD dapat mengalahkan Tesla, itu mungkin memberikan beberapa argumen yang jelas dan biasa-biasa saja dengan banyak kesalahan faktual dan tidak ada kepribadian pada saat yang sama; tetapi jika Anda bertanya bagaimana mengemudi otonom akan mengubah mobil untuk desain industri, itu dapat memberikan pembahasan penuh imajinasi dari dalam hingga luar dalam hal inovasi sasis, ubahan interior, hiburan digital, dan terobosan tampilan. Secara keseluruhan, ChatGPT cukup tidak sempurna, terutama dalam hal penyampaian akurasi yang meyakinkan, namun seringkali mengejutkan manusia di berbagai bidang seperti memberikan wacana informasi yang terstruktur, membuka imajinasi, dan membebaskan kreativitas. Anda tidak dapat mengatakan kegunaan spesifiknya untuk Anda, tetapi ini dapat membantu Anda mencapai dan menyelesaikan beberapa hal sepele, berlebihan, dan bahkan kreatif.
Ini adalah ChatGPT yang tampaknya tidak berguna tetapi bermanfaat, yang tampaknya berguna tetapi tidak berguna, yang mendorong perusahaan induknya OpenAI menerima investasi kumulatif tambahan lebih dari 10 miliar dolar AS dari Microsoft. Butuh dua hari untuk menembus 1 juta Facebook pernah menghabiskan 305 hari; butuh dua bulan untuk mencapai 100 juta pengguna, bahkan TikTok butuh sembilan bulan - ingat, tidak seperti Facebook dan TikTok, ChatGPT belum menjadi produk Internet tingkat konsumen yang berdiri sendiri, itu masih hanya sebuah Jaringan saraf besar dengan 175 miliar parameter menggunakan model bahasa alami GPT-3 - ketika dilisensikan secara khusus ke Microsoft untuk mengintegrasikan perangkat lunak perkantoran dan layanan mesin pencari seperti Office dan Bing, itu benar-benar menjadi produk yang "tersedia".
Sumber: Situs web resmi OpenAI
Tapi itu cukup membuat unicorn AI China cemburu.
Dengan 500 karyawan, valuasi keseluruhan perusahaan mendekati 30 miliar dolar AS. Ini adalah OpenAI; dengan ribuan orang, valuasi / nilai pasar perusahaan paling banter 1-2 miliar dolar AS. Ini adalah sejumlah AI "raksasa kecil " Di Tiongkok.
Karena kesenjangan yang sangat besar antara efisiensi dan nilai manusia, dan karena pengaruh tiba-tiba ChatGPT pada masyarakat nyata semua manusia, kelahiran ChatGPT telah sangat mendorong bidang kecerdasan buatan di Tiongkok. Banyak orang melompat keluar lagi, merasa bahwa kesenjangan antara China dan Amerika Serikat dalam kecerdasan buatan semakin melebar, dan China masih harus menempuh jalan panjang untuk mengejar gelombang ini. Ada juga beberapa orang yang tertarik untuk membahas mengapa China tidak memiliki ChatGPT sendiri, dan kesimpulannya tetap bahwa "China tidak memiliki lahan untuk inovasi" dan "Perusahaan Internet China terlibat dalam siaran langsung dan belanja bahan makanan", yaitu tidak bertanggung jawab dan tidak mengetahui fakta.
Perusahaan Internet Cina tidak semuanya terlibat dalam siaran langsung dan belanja bahan makanan, mereka terlibat dalam pengembangan semikonduktor, penelitian model AI, dan mengemudi otonom; Perusahaan Internet Amerika juga sangat populer dalam siaran langsung, belanja bahan makanan, terutama keuangan Internet. Gunakan senter dan kaca pembesar untuk menemukan masalah Anda sendiri, cobalah untuk mempercantik lawan Anda, gunakan concealer untuk menutupi masalah lawan Anda, dan menyalahkan penyebabnya dengan alasan sederhana dan kasar. Anda bisa tutup mulut. Ini bukan untuk merenungkan mengapa China bisa ' t menjadi yang pertama menciptakan dirinya sendiri Pose yang benar untuk model kecerdasan buatan generatif.
Sebagai perusahaan Internet Cina dengan akumulasi terbesar di bidang kecerdasan buatan dan pemrosesan semantik alami, Baidu telah mengerjakan model pembelajaran mendalamnya sendiri "Paddle Paddle" selama lima tahun terakhir, dan bahkan menggunakan chip AI tujuan umum sendiri "Kunlun Core" untuk melatih model Sendiri - mereka adalah lingkungan dasar dan premis Baidu untuk melatih "ChatGPT" miliknya sendiri. Alibaba, ByteDance, dan Didi juga memiliki model pelatihan semantik alami berdasarkan kebutuhan mereka sendiri. Dapat dikatakan bahwa dalam hal pelatihan model semantik alami yang kompleks dengan puluhan miliar parameter, perusahaan dan lembaga penelitian China tidak lemah, dan titik awal mereka tidak lebih rendah dari rekan Amerika mereka — setidaknya sekitar tahun 2016. Dalam beberapa tahun terakhir, kesenjangan antara lingkaran kecerdasan buatan China dan Amerika di bidang model skala besar bukanlah masalah kesadaran, titik awal, dan kemampuan, tetapi masalah jalan dan metode.
Kesenjangan antara China dan Amerika Serikat di bidang model dialog manusia-komputer seperti ChatGPT tidak disebabkan oleh apa yang disebut regulasi. Jika Anda telah melakukan percakapan jujur dengan ChatGPT tentang beberapa masalah agama, budaya, etnis, dan geopolitik yang lebih kaya, Anda akan menyadari bahwa ia menyembunyikan sikap tertentu di balik diskusi yang tampaknya penolakan dan kehati-hatian tentang masalah ini , yang secara halus bertepatan dengan nilai-nilai arus utama secara umum diakui dalam masyarakat Amerika. Dapat dikatakan bahwa untuk model kompleks semantik alami apa pun, proses konstruksi model, pengumpulan korpus, pelatihan, dan penyesuaian parameter adalah proses "peninjauan konten" berdasarkan sistem nilai tertentu, dan ada kebutuhan untuk mempertahankannya. sistem nilai kesadaran diri Ini bukan pertanyaan apakah kita harus "menghasilkan" posisi nilai China dalam model semantik alami, tetapi bagaimana itu harus dihasilkan untuk benar-benar memeriksa dan menyeimbangkan pandangan dunia dan hegemoni budaya bahwa bahasa Inggris mendominasi korpus Internet global, dan memperkuat tolok ukur untuk pemahaman bahasa Cina Bobot sistem pemrosesan semantik alami global memberikan keragaman budaya untuk pengembangan kecerdasan buatan dan dialog manusia-komputer di dunia.
Saya juga sangat tidak setuju dengan pernyataan bahwa kualitas informasi Internet Cina terlalu buruk sehingga sumber korpus model ChatGPT Cina "tercemar" Ini juga merupakan penilaian yang malas dan cerdas. Karena jumlah total informasi di Internet, konten bahasa Inggris tidak diragukan lagi yang paling banyak di dunia, dan konten ekstrim dengan kualitas yang mengkhawatirkan juga paling banyak, yang semuanya akan mempengaruhi proses dan hasil pelatihan model semantik alami. Pada pelatihan awal, ChatGPT mengutamakan konten yang sangat dipuji di forum sosial Reddit dengan kualitas konten yang tinggi, yang memiliki kecenderungan pemilihan korpus tertentu. Jika China memprioritaskan komunitas pengetahuan seperti Zhihu dan Dede, dan media arus utama memprioritaskan korpus model semantik, tidak akan ada masalah kontaminasi korpus. Belum lagi kemahiran bahasa asing dan keluasan membaca kebanyakan orang yang berpendapat bahwa "kualitas konten berbahasa Mandarin rendah" tidak cukup untuk mendukung kesimpulan mereka.
Namun bagaimanapun juga, kelahiran ChatGPT memang merupakan semacam rangsangan dan tantangan konseptual bagi saya, yang telah menyerukan "perpisahan dengan pemujaan Silicon Valley" selama bertahun-tahun.
Ini bukan karena menurut saya kesenjangan antara China dan Amerika Serikat di bidang kecerdasan buatan telah melebar, tetapi karena model dialog manusia-komputer kecerdasan buatan umum seperti ChatGPT adalah kemungkinan nyata dari semua manusia — bukan bidang tertentu dan Dari perspektif industri, itu adalah alat untuk mempromosikan kolaborasi produksi sosial dan proses peradaban. Signifikansinya lebih besar daripada kemunculan Internet seluler, sebanding dengan kelahiran email dan mesin pencari. Sebagai negara kecerdasan buatan yang besar, China bukan lagi negara dengan industri teknologi informasi yang buruk ketika email dan mesin pencari lahir. Namun, kami belum membiarkan inovasi kecerdasan buatan umum semacam ini yang dapat mempengaruhi kemajuan peradaban manusia terjadi pertama di Cina Melatih model yang korpus dasarnya dibangun dari budaya dan sistem nilai Cina.
Terlebih lagi, metode pelatihan model ChatGPT sebagian besar bergantung pada peningkatan parameter "keajaiban yang diperkuat", pelatihan berulang, dan pengoptimalan iteratif berkelanjutan dari model berdasarkan umpan balik dari konten yang dihasilkan - ini pada awalnya adalah metode kerja yang paling baik dilakukan oleh tim Cina . Ketika sebuah perusahaan start-up Amerika menggunakan uang yang dikumpulkan dari Microsoft untuk menginvestasikan sejumlah besar daya komputasi dengan biaya berapa pun, mempekerjakan sejumlah besar pekerja data di Afrika dan Timur Tengah untuk pelabelan informasi, dan menggunakan iterasi yang paling efisien untuk melakukan model besar pemrosesan semantik yang dikembangkan sendiri dengan raksasa seperti Google Anda masih memiliki perasaan yang sangat tidak nyata dalam hal "perlombaan senjata" - apakah ini perusahaan San Francisco atau perusahaan Shenzhen.
Model pemrosesan semantik alami seperti ChatGPT seharusnya lahir di China tetapi tidak lahir di China.Alasannya harus dimulai dengan perusahaan teknologi China yang bergerak di bidang kecerdasan buatan — tidak peduli apa yang dilakukan raksasa atau startup tahun ini.
Masalah yang mungkin tidak pernah disadari oleh banyak orang adalah bahwa model pemrosesan semantik alami tujuan umum berskala super besar seperti ChatGPT kemungkinan besar akan menghasilkan keajaiban saat dibangun oleh perusahaan rintisan AI, dan hasil yang lebih baik biasanya tidak dicapai dalam raksasa teknologi . Inilah sebabnya mengapa model aplikasi dialog LaMDA Google dan Bard, yang baru-baru ini bergegas ke medan perang, tidak bersinar, dan itu juga merupakan tantangan yang pasti akan dihadapi Baidu selanjutnya.
Mengapa? Yang pertama adalah karena pemodelan pemrosesan semantik natural secara umum terlalu mahal. Nyatanya, membakar uang biasanya bukan keahlian perusahaan besar, melainkan keistimewaan para pemula. Raksasa teknologi hampir semuanya adalah perusahaan yang terdaftar. Investasi puluhan miliar dolar telah diinvestasikan dalam masalah yang tidak akan menghasilkan pengembalian untuk waktu yang lama. Tekanan pada chief financial officer di hadapan dewan direksi dan pemegang saham pertemuan sangat tinggi, dan seringkali Dihukum oleh harga saham, hal ini menyebabkan perusahaan besar tidak berani mengambil risiko besar, dan tidak akan ada iterasi besar tanpa risiko besar. Apa itu "Membuat Keajaiban dengan Penuh Semangat"? Ini adalah menghabiskan banyak uang dan melakukan upaya besar terlebih dahulu, dan kemudian berdoa agar keajaiban terjadi, bukannya menyetujui bahwa keajaiban harus terjadi, dan kemudian memutuskan untuk mengeluarkan uang dan melakukan upaya besar.
Sayangnya, perusahaan besar hanya bisa menjadi yang terakhir. Inilah sebabnya bahkan Microsoft, yang mendapat banyak keuntungan dari ChatGPT, hanya berani memulai dari $1 miliar di awal, yang berlangsung selama empat tahun, hingga tahun ini $10 miliar, dan terus berinvestasi satu per satu untuk mendukung OpenAI di Microsoft.” In vitro", model GPT telah dilatih selama bertahun-tahun. Ekuitas yang diperoleh Microsoft melalui investasi di OpenAI menikmati prioritas untuk mengintegrasikan kemampuan model ChatGPT ke dalam Office dan mesin pencarinya.Mungkin tidak mudah untuk mengatakan apakah akan memakan OpenAI di masa mendatang, tetapi setidaknya nilai pasarnya hampir satu triliun Dolar AS Microsoft, dengan pendapatan puluhan miliar dolar, tidak akan pernah berani "melakukan keajaiban dengan penuh semangat" sejak awal dan melatih model ini sendiri.
Kedua, karena orang kurang toleran terhadap raksasa teknologi yang terlibat dalam inovasi, dan lebih toleran terhadap kesalahan dan penyimpangan dalam startup. Untuk mengatasi tekanan ChatGPT, Google buru-buru meluncurkan versi pengujian dialog manusia-komputer Bard. Ditemukan bahwa beberapa dialog memiliki kesalahan faktual dasar, sehingga diperbesar tanpa batas, dan nilai pasar menguap ratusan miliar dolar dalam semalam . Faktanya, bukan karena Google tidak mengetahui hal ini, jika tidak terburu-buru, itu tidak akan terlalu terburu-buru. Model LaMDA yang diumumkan oleh Google pada tahun 2021 memiliki tingkat parameter dan kemampuan pencarian informasi yang jauh lebih tinggi daripada GPT-3 yang dilatih oleh OpenAI saat itu.
Apa yang Google pedulikan, OpenAI tidak peduli. Sejak hari pertama rilis ChatGPT, secara terbuka menyatakan bahwa ia tidak memiliki kemampuan pencarian informasi, dan korpusnya hanya hingga Desember 2021. Ia tidak dapat menjawab banyak pertanyaan tentang penilaian nilai dan moral, dan sering membuat kesalahan faktual. Para penguji dengan toleran menerima "kinerja buruk" diri ChatGPT, dan mereka semua puas dengan asosiasi informasi, ekspresi emosional, struktur logis, dan koherensi pemikiran di bidang pemrograman, kreasi sastra, penulisan berformat, dan konsultasi medis. kekuatan seri, dengan ringan menghilangkan kesalahan yang dibuatnya.
Pada Maret 2019, setelah kesuksesan model GPT-2 yang belum pernah terjadi sebelumnya, OpenAI yang berusia empat tahun memutuskan untuk bertransformasi dari yayasan nirlaba menjadi perusahaan komersial. Lagipula, tidak ada yayasan yang tahan dengan gaji tahunan kepala ilmuwannya sebesar $1,5 juta Pada Mei 2019, Sam Altman (Sam Altman) menjadi CEO OpenAI. Kemudian, OpenAI menerima investasi $1 miliar dari Microsoft. Pada Mei 2020, model GPT-3 yang diluncurkan oleh OpenAI memiliki parameter yang meningkat tajam dari 1,5 miliar di GPT-2 menjadi 175 miliar, membentuk sistem pembelajaran otomatis yang sangat kuat.
Dapat dilihat bahwa perusahaan rintisan kecerdasan buatan yang lahir dengan sendok emas di mulutnya, mengumpulkan banyak uang, dan digabungkan dengan bisnis raksasa, terlibat dalam pembangunan dan pengembangan kecerdasan buatan tujuan umum model semantik alami, dan berinvestasi dalam pelatihan model terlepas dari biaya, yang merupakan kondisi paling ideal. Pengembalian imajinatif dan komersial yang datang dengan model paling kuat sudah cukup untuk memacu Microsoft dan investor lainnya.
Jadi, mengapa logika ini tidak bekerja di Cina? Apakah China pernah memiliki model kecerdasan buatan semantik alami yang kuat untuk tujuan umum, bahkan jika itu hanya sebuah prototipe?
Untuk menjawab pertanyaan ini, lihat kapan Microsoft pertama kali berinvestasi di OpenAI: Juli 2019. Empat bulan setelah Microsoft bertaruh pada model GPT OpenAI, yaitu pada November 2019, Shen Xiangyang, seorang ilmuwan komputer dari Hong Kong, China, yang bertanggung jawab atas bisnis pencarian Bing dan juga orang teratas yang bertanggung jawab atas kecerdasan buatan Microsoft, mengumumkan kepergiannya Bekerja untuk Microsoft selama lebih dari 20 tahun. Dan kontribusi terakhir Shen Xiangyang untuk model kecerdasan buatan umum Microsoft adalah robot obrolan Xiaobing yang dikembangkan oleh Microsoft Asia Internet Engineering Institute pada tahun 2014.
Pada Juli 2020, Xiaoice menjadi independen dari Microsoft dan menjadi perusahaan rintisan kecerdasan buatan Tiongkok. Shen Xiangyang menjabat sebagai ketua, dan Li Di, mantan wakil presiden eksekutif Akademi Teknik Internet Asia Microsoft, menjabat sebagai CEO. Ketika Xiaoice menjadi mandiri, ia telah berkembang hingga lebih dari generasi keenam.Bentuk produknya melibatkan robot kecerdasan buatan percakapan, asisten suara cerdas, penyedia konten yang dibuat oleh kecerdasan buatan, dan serangkaian solusi bidang vertikal. Xiaoice pernah memicu perbincangan publik, selain menjadi robot obrolan yang penuh emosi dan seksualitas perempuan, ia juga memiliki kinerja yang luar biasa di bidang penciptaan puisi Tiongkok - ia menerbitkan kumpulan puisi "Sunshine Lost the Glass Window", yang telah mendapat banyak perhatian, banyak pujian, dan lebih banyak kontroversi.
Tidak ada keraguan bahwa robot XiaoIce yang dapat menulis puisi dan melakukan percakapan berbasis emosi dan akal sehat sederhana adalah model kecerdasan buatan umum percakapan dengan kinerja terbaik di dunia beberapa tahun yang lalu.
Tidak mungkin tim yang dipimpin oleh Shen Xiangyang memahami pencarian, apalagi kecerdasan buatan. Dan kepergian Shen Xiangyang dari "kemerdekaan" Microsoft dan Xiaobing, ditambah dengan investasi dan kerja sama CEO Microsoft Nadella dengan OpenAI, sebenarnya adalah pedagang kecerdasan buatan teratas di China dan Amerika Serikat. Secara resmi berpisah.
Jadi, apakah Xiaobing masih menulis puisi hari ini? apa yang sedang dilakukannya
Dalam dua tahun terakhir, Xiaobing sudah lama berhenti menulis puisi. Sibuk dikomersialkan. Itu mendirikan studio game untuk menyediakan konten dialog skrip NPC untuk game; itu bekerja sama dengan Olimpiade Musim Dingin untuk menyediakan sistem penilaian visual untuk keterampilan udara ski gaya bebas; Vanke dan perusahaan lain telah menyesuaikan manusia digital virtual untuk layanan pelanggan ... Ini adalah bekerja keras untuk menjadi perusahaan solusi kecerdasan buatan yang "memberdayakan" semua lapisan masyarakat dan pada saat yang sama memungkinkan dirinya menghasilkan darah dan menghasilkan uang.
Singkatnya, di masa lalu, tim kecerdasan buatan yang mewakili tingkat yang lebih tinggi dari model kecerdasan buatan semantik alami umum, dan orang Cina mendukung seluruh pola, kini telah menjadi campuran kecerdasan buatan generatif dan kecerdasan buatan pengambilan keputusan, menyediakan solusi spesifik untuk skenario tertentu Penyedia solusi kecerdasan buatan.
Anda tidak bisa mengatakan bahwa ini adalah "kejatuhan" Xiaoice, lagipula, itu hanya mengumpulkan ratusan juta yuan dari pasar modal. Menurut metode pelatihan model ChatGPT, uang akan dihabiskan dalam satu hari. Tanpa perlindungan Microsoft, Xiaobing harus mengurus hidupnya sendiri. Namun, saya belum pernah mendengar tentang Baidu, Tencent, atau ByteDance, saya berpikir untuk berinvestasi di Xiaoice dan mendukungnya untuk terus mengembangkan model kecerdasan buatan semantik alami berskala besar.
Bukan hanya Xiaoice. Dalam beberapa tahun terakhir, ada juga tim wirausaha lain di China yang terlibat dalam pemodelan otomatis kecerdasan buatan umum dan komputasi heterogen, memungkinkan 7-8 jenis chip di dalam dan luar negeri untuk mengakses perangkat lunak melalui model ini, tetapi selama karena mereka menggunakan model ini untuk mengumpulkan dana, mereka tidak akan bisa berbuat apa-apa sebagai investor. Institusi investasi China tidak pernah menunjukkan minat pada model kecerdasan buatan umum, dan bahkan sedikit imajinasi.
"Lebih dari 85% investor meminta kami untuk memperkenalkan skenario produk segera setelah mereka muncul. Kami mengatakan bahwa kami membantu GPU terhubung dengan ekosistem perangkat lunak, dan bahkan Nvidia menggunakan model kami. Investor mengatakan bahwa ini bukan skenario Kami mengatakan bahwa kami juga memiliki pelanggan, satelit, Penelitian di dermaga, kota pintar, dan industri pintar, mereka mengatakan Anda melakukannya terlalu longgar, jadi kami tidak memilih. Inilah yang saya dengar dari pengusaha yang melakukan model kecerdasan buatan umum.
Seperti yang kita ketahui bersama, VC di China paling suka "mendidik" wirausahawan, dan tentunya mendidik ilmuwan yang berkecimpung dalam kewirausahaan kecerdasan buatan. "Anda harus memiliki beberapa data di industri ini", ini adalah kalimat favorit mereka untuk mengedukasi para pengusaha AI.
Ada data di industri tertentu, dan perlu fokus untuk memberikan solusi di bidang tersegmentasi tertentu.Ini adalah pola pikir sebagian besar VC dan PE di China yang mengaku berinvestasi dalam kecerdasan buatan. Lalu kita lihat "seberapa besar scene-nya", scene security cameranya cukup besar, jadi model valuasinya jadi seukuran China, berapa kamera yang bisa dipasang? Berapa harga masing-masing kamera? Berapa total pelat kamera? Nah, pelatnya cukup besar, dan kami memilih di subdivisi kamera. Mari kita lihat lagi port smart logistics Ada berapa port di China? Berapa banyak pelabuhan air dalam? Berapa banyak yang dapat dibayar setiap terminal pelabuhan untuk solusi AI? Ternyata kami membayar uang yang sangat kecil, sepertinya adegan "pelabuhan" tidak cukup besar, jadi kami tidak akan memilih. AI manusia digital virtual sebagai layanan pelanggan? Itu bisa dikaitkan dengan metaverse, itu punya cerita dan imajinasi, nah, kita bisa mencobanya.
Jadi, yang Anda lihat adalah kecerdasan buatan China "empat harimau" pada dasarnya terlibat dalam bisnis kamera dan pengenalan wajah, dan semuanya telah menjadi implementasi dan integrator proyek AI. Model bisnisnya sama dengan Neusoft 30 tahun yang lalu Dan iSoftStone, mereka hidup dalam situasi yang sulit, dengan kerugian besar, dan mereka harus mendukung peringkat industri kecerdasan buatan China, dan mendukung penilaian dan imajinasi bidang kecerdasan buatan.
Untuk jangka waktu yang cukup lama, hanya sedikit investor di bidang kecerdasan buatan yang dengan tulus percaya bahwa model umum dapat digunakan kembali di berbagai industri. Kadang-kadang, ada beberapa yang sedikit sabar dan tertarik dengan model umum, dan pada dasarnya dana RMB Dana dolar AS benar-benar tidak tertarik dengan upaya tim China untuk mengembangkan model umum. Menurut Anda, apakah dengan membandingkan kesulitan dan tingkat pelatihan model perusahaan seperti OpenAI dan Google, mereka merasa ada kesenjangan antara tim China dalam hal ini? Maka Anda benar-benar berpikir terlalu banyak. Mereka mengetahui waktu pengembangan model GPT, yakni dua bulan terakhir.
Manajer investasi lini pertama yang mengatakan "Di mata saya, SenseTime dan Megvii menjual kamera keamanan", mitra investasi lini pertama yang dengan bangga memberi tahu pengusaha bahwa "model Anda bukan adegan", apalagi mereka yang memiliki hampir Alih-alih berinvestasi dalam kecerdasan buatan, mitra dana investasi dolar AS yang telah mengutak-atik pengusaha China untuk "pergi ke luar negeri" untuk terlibat dalam cryptocurrency selama bertahun-tahun tiba-tiba berubah hari ini dan menyatakan bahwa dia akan mendukung pengusaha untuk terlibat dalam "ChatGPT China ". Kemudian Anda dapat memikirkannya, sumpah dan kesombongan mereka mengandung beberapa pemahaman dan ketulusan dari model kecerdasan buatan secara umum, dan beberapa spekulasi dan perhitungan.
Anda bahkan dapat memikirkannya, pelatihan model semantik super alami dapat menelan biaya puluhan juta atau bahkan ratusan juta RMB sehari, belum lagi modul daya komputasi yang menyediakan pelatihan model besar - GPU top dunia, karena embargo Amerika Serikat yang tidak masuk akal dan menjadi semakin sulit diperoleh. Dengan sikap dan gaya perilaku para investor tersebut dalam beberapa tahun terakhir, mereka dapat bertahan selama beberapa hari, berapa banyak uang yang mereka bersedia untuk meyakinkan komite investasi untuk berinvestasi, atau dapatkah mereka membantu tim wirausaha ini menyelesaikan masalah GPU. ? Mungkin suatu hari, mungkin setengah tahun kemudian, mereka akan mulai mendesak tim model umum ini untuk "mewujudkan komersialisasi di bidang yang terbagi" secepat mungkin.
Dengan desakan Baidu untuk berinvestasi dalam model PaddlePaddle, tidak dapat dipungkiri bahwa Baidu akan mempraktikkan industri model ini sejak awal, dan mengejar komersialisasi di industri yang berbeda secepat mungkin. Untuk sebagian besar, pelatihan model besar kecerdasan buatan umum memiliki "segitiga mustahil" dari data masif, keluaran konten kreatif dan berkualitas tinggi, dan aplikasi industri.
Untuk mencapai data masif dan hasil konten kreatif berkualitas tinggi, ini pasti tidak dapat diterapkan dengan cepat ke implementasi spesifik industri tertentu - seperti ChatGPT.
Jika Anda ingin membuat skenario pendaratan industri tertentu dalam data massal terbesar yang dibuat oleh manusia di Internet, Anda pasti tidak akan dapat memberikan hasil dengan kualitas terbaik, karena harus ada konflik antara pembuatan konten berdasarkan data massal dan keputusan yang tepat- membuat sistem-ini sebenarnya sia-sia.
Jika Anda ingin mencapai keluaran konten berkualitas tinggi untuk membantu pengambilan keputusan yang akurat dalam skenario pendaratan industri, Anda harus mengorbankan data paling masif, dan data yang dimiliki oleh skenario industri paling akurat tidak dapat mendukung pelatihan dan penelitian model skala besar yang nyata. adalah dilema yang dihadapi oleh sebagian besar solusi kecerdasan buatan "segmentasi industri" China saat ini, dan itu juga alasan mengapa apa yang disebut "ChatGPT industri" adalah proposisi palsu yang mengubah sup tanpa mengubah obatnya.
Para pengusaha dan investor yang bersiap untuk memasuki "ChatGPT China" hari ini, belum lagi berapa banyak uang dan berapa banyak GPU yang Anda miliki di saku Anda, karena Anda semua berada di kapal ini, Anda merasa memegang tiketnya. Sudut mana dari "segitiga mustahil" dari kecerdasan buatan umum yang akan Anda putuskan untuk dibuang? Ini adalah pertanyaan yang perlu dipecahkan terlebih dahulu.
Dengan kata lain, lembaga investasi mana — apakah itu lembaga investasi keuangan atau departemen investasi perusahaan besar — yang memiliki tekad untuk berinvestasi dalam pelatihan model semantik alami skala besar selama beberapa tahun dan memperpanjang siklus pengembalian tanpa batas? Lagi pula, sejarah memberi tahu kita bahwa ini adalah sekelompok orang yang paling tidak bertekad dan paling ingin menemukan penerus.
China tidak pernah kekurangan pengusaha dan ilmuwan yang luar biasa, dan bidang kecerdasan buatan tidak terkecuali. Level dan akumulasi perusahaan teknologi China dan Amerika di bidang kecerdasan buatan paling dekat di dunia Setidaknya beberapa tahun yang lalu, tidak ada celah besar antara China dan Amerika Serikat dalam pembangunan dan pelatihan alam besar model semantik. Namun, China memang kekurangan beberapa lembaga investasi dan investor yang memiliki visi lebih luas, tidak mengikuti pendapat orang lain, serta bertekad dan berpandangan jauh ke depan.
Orang-orang seperti Shen Xiangyang, Li Di, Ma Weiying, Wang Xiaochuan, dan Li Zhifei cukup andal ketika mereka keluar untuk membuat model semantik alami generik skala besar, tetapi masalahnya adalah mereka perlu mengubah sekelompok lembaga investasi dan investor. yang mendukung mereka Beberapa lembaga investasi yang terlalu pandai "bermain game" dan berspekulasi, dan tenggelam terlalu dalam dalam cryptocurrency dan jalur lainnya, harus masuk daftar hitam.
Sejujurnya, meskipun tidak ada lembaga investasi serius yang telah melihat model kecerdasan buatan umum selama bertahun-tahun, masih ada beberapa lembaga yang berinvestasi di banyak perusahaan kecerdasan buatan dengan siklus pengembalian yang sangat lama. Misalnya, para VC yang telah berinvestasi dalam solusi lidar lokal dan mengemudi otonom China telah berkontribusi pada pembentukan daya saing baru China dalam perubahan industri otomotif global yang belum pernah terjadi sebelumnya dalam satu abad. Misalnya, para VC yang telah berinvestasi di GPU lokal China—ini ditakdirkan untuk menjadi jalur yang penuh kesulitan, menghadapi larangan dan penindasan dari Amerika Serikat, dan siklus pengembaliannya sangat panjang; tetapi para pemain GPU lokal baru ini—apakah itu adalah Hanbo, Biren Atau yang lain, mereka dapat memberikan amunisi untuk model pemrosesan semantik alami umum China di masa depan. Para investor di belakang mereka, jika suatu hari mereka benar-benar mengambil keputusan dan bergerak untuk mendukung proyek model skala besar semantik alami China, saya mungkin memiliki harapan dan kepercayaan yang berbeda pada mereka.
Hanya saja tidak terlalu banyak investor dan lembaga investasi yang tidak menyombongkan diri, tidak menahan diri, dan tidak terburu-buru untuk sukses cepat, tetapi jumlahnya terlalu sedikit, tetapi konstruksi dan pelatihan model semantik alami China membutuhkan investor seperti itu. dan lembaga investasi—apakah itu investor keuangan, investor strategis, atau lembaga modal yang didukung oleh kehendak negara.
China harus memiliki model besar semantik alaminya sendiri, perlu memiliki visi untuk menyediakan kearifan China, sistem nilai China, dan solusi China untuk kecerdasan buatan umum global, dan perlu menghindari seluruh proses pemilihan korpus, konstruksi model, dan pelatihan , dan penyesuaian parameter Risiko dan masalah hukum, moral dan etika membutuhkan tekad dan kesabaran.
Bagaimanapun, itu tidak dapat dispekulasikan.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Siapa yang menahan ChatGPT China?
ChatGPT telah menjadi produk fenomenal yang tidak diragukan lagi di industri teknologi informasi global.
Atas nama "kecerdasan buatan umum", ia mengobrol dengan manusia, membantu orang membuat draf email dan surat pengacara, menjawab beberapa pertanyaan filosofis esoterik, menulis kode Python yang dapat digunakan, dan menjawab beberapa pertanyaan yang tampaknya memerlukan logika kompleks dan progresif. , Menulis naskah film berdasarkan beberapa setting karakter, menulis puisi cinta yang indah, menangkap pisau untuk pekerjaan rumah tesis mahasiswa... Sepertinya tidak ada spesies AI yang serbaguna dalam sejarah manusia. Bill Gates mengatakan bahwa signifikansi munculnya ChatGPT adalah "tidak kurang dari kelahiran Internet", CEO Microsoft Satya Nadella mengatakan bahwa itu sebanding dengan revolusi industri, penggemar kecerdasan buatan lisan sekali lagi berseru bahwa "singularitas" adalah datang, orang biasa sekali lagi khawatir pekerjaan mereka akan digantikan oleh asisten AI serba bisa seperti ChatGPT... Dari "Biru Tua" IBM, ke AlphaGo Google, dan kemudian ke ChatGPT OpenAI, 25 tahun telah berlalu, AI terus berkembang , dan kehidupan sehari-hari manusia untuk AI Menanggapi tanpa menunjukkan kedewasaan mental, ini benar-benar sesuatu yang membuat AI senang.
Saya telah menggunakan ChatGPT untuk melakukan banyak hal yang tak terlukiskan, dan menemukan bahwa itu tidak selalu berguna, tetapi dapat memberikan jawaban dan solusi yang lebih baik untuk beberapa masalah yang tampaknya lebih sulit. Misalnya, jika Anda bertanya apakah BYD dapat mengalahkan Tesla, itu mungkin memberikan beberapa argumen yang jelas dan biasa-biasa saja dengan banyak kesalahan faktual dan tidak ada kepribadian pada saat yang sama; tetapi jika Anda bertanya bagaimana mengemudi otonom akan mengubah mobil untuk desain industri, itu dapat memberikan pembahasan penuh imajinasi dari dalam hingga luar dalam hal inovasi sasis, ubahan interior, hiburan digital, dan terobosan tampilan. Secara keseluruhan, ChatGPT cukup tidak sempurna, terutama dalam hal penyampaian akurasi yang meyakinkan, namun seringkali mengejutkan manusia di berbagai bidang seperti memberikan wacana informasi yang terstruktur, membuka imajinasi, dan membebaskan kreativitas. Anda tidak dapat mengatakan kegunaan spesifiknya untuk Anda, tetapi ini dapat membantu Anda mencapai dan menyelesaikan beberapa hal sepele, berlebihan, dan bahkan kreatif.
Ini adalah ChatGPT yang tampaknya tidak berguna tetapi bermanfaat, yang tampaknya berguna tetapi tidak berguna, yang mendorong perusahaan induknya OpenAI menerima investasi kumulatif tambahan lebih dari 10 miliar dolar AS dari Microsoft. Butuh dua hari untuk menembus 1 juta Facebook pernah menghabiskan 305 hari; butuh dua bulan untuk mencapai 100 juta pengguna, bahkan TikTok butuh sembilan bulan - ingat, tidak seperti Facebook dan TikTok, ChatGPT belum menjadi produk Internet tingkat konsumen yang berdiri sendiri, itu masih hanya sebuah Jaringan saraf besar dengan 175 miliar parameter menggunakan model bahasa alami GPT-3 - ketika dilisensikan secara khusus ke Microsoft untuk mengintegrasikan perangkat lunak perkantoran dan layanan mesin pencari seperti Office dan Bing, itu benar-benar menjadi produk yang "tersedia".
Tapi itu cukup membuat unicorn AI China cemburu.
Dengan 500 karyawan, valuasi keseluruhan perusahaan mendekati 30 miliar dolar AS. Ini adalah OpenAI; dengan ribuan orang, valuasi / nilai pasar perusahaan paling banter 1-2 miliar dolar AS. Ini adalah sejumlah AI "raksasa kecil " Di Tiongkok.
Karena kesenjangan yang sangat besar antara efisiensi dan nilai manusia, dan karena pengaruh tiba-tiba ChatGPT pada masyarakat nyata semua manusia, kelahiran ChatGPT telah sangat mendorong bidang kecerdasan buatan di Tiongkok. Banyak orang melompat keluar lagi, merasa bahwa kesenjangan antara China dan Amerika Serikat dalam kecerdasan buatan semakin melebar, dan China masih harus menempuh jalan panjang untuk mengejar gelombang ini. Ada juga beberapa orang yang tertarik untuk membahas mengapa China tidak memiliki ChatGPT sendiri, dan kesimpulannya tetap bahwa "China tidak memiliki lahan untuk inovasi" dan "Perusahaan Internet China terlibat dalam siaran langsung dan belanja bahan makanan", yaitu tidak bertanggung jawab dan tidak mengetahui fakta.
Perusahaan Internet Cina tidak semuanya terlibat dalam siaran langsung dan belanja bahan makanan, mereka terlibat dalam pengembangan semikonduktor, penelitian model AI, dan mengemudi otonom; Perusahaan Internet Amerika juga sangat populer dalam siaran langsung, belanja bahan makanan, terutama keuangan Internet. Gunakan senter dan kaca pembesar untuk menemukan masalah Anda sendiri, cobalah untuk mempercantik lawan Anda, gunakan concealer untuk menutupi masalah lawan Anda, dan menyalahkan penyebabnya dengan alasan sederhana dan kasar. Anda bisa tutup mulut. Ini bukan untuk merenungkan mengapa China bisa ' t menjadi yang pertama menciptakan dirinya sendiri Pose yang benar untuk model kecerdasan buatan generatif.
Sebagai perusahaan Internet Cina dengan akumulasi terbesar di bidang kecerdasan buatan dan pemrosesan semantik alami, Baidu telah mengerjakan model pembelajaran mendalamnya sendiri "Paddle Paddle" selama lima tahun terakhir, dan bahkan menggunakan chip AI tujuan umum sendiri "Kunlun Core" untuk melatih model Sendiri - mereka adalah lingkungan dasar dan premis Baidu untuk melatih "ChatGPT" miliknya sendiri. Alibaba, ByteDance, dan Didi juga memiliki model pelatihan semantik alami berdasarkan kebutuhan mereka sendiri. Dapat dikatakan bahwa dalam hal pelatihan model semantik alami yang kompleks dengan puluhan miliar parameter, perusahaan dan lembaga penelitian China tidak lemah, dan titik awal mereka tidak lebih rendah dari rekan Amerika mereka — setidaknya sekitar tahun 2016. Dalam beberapa tahun terakhir, kesenjangan antara lingkaran kecerdasan buatan China dan Amerika di bidang model skala besar bukanlah masalah kesadaran, titik awal, dan kemampuan, tetapi masalah jalan dan metode.
Kesenjangan antara China dan Amerika Serikat di bidang model dialog manusia-komputer seperti ChatGPT tidak disebabkan oleh apa yang disebut regulasi. Jika Anda telah melakukan percakapan jujur dengan ChatGPT tentang beberapa masalah agama, budaya, etnis, dan geopolitik yang lebih kaya, Anda akan menyadari bahwa ia menyembunyikan sikap tertentu di balik diskusi yang tampaknya penolakan dan kehati-hatian tentang masalah ini , yang secara halus bertepatan dengan nilai-nilai arus utama secara umum diakui dalam masyarakat Amerika. Dapat dikatakan bahwa untuk model kompleks semantik alami apa pun, proses konstruksi model, pengumpulan korpus, pelatihan, dan penyesuaian parameter adalah proses "peninjauan konten" berdasarkan sistem nilai tertentu, dan ada kebutuhan untuk mempertahankannya. sistem nilai kesadaran diri Ini bukan pertanyaan apakah kita harus "menghasilkan" posisi nilai China dalam model semantik alami, tetapi bagaimana itu harus dihasilkan untuk benar-benar memeriksa dan menyeimbangkan pandangan dunia dan hegemoni budaya bahwa bahasa Inggris mendominasi korpus Internet global, dan memperkuat tolok ukur untuk pemahaman bahasa Cina Bobot sistem pemrosesan semantik alami global memberikan keragaman budaya untuk pengembangan kecerdasan buatan dan dialog manusia-komputer di dunia.
Saya juga sangat tidak setuju dengan pernyataan bahwa kualitas informasi Internet Cina terlalu buruk sehingga sumber korpus model ChatGPT Cina "tercemar" Ini juga merupakan penilaian yang malas dan cerdas. Karena jumlah total informasi di Internet, konten bahasa Inggris tidak diragukan lagi yang paling banyak di dunia, dan konten ekstrim dengan kualitas yang mengkhawatirkan juga paling banyak, yang semuanya akan mempengaruhi proses dan hasil pelatihan model semantik alami. Pada pelatihan awal, ChatGPT mengutamakan konten yang sangat dipuji di forum sosial Reddit dengan kualitas konten yang tinggi, yang memiliki kecenderungan pemilihan korpus tertentu. Jika China memprioritaskan komunitas pengetahuan seperti Zhihu dan Dede, dan media arus utama memprioritaskan korpus model semantik, tidak akan ada masalah kontaminasi korpus. Belum lagi kemahiran bahasa asing dan keluasan membaca kebanyakan orang yang berpendapat bahwa "kualitas konten berbahasa Mandarin rendah" tidak cukup untuk mendukung kesimpulan mereka.
Namun bagaimanapun juga, kelahiran ChatGPT memang merupakan semacam rangsangan dan tantangan konseptual bagi saya, yang telah menyerukan "perpisahan dengan pemujaan Silicon Valley" selama bertahun-tahun.
Ini bukan karena menurut saya kesenjangan antara China dan Amerika Serikat di bidang kecerdasan buatan telah melebar, tetapi karena model dialog manusia-komputer kecerdasan buatan umum seperti ChatGPT adalah kemungkinan nyata dari semua manusia — bukan bidang tertentu dan Dari perspektif industri, itu adalah alat untuk mempromosikan kolaborasi produksi sosial dan proses peradaban. Signifikansinya lebih besar daripada kemunculan Internet seluler, sebanding dengan kelahiran email dan mesin pencari. Sebagai negara kecerdasan buatan yang besar, China bukan lagi negara dengan industri teknologi informasi yang buruk ketika email dan mesin pencari lahir. Namun, kami belum membiarkan inovasi kecerdasan buatan umum semacam ini yang dapat mempengaruhi kemajuan peradaban manusia terjadi pertama di Cina Melatih model yang korpus dasarnya dibangun dari budaya dan sistem nilai Cina.
Terlebih lagi, metode pelatihan model ChatGPT sebagian besar bergantung pada peningkatan parameter "keajaiban yang diperkuat", pelatihan berulang, dan pengoptimalan iteratif berkelanjutan dari model berdasarkan umpan balik dari konten yang dihasilkan - ini pada awalnya adalah metode kerja yang paling baik dilakukan oleh tim Cina . Ketika sebuah perusahaan start-up Amerika menggunakan uang yang dikumpulkan dari Microsoft untuk menginvestasikan sejumlah besar daya komputasi dengan biaya berapa pun, mempekerjakan sejumlah besar pekerja data di Afrika dan Timur Tengah untuk pelabelan informasi, dan menggunakan iterasi yang paling efisien untuk melakukan model besar pemrosesan semantik yang dikembangkan sendiri dengan raksasa seperti Google Anda masih memiliki perasaan yang sangat tidak nyata dalam hal "perlombaan senjata" - apakah ini perusahaan San Francisco atau perusahaan Shenzhen.
Model pemrosesan semantik alami seperti ChatGPT seharusnya lahir di China tetapi tidak lahir di China.Alasannya harus dimulai dengan perusahaan teknologi China yang bergerak di bidang kecerdasan buatan — tidak peduli apa yang dilakukan raksasa atau startup tahun ini.
Masalah yang mungkin tidak pernah disadari oleh banyak orang adalah bahwa model pemrosesan semantik alami tujuan umum berskala super besar seperti ChatGPT kemungkinan besar akan menghasilkan keajaiban saat dibangun oleh perusahaan rintisan AI, dan hasil yang lebih baik biasanya tidak dicapai dalam raksasa teknologi . Inilah sebabnya mengapa model aplikasi dialog LaMDA Google dan Bard, yang baru-baru ini bergegas ke medan perang, tidak bersinar, dan itu juga merupakan tantangan yang pasti akan dihadapi Baidu selanjutnya.
Mengapa? Yang pertama adalah karena pemodelan pemrosesan semantik natural secara umum terlalu mahal. Nyatanya, membakar uang biasanya bukan keahlian perusahaan besar, melainkan keistimewaan para pemula. Raksasa teknologi hampir semuanya adalah perusahaan yang terdaftar. Investasi puluhan miliar dolar telah diinvestasikan dalam masalah yang tidak akan menghasilkan pengembalian untuk waktu yang lama. Tekanan pada chief financial officer di hadapan dewan direksi dan pemegang saham pertemuan sangat tinggi, dan seringkali Dihukum oleh harga saham, hal ini menyebabkan perusahaan besar tidak berani mengambil risiko besar, dan tidak akan ada iterasi besar tanpa risiko besar. Apa itu "Membuat Keajaiban dengan Penuh Semangat"? Ini adalah menghabiskan banyak uang dan melakukan upaya besar terlebih dahulu, dan kemudian berdoa agar keajaiban terjadi, bukannya menyetujui bahwa keajaiban harus terjadi, dan kemudian memutuskan untuk mengeluarkan uang dan melakukan upaya besar.
Sayangnya, perusahaan besar hanya bisa menjadi yang terakhir. Inilah sebabnya bahkan Microsoft, yang mendapat banyak keuntungan dari ChatGPT, hanya berani memulai dari $1 miliar di awal, yang berlangsung selama empat tahun, hingga tahun ini $10 miliar, dan terus berinvestasi satu per satu untuk mendukung OpenAI di Microsoft.” In vitro", model GPT telah dilatih selama bertahun-tahun. Ekuitas yang diperoleh Microsoft melalui investasi di OpenAI menikmati prioritas untuk mengintegrasikan kemampuan model ChatGPT ke dalam Office dan mesin pencarinya.Mungkin tidak mudah untuk mengatakan apakah akan memakan OpenAI di masa mendatang, tetapi setidaknya nilai pasarnya hampir satu triliun Dolar AS Microsoft, dengan pendapatan puluhan miliar dolar, tidak akan pernah berani "melakukan keajaiban dengan penuh semangat" sejak awal dan melatih model ini sendiri.
Kedua, karena orang kurang toleran terhadap raksasa teknologi yang terlibat dalam inovasi, dan lebih toleran terhadap kesalahan dan penyimpangan dalam startup. Untuk mengatasi tekanan ChatGPT, Google buru-buru meluncurkan versi pengujian dialog manusia-komputer Bard. Ditemukan bahwa beberapa dialog memiliki kesalahan faktual dasar, sehingga diperbesar tanpa batas, dan nilai pasar menguap ratusan miliar dolar dalam semalam . Faktanya, bukan karena Google tidak mengetahui hal ini, jika tidak terburu-buru, itu tidak akan terlalu terburu-buru. Model LaMDA yang diumumkan oleh Google pada tahun 2021 memiliki tingkat parameter dan kemampuan pencarian informasi yang jauh lebih tinggi daripada GPT-3 yang dilatih oleh OpenAI saat itu.
Apa yang Google pedulikan, OpenAI tidak peduli. Sejak hari pertama rilis ChatGPT, secara terbuka menyatakan bahwa ia tidak memiliki kemampuan pencarian informasi, dan korpusnya hanya hingga Desember 2021. Ia tidak dapat menjawab banyak pertanyaan tentang penilaian nilai dan moral, dan sering membuat kesalahan faktual. Para penguji dengan toleran menerima "kinerja buruk" diri ChatGPT, dan mereka semua puas dengan asosiasi informasi, ekspresi emosional, struktur logis, dan koherensi pemikiran di bidang pemrograman, kreasi sastra, penulisan berformat, dan konsultasi medis. kekuatan seri, dengan ringan menghilangkan kesalahan yang dibuatnya.
Pada Maret 2019, setelah kesuksesan model GPT-2 yang belum pernah terjadi sebelumnya, OpenAI yang berusia empat tahun memutuskan untuk bertransformasi dari yayasan nirlaba menjadi perusahaan komersial. Lagipula, tidak ada yayasan yang tahan dengan gaji tahunan kepala ilmuwannya sebesar $1,5 juta Pada Mei 2019, Sam Altman (Sam Altman) menjadi CEO OpenAI. Kemudian, OpenAI menerima investasi $1 miliar dari Microsoft. Pada Mei 2020, model GPT-3 yang diluncurkan oleh OpenAI memiliki parameter yang meningkat tajam dari 1,5 miliar di GPT-2 menjadi 175 miliar, membentuk sistem pembelajaran otomatis yang sangat kuat.
Dapat dilihat bahwa perusahaan rintisan kecerdasan buatan yang lahir dengan sendok emas di mulutnya, mengumpulkan banyak uang, dan digabungkan dengan bisnis raksasa, terlibat dalam pembangunan dan pengembangan kecerdasan buatan tujuan umum model semantik alami, dan berinvestasi dalam pelatihan model terlepas dari biaya, yang merupakan kondisi paling ideal. Pengembalian imajinatif dan komersial yang datang dengan model paling kuat sudah cukup untuk memacu Microsoft dan investor lainnya.
Jadi, mengapa logika ini tidak bekerja di Cina? Apakah China pernah memiliki model kecerdasan buatan semantik alami yang kuat untuk tujuan umum, bahkan jika itu hanya sebuah prototipe?
Untuk menjawab pertanyaan ini, lihat kapan Microsoft pertama kali berinvestasi di OpenAI: Juli 2019. Empat bulan setelah Microsoft bertaruh pada model GPT OpenAI, yaitu pada November 2019, Shen Xiangyang, seorang ilmuwan komputer dari Hong Kong, China, yang bertanggung jawab atas bisnis pencarian Bing dan juga orang teratas yang bertanggung jawab atas kecerdasan buatan Microsoft, mengumumkan kepergiannya Bekerja untuk Microsoft selama lebih dari 20 tahun. Dan kontribusi terakhir Shen Xiangyang untuk model kecerdasan buatan umum Microsoft adalah robot obrolan Xiaobing yang dikembangkan oleh Microsoft Asia Internet Engineering Institute pada tahun 2014.
Pada Juli 2020, Xiaoice menjadi independen dari Microsoft dan menjadi perusahaan rintisan kecerdasan buatan Tiongkok. Shen Xiangyang menjabat sebagai ketua, dan Li Di, mantan wakil presiden eksekutif Akademi Teknik Internet Asia Microsoft, menjabat sebagai CEO. Ketika Xiaoice menjadi mandiri, ia telah berkembang hingga lebih dari generasi keenam.Bentuk produknya melibatkan robot kecerdasan buatan percakapan, asisten suara cerdas, penyedia konten yang dibuat oleh kecerdasan buatan, dan serangkaian solusi bidang vertikal. Xiaoice pernah memicu perbincangan publik, selain menjadi robot obrolan yang penuh emosi dan seksualitas perempuan, ia juga memiliki kinerja yang luar biasa di bidang penciptaan puisi Tiongkok - ia menerbitkan kumpulan puisi "Sunshine Lost the Glass Window", yang telah mendapat banyak perhatian, banyak pujian, dan lebih banyak kontroversi.
Tidak ada keraguan bahwa robot XiaoIce yang dapat menulis puisi dan melakukan percakapan berbasis emosi dan akal sehat sederhana adalah model kecerdasan buatan umum percakapan dengan kinerja terbaik di dunia beberapa tahun yang lalu.
Tidak mungkin tim yang dipimpin oleh Shen Xiangyang memahami pencarian, apalagi kecerdasan buatan. Dan kepergian Shen Xiangyang dari "kemerdekaan" Microsoft dan Xiaobing, ditambah dengan investasi dan kerja sama CEO Microsoft Nadella dengan OpenAI, sebenarnya adalah pedagang kecerdasan buatan teratas di China dan Amerika Serikat. Secara resmi berpisah.
Jadi, apakah Xiaobing masih menulis puisi hari ini? apa yang sedang dilakukannya
Dalam dua tahun terakhir, Xiaobing sudah lama berhenti menulis puisi. Sibuk dikomersialkan. Itu mendirikan studio game untuk menyediakan konten dialog skrip NPC untuk game; itu bekerja sama dengan Olimpiade Musim Dingin untuk menyediakan sistem penilaian visual untuk keterampilan udara ski gaya bebas; Vanke dan perusahaan lain telah menyesuaikan manusia digital virtual untuk layanan pelanggan ... Ini adalah bekerja keras untuk menjadi perusahaan solusi kecerdasan buatan yang "memberdayakan" semua lapisan masyarakat dan pada saat yang sama memungkinkan dirinya menghasilkan darah dan menghasilkan uang.
Singkatnya, di masa lalu, tim kecerdasan buatan yang mewakili tingkat yang lebih tinggi dari model kecerdasan buatan semantik alami umum, dan orang Cina mendukung seluruh pola, kini telah menjadi campuran kecerdasan buatan generatif dan kecerdasan buatan pengambilan keputusan, menyediakan solusi spesifik untuk skenario tertentu Penyedia solusi kecerdasan buatan.
Anda tidak bisa mengatakan bahwa ini adalah "kejatuhan" Xiaoice, lagipula, itu hanya mengumpulkan ratusan juta yuan dari pasar modal. Menurut metode pelatihan model ChatGPT, uang akan dihabiskan dalam satu hari. Tanpa perlindungan Microsoft, Xiaobing harus mengurus hidupnya sendiri. Namun, saya belum pernah mendengar tentang Baidu, Tencent, atau ByteDance, saya berpikir untuk berinvestasi di Xiaoice dan mendukungnya untuk terus mengembangkan model kecerdasan buatan semantik alami berskala besar.
Bukan hanya Xiaoice. Dalam beberapa tahun terakhir, ada juga tim wirausaha lain di China yang terlibat dalam pemodelan otomatis kecerdasan buatan umum dan komputasi heterogen, memungkinkan 7-8 jenis chip di dalam dan luar negeri untuk mengakses perangkat lunak melalui model ini, tetapi selama karena mereka menggunakan model ini untuk mengumpulkan dana, mereka tidak akan bisa berbuat apa-apa sebagai investor. Institusi investasi China tidak pernah menunjukkan minat pada model kecerdasan buatan umum, dan bahkan sedikit imajinasi.
"Lebih dari 85% investor meminta kami untuk memperkenalkan skenario produk segera setelah mereka muncul. Kami mengatakan bahwa kami membantu GPU terhubung dengan ekosistem perangkat lunak, dan bahkan Nvidia menggunakan model kami. Investor mengatakan bahwa ini bukan skenario Kami mengatakan bahwa kami juga memiliki pelanggan, satelit, Penelitian di dermaga, kota pintar, dan industri pintar, mereka mengatakan Anda melakukannya terlalu longgar, jadi kami tidak memilih. Inilah yang saya dengar dari pengusaha yang melakukan model kecerdasan buatan umum.
Seperti yang kita ketahui bersama, VC di China paling suka "mendidik" wirausahawan, dan tentunya mendidik ilmuwan yang berkecimpung dalam kewirausahaan kecerdasan buatan. "Anda harus memiliki beberapa data di industri ini", ini adalah kalimat favorit mereka untuk mengedukasi para pengusaha AI.
Ada data di industri tertentu, dan perlu fokus untuk memberikan solusi di bidang tersegmentasi tertentu.Ini adalah pola pikir sebagian besar VC dan PE di China yang mengaku berinvestasi dalam kecerdasan buatan. Lalu kita lihat "seberapa besar scene-nya", scene security cameranya cukup besar, jadi model valuasinya jadi seukuran China, berapa kamera yang bisa dipasang? Berapa harga masing-masing kamera? Berapa total pelat kamera? Nah, pelatnya cukup besar, dan kami memilih di subdivisi kamera. Mari kita lihat lagi port smart logistics Ada berapa port di China? Berapa banyak pelabuhan air dalam? Berapa banyak yang dapat dibayar setiap terminal pelabuhan untuk solusi AI? Ternyata kami membayar uang yang sangat kecil, sepertinya adegan "pelabuhan" tidak cukup besar, jadi kami tidak akan memilih. AI manusia digital virtual sebagai layanan pelanggan? Itu bisa dikaitkan dengan metaverse, itu punya cerita dan imajinasi, nah, kita bisa mencobanya.
Jadi, yang Anda lihat adalah kecerdasan buatan China "empat harimau" pada dasarnya terlibat dalam bisnis kamera dan pengenalan wajah, dan semuanya telah menjadi implementasi dan integrator proyek AI. Model bisnisnya sama dengan Neusoft 30 tahun yang lalu Dan iSoftStone, mereka hidup dalam situasi yang sulit, dengan kerugian besar, dan mereka harus mendukung peringkat industri kecerdasan buatan China, dan mendukung penilaian dan imajinasi bidang kecerdasan buatan.
Untuk jangka waktu yang cukup lama, hanya sedikit investor di bidang kecerdasan buatan yang dengan tulus percaya bahwa model umum dapat digunakan kembali di berbagai industri. Kadang-kadang, ada beberapa yang sedikit sabar dan tertarik dengan model umum, dan pada dasarnya dana RMB Dana dolar AS benar-benar tidak tertarik dengan upaya tim China untuk mengembangkan model umum. Menurut Anda, apakah dengan membandingkan kesulitan dan tingkat pelatihan model perusahaan seperti OpenAI dan Google, mereka merasa ada kesenjangan antara tim China dalam hal ini? Maka Anda benar-benar berpikir terlalu banyak. Mereka mengetahui waktu pengembangan model GPT, yakni dua bulan terakhir.
Manajer investasi lini pertama yang mengatakan "Di mata saya, SenseTime dan Megvii menjual kamera keamanan", mitra investasi lini pertama yang dengan bangga memberi tahu pengusaha bahwa "model Anda bukan adegan", apalagi mereka yang memiliki hampir Alih-alih berinvestasi dalam kecerdasan buatan, mitra dana investasi dolar AS yang telah mengutak-atik pengusaha China untuk "pergi ke luar negeri" untuk terlibat dalam cryptocurrency selama bertahun-tahun tiba-tiba berubah hari ini dan menyatakan bahwa dia akan mendukung pengusaha untuk terlibat dalam "ChatGPT China ". Kemudian Anda dapat memikirkannya, sumpah dan kesombongan mereka mengandung beberapa pemahaman dan ketulusan dari model kecerdasan buatan secara umum, dan beberapa spekulasi dan perhitungan.
Anda bahkan dapat memikirkannya, pelatihan model semantik super alami dapat menelan biaya puluhan juta atau bahkan ratusan juta RMB sehari, belum lagi modul daya komputasi yang menyediakan pelatihan model besar - GPU top dunia, karena embargo Amerika Serikat yang tidak masuk akal dan menjadi semakin sulit diperoleh. Dengan sikap dan gaya perilaku para investor tersebut dalam beberapa tahun terakhir, mereka dapat bertahan selama beberapa hari, berapa banyak uang yang mereka bersedia untuk meyakinkan komite investasi untuk berinvestasi, atau dapatkah mereka membantu tim wirausaha ini menyelesaikan masalah GPU. ? Mungkin suatu hari, mungkin setengah tahun kemudian, mereka akan mulai mendesak tim model umum ini untuk "mewujudkan komersialisasi di bidang yang terbagi" secepat mungkin.
Dengan desakan Baidu untuk berinvestasi dalam model PaddlePaddle, tidak dapat dipungkiri bahwa Baidu akan mempraktikkan industri model ini sejak awal, dan mengejar komersialisasi di industri yang berbeda secepat mungkin. Untuk sebagian besar, pelatihan model besar kecerdasan buatan umum memiliki "segitiga mustahil" dari data masif, keluaran konten kreatif dan berkualitas tinggi, dan aplikasi industri.
Untuk mencapai data masif dan hasil konten kreatif berkualitas tinggi, ini pasti tidak dapat diterapkan dengan cepat ke implementasi spesifik industri tertentu - seperti ChatGPT.
Jika Anda ingin membuat skenario pendaratan industri tertentu dalam data massal terbesar yang dibuat oleh manusia di Internet, Anda pasti tidak akan dapat memberikan hasil dengan kualitas terbaik, karena harus ada konflik antara pembuatan konten berdasarkan data massal dan keputusan yang tepat- membuat sistem-ini sebenarnya sia-sia.
Jika Anda ingin mencapai keluaran konten berkualitas tinggi untuk membantu pengambilan keputusan yang akurat dalam skenario pendaratan industri, Anda harus mengorbankan data paling masif, dan data yang dimiliki oleh skenario industri paling akurat tidak dapat mendukung pelatihan dan penelitian model skala besar yang nyata. adalah dilema yang dihadapi oleh sebagian besar solusi kecerdasan buatan "segmentasi industri" China saat ini, dan itu juga alasan mengapa apa yang disebut "ChatGPT industri" adalah proposisi palsu yang mengubah sup tanpa mengubah obatnya.
Para pengusaha dan investor yang bersiap untuk memasuki "ChatGPT China" hari ini, belum lagi berapa banyak uang dan berapa banyak GPU yang Anda miliki di saku Anda, karena Anda semua berada di kapal ini, Anda merasa memegang tiketnya. Sudut mana dari "segitiga mustahil" dari kecerdasan buatan umum yang akan Anda putuskan untuk dibuang? Ini adalah pertanyaan yang perlu dipecahkan terlebih dahulu.
Dengan kata lain, lembaga investasi mana — apakah itu lembaga investasi keuangan atau departemen investasi perusahaan besar — yang memiliki tekad untuk berinvestasi dalam pelatihan model semantik alami skala besar selama beberapa tahun dan memperpanjang siklus pengembalian tanpa batas? Lagi pula, sejarah memberi tahu kita bahwa ini adalah sekelompok orang yang paling tidak bertekad dan paling ingin menemukan penerus.
China tidak pernah kekurangan pengusaha dan ilmuwan yang luar biasa, dan bidang kecerdasan buatan tidak terkecuali. Level dan akumulasi perusahaan teknologi China dan Amerika di bidang kecerdasan buatan paling dekat di dunia Setidaknya beberapa tahun yang lalu, tidak ada celah besar antara China dan Amerika Serikat dalam pembangunan dan pelatihan alam besar model semantik. Namun, China memang kekurangan beberapa lembaga investasi dan investor yang memiliki visi lebih luas, tidak mengikuti pendapat orang lain, serta bertekad dan berpandangan jauh ke depan.
Orang-orang seperti Shen Xiangyang, Li Di, Ma Weiying, Wang Xiaochuan, dan Li Zhifei cukup andal ketika mereka keluar untuk membuat model semantik alami generik skala besar, tetapi masalahnya adalah mereka perlu mengubah sekelompok lembaga investasi dan investor. yang mendukung mereka Beberapa lembaga investasi yang terlalu pandai "bermain game" dan berspekulasi, dan tenggelam terlalu dalam dalam cryptocurrency dan jalur lainnya, harus masuk daftar hitam.
Sejujurnya, meskipun tidak ada lembaga investasi serius yang telah melihat model kecerdasan buatan umum selama bertahun-tahun, masih ada beberapa lembaga yang berinvestasi di banyak perusahaan kecerdasan buatan dengan siklus pengembalian yang sangat lama. Misalnya, para VC yang telah berinvestasi dalam solusi lidar lokal dan mengemudi otonom China telah berkontribusi pada pembentukan daya saing baru China dalam perubahan industri otomotif global yang belum pernah terjadi sebelumnya dalam satu abad. Misalnya, para VC yang telah berinvestasi di GPU lokal China—ini ditakdirkan untuk menjadi jalur yang penuh kesulitan, menghadapi larangan dan penindasan dari Amerika Serikat, dan siklus pengembaliannya sangat panjang; tetapi para pemain GPU lokal baru ini—apakah itu adalah Hanbo, Biren Atau yang lain, mereka dapat memberikan amunisi untuk model pemrosesan semantik alami umum China di masa depan. Para investor di belakang mereka, jika suatu hari mereka benar-benar mengambil keputusan dan bergerak untuk mendukung proyek model skala besar semantik alami China, saya mungkin memiliki harapan dan kepercayaan yang berbeda pada mereka.
Hanya saja tidak terlalu banyak investor dan lembaga investasi yang tidak menyombongkan diri, tidak menahan diri, dan tidak terburu-buru untuk sukses cepat, tetapi jumlahnya terlalu sedikit, tetapi konstruksi dan pelatihan model semantik alami China membutuhkan investor seperti itu. dan lembaga investasi—apakah itu investor keuangan, investor strategis, atau lembaga modal yang didukung oleh kehendak negara.
China harus memiliki model besar semantik alaminya sendiri, perlu memiliki visi untuk menyediakan kearifan China, sistem nilai China, dan solusi China untuk kecerdasan buatan umum global, dan perlu menghindari seluruh proses pemilihan korpus, konstruksi model, dan pelatihan , dan penyesuaian parameter Risiko dan masalah hukum, moral dan etika membutuhkan tekad dan kesabaran.
Bagaimanapun, itu tidak dapat dispekulasikan.