原文來源:知危 圖片來源:由無界AI 生成過去半年裡,OpenAI 正通過GPT 驚艷所有人。**人們普遍認為GPT 的誕生是新時代的“ iPhone ” 時刻**,它將像iPhone 把人們帶往移動互聯網時代一樣,成為新的AI 大模型時代的門鑰匙。不過,**移動互聯網的繁榮進程中,不只有iPhone 的功績,還有安卓及其背後各大安卓陣營手機廠商的功績。 **甚至,單從出貨量角度來看,安卓陣營對移動互聯網時代的貢獻似乎更大。**而現在,屬於AI 大語言模型的“ 安卓時刻”,要來了。 **當地時間7 月18 日,北京時間的今日凌晨,Meta 發布了最新一代的開源大模型Llama 2。根據Meta 官網的公開數據,本次發布的Llama 2 模型系列共包括70 億、130 億和700 億三個參數的變體模型。Llama 2 經過兩萬億個tokens 的訓練,人工註釋數據超過100 萬條。而相比於Llama 1,Llama 2 的訓練數據增加了40%,上下文長度也是前者的兩倍。 經過此次升級,根據Meta 公開的論文顯示,雖然目前Llama 2 在各項大模型測試中仍遜色於GPT-3.5,但在與目前開源大模型的跑分對比中,已經有了屠榜一般的表現。 Llama 2 與GPT、PaLM 的跑分對比 Llama 2 與其他開源大模型跑分對比或許你一看到Llama 2 遜色於GPT-3.5 就會覺得嗤之以鼻,畢竟後者已經進化到4.0 的版本了。但,你要明白,安卓在剛推出的時候,也是非常拉胯的,**而開源讓安卓陣營現在能與iPhone分庭抗禮。 **所以,此次Llama 2 發布最大的亮點其實在於:**Meta 在開源基礎上更進一步,允許了該模型的免費商用。 **( 月活大於7 億的產品需要單獨申請商用權限,但很少有企業能達到這個標準)圖靈獎得主,Meta 首席科學家楊立昆也在推特直言,這將改變大語言模型市場的格局: 知危編輯部也聯繫到了在學術圈和開源社區都頗具影響力的智源AI 研究院,他們的評價是:**開源是必由之路, 說Llama 2 的發布是“ 安卓時刻”也不無道理,用開源來佔領市場,就是一個競爭策略。 **與Llama 2 商用開源相對應的是,OpenAI 在開源面前的態度一直含糊不清。開源,或者說是開放源碼運動,正式開始於上世紀的九十年代末,參與者們信仰軟件的開放源代碼、信息共享和自由使用。Android 的興起、GitHub 的流行,都和開源脫不了關係。 Linux 系統也誕生於這波運動中, 如今的路由器、交換機、智能洗衣機、智能電飯煲、交換機、服務器等等設備上,幾乎搭載了各類Linux 系統。包括幾年前的美國火星車登陸成功,也像徵著火星成為第二個Linux 計算機數量超過Windows 的星球。 毫不誇張地說,如今開源改變了軟件的協作和創新模式,改變了技術格局。但在大語言模型領域,領頭羊OpenAI 卻似乎和名字裡的Open 背道而馳。即便OpenAI 創始人山姆·奧特曼多次在公開場合提到,將在未來開放GPT-3、GPT-4 的源碼,**但這至今依舊是空頭支票。 **包括馬斯克在退出OpenAI 之後,也多次公開砲轟OpenAI,不滿OpenAI 大肆賺取利潤, 並逐漸閉源。OpenAI 首席科學家Sutskever 對此的回應則是,過早開源會讓OpenAI 失去技術領先的地位,並且大語言模型的威力巨大,開源恐有安全隱患。 馬斯克質疑OpenAI 不Open不同於OpenAI 在開源面前的畏畏縮縮,Meta 則是堅定的開源支持者,並且在一定程度上推動了AI 的歷史進程。而Meta 今天的這一決策,和Meta 的首席科學家楊立昆,勢必有著一定的關係。早在2014 年,扎克伯格就意識到了AI 的前景,在DeepMind 最終被谷歌收購之後, 扎克伯格轉頭找到了AI 學術領域的大佬楊立昆。曾在大名鼎鼎的貝爾實驗室工作過的楊立昆,是“ 卷積神經網絡” 的開發者之一,彼時的他正在紐約教書。 根據VOX 的報導,為了得到楊立昆這匹千里馬,扎克伯格答應了科研成果必須開源、實驗室必須建在紐約、實驗團隊不需要考慮盈利等等要求。楊立昆任職期間成果頗豐,諸如開發了風靡全球的AI 框架Pytorch,改進了GAN( 生成式對抗網絡),推出大語言模型Llama 和AI 圖像模型SAM 等等。**正如當年所約定的那樣,這些項目已全部開源。 **在大語言模型的浪潮之下,Llama 大語言模型也備受開源社區的歡迎。諸如Hugging Face 等開源社區中,充斥著各種被魔改後的羊駝( Llama 的中文譯為羊駝)。包括斯坦福的Alpaca、UCB 的Vicuna......各種基於LlamA 的修改的模型紛紛湧現。 在不少的大模型跑分榜單上,GPT-3.5 和GPT-4 之下,幾乎都是羊駝家族屠榜。 另外,對於OpenAI 口中出於安全考慮的閉源理由,楊立昆也是不太認同的。在他看來,**使人工智能平台安全、良善、實用的唯一方法就是開源。 **換句話說,技術掌握在少數人的手裡是危險的,只有讓監管AI 的力量也同時進化,才能盡可能地管住AI。在目前看來,暫時只有開源能辦到。總的來講,在OpenAI 領銜的大語言模型浪潮中,Meta 所帶領的開源大軍,正在開源社區中瘋狂攻城掠地。另一方面,開源和閉源之間的衝突也在逐漸白熱化。在今年的五月份,一位谷歌研究人員“ 不小心” 洩露的備忘錄,就把這場大戰擺在了檯面上。 知危編輯部簡單總結了一下這份備忘錄中,谷歌研究員的提到幾個要點:①開源AI 正在蠶食穀歌和Open AI 的領地;②小模型比大模型更具有競爭力;③數據質量遠比數據數量更重要;④谷歌打不過開源;⑤相比於開源需要谷歌,谷歌更需要一個開源生態。再簡短點講,這份洋洋灑灑上千字的文章就透露著一個最核心的信息:**在開源面前,谷歌和OpenAI 都沒有護城河。 **所以,再回看這次發布的Llama 2 ,Meta 直接把商業用途的限制給去掉了,實屬是又給閉源陣營將了一軍。開源的Llama2 不僅免費,還更能供開發者自行調整,從而滿足大部分商業公司的低成本和個性化需要。但,最終開源和閉源誰才是勝者,知危編輯部覺得併不好下定論。畢竟開源也並不是萬能解藥,開發人員良莠不齊、公開的一些安全隱患等等,都是開源經常遇到一些問題。開源和閉源之爭,歸根結底是競爭策略不同,一個更注重擴大市場和製定標準,一個更看重盈利和本身技術的領先。諸如安卓與iOS、Linux 與Windows,最後或許並無真正的輸贏之分,而是在不同的需求下,找到自己的合理定位。但,毫無疑問,Llama 2 攪動了整個市場,已經讓生態開始有微妙的變化:① OpenAI 股東之一的微軟,這次成了Llama 2 的首選合作夥伴,微軟似乎正在兩頭押注。② Meta 宣布Llama 2 將能在高通芯片上運行,這對AI 芯片霸主英偉達而言勢必是種挑戰。總之,這大語言模型圈兒的戲,是越來越複雜,越來越有趣了。如果因為Llama 2 攪的這場渾水,讓AI 時代能更快來臨的話,請大家記得,這不僅是Meta 的功勞,也是開源社區的功勞。
在開源面前,OpenAI沒有護城河:今天,大模型的安卓時刻來了
原文來源:知危
過去半年裡,OpenAI 正通過GPT 驚艷所有人。
人們普遍認為GPT 的誕生是新時代的“ iPhone ” 時刻,它將像iPhone 把人們帶往移動互聯網時代一樣,成為新的AI 大模型時代的門鑰匙。
不過,**移動互聯網的繁榮進程中,不只有iPhone 的功績,還有安卓及其背後各大安卓陣營手機廠商的功績。 **
甚至,單從出貨量角度來看,安卓陣營對移動互聯網時代的貢獻似乎更大。
**而現在,屬於AI 大語言模型的“ 安卓時刻”,要來了。 **
當地時間7 月18 日,北京時間的今日凌晨,Meta 發布了最新一代的開源大模型Llama 2。
根據Meta 官網的公開數據,本次發布的Llama 2 模型系列共包括70 億、130 億和700 億三個參數的變體模型。
Llama 2 經過兩萬億個tokens 的訓練,人工註釋數據超過100 萬條。而相比於Llama 1,Llama 2 的訓練數據增加了40%,上下文長度也是前者的兩倍。
或許你一看到Llama 2 遜色於GPT-3.5 就會覺得嗤之以鼻,畢竟後者已經進化到4.0 的版本了。
但,你要明白,安卓在剛推出的時候,也是非常拉胯的,**而開源讓安卓陣營現在能與iPhone分庭抗禮。 **
所以,此次Llama 2 發布最大的亮點其實在於:
**Meta 在開源基礎上更進一步,允許了該模型的免費商用。 **( 月活大於7 億的產品需要單獨申請商用權限,但很少有企業能達到這個標準)
圖靈獎得主,Meta 首席科學家楊立昆也在推特直言,這將改變大語言模型市場的格局:
**開源是必由之路, 說Llama 2 的發布是“ 安卓時刻”也不無道理,用開源來佔領市場,就是一個競爭策略。 **
與Llama 2 商用開源相對應的是,OpenAI 在開源面前的態度一直含糊不清。
開源,或者說是開放源碼運動,正式開始於上世紀的九十年代末,參與者們信仰軟件的開放源代碼、信息共享和自由使用。
Android 的興起、GitHub 的流行,都和開源脫不了關係。 Linux 系統也誕生於這波運動中, 如今的路由器、交換機、智能洗衣機、智能電飯煲、交換機、服務器等等設備上,幾乎搭載了各類Linux 系統。
包括幾年前的美國火星車登陸成功,也像徵著火星成為第二個Linux 計算機數量超過Windows 的星球。
但在大語言模型領域,領頭羊OpenAI 卻似乎和名字裡的Open 背道而馳。
即便OpenAI 創始人山姆·奧特曼多次在公開場合提到,將在未來開放GPT-3、GPT-4 的源碼,**但這至今依舊是空頭支票。 **
包括馬斯克在退出OpenAI 之後,也多次公開砲轟OpenAI,不滿OpenAI 大肆賺取利潤, 並逐漸閉源。
OpenAI 首席科學家Sutskever 對此的回應則是,過早開源會讓OpenAI 失去技術領先的地位,並且大語言模型的威力巨大,開源恐有安全隱患。
不同於OpenAI 在開源面前的畏畏縮縮,Meta 則是堅定的開源支持者,並且在一定程度上推動了AI 的歷史進程。
而Meta 今天的這一決策,和Meta 的首席科學家楊立昆,勢必有著一定的關係。
早在2014 年,扎克伯格就意識到了AI 的前景,在DeepMind 最終被谷歌收購之後, 扎克伯格轉頭找到了AI 學術領域的大佬楊立昆。
曾在大名鼎鼎的貝爾實驗室工作過的楊立昆,是“ 卷積神經網絡” 的開發者之一,彼時的他正在紐約教書。
楊立昆任職期間成果頗豐,諸如開發了風靡全球的AI 框架Pytorch,改進了GAN( 生成式對抗網絡),推出大語言模型Llama 和AI 圖像模型SAM 等等。
**正如當年所約定的那樣,這些項目已全部開源。 **
在大語言模型的浪潮之下,Llama 大語言模型也備受開源社區的歡迎。
諸如Hugging Face 等開源社區中,充斥著各種被魔改後的羊駝( Llama 的中文譯為羊駝)。
包括斯坦福的Alpaca、UCB 的Vicuna......各種基於LlamA 的修改的模型紛紛湧現。
在他看來,**使人工智能平台安全、良善、實用的唯一方法就是開源。 **
換句話說,技術掌握在少數人的手裡是危險的,只有讓監管AI 的力量也同時進化,才能盡可能地管住AI。
在目前看來,暫時只有開源能辦到。
總的來講,在OpenAI 領銜的大語言模型浪潮中,Meta 所帶領的開源大軍,正在開源社區中瘋狂攻城掠地。
另一方面,開源和閉源之間的衝突也在逐漸白熱化。
在今年的五月份,一位谷歌研究人員“ 不小心” 洩露的備忘錄,就把這場大戰擺在了檯面上。
①開源AI 正在蠶食穀歌和Open AI 的領地;
②小模型比大模型更具有競爭力;
③數據質量遠比數據數量更重要;
④谷歌打不過開源;
⑤相比於開源需要谷歌,谷歌更需要一個開源生態。
再簡短點講,這份洋洋灑灑上千字的文章就透露著一個最核心的信息:
**在開源面前,谷歌和OpenAI 都沒有護城河。 **
所以,再回看這次發布的Llama 2 ,Meta 直接把商業用途的限制給去掉了,實屬是又給閉源陣營將了一軍。
開源的Llama2 不僅免費,還更能供開發者自行調整,從而滿足大部分商業公司的低成本和個性化需要。
但,最終開源和閉源誰才是勝者,知危編輯部覺得併不好下定論。
畢竟開源也並不是萬能解藥,開發人員良莠不齊、公開的一些安全隱患等等,都是開源經常遇到一些問題。
開源和閉源之爭,歸根結底是競爭策略不同,一個更注重擴大市場和製定標準,一個更看重盈利和本身技術的領先。
諸如安卓與iOS、Linux 與Windows,最後或許並無真正的輸贏之分,而是在不同的需求下,找到自己的合理定位。
但,毫無疑問,Llama 2 攪動了整個市場,已經讓生態開始有微妙的變化:
① OpenAI 股東之一的微軟,這次成了Llama 2 的首選合作夥伴,微軟似乎正在兩頭押注。
② Meta 宣布Llama 2 將能在高通芯片上運行,這對AI 芯片霸主英偉達而言勢必是種挑戰。
總之,這大語言模型圈兒的戲,是越來越複雜,越來越有趣了。
如果因為Llama 2 攪的這場渾水,讓AI 時代能更快來臨的話,請大家記得,這不僅是Meta 的功勞,也是開源社區的功勞。