Meta 才是整個 AI 圈的希望?
定焦(dingjiaoone)原創
作者 | 黎明
編輯 | 魏佳
OpenAI 正變得越來越封閉,但它的對手 Meta(前 Facebook),卻通過開源赢得不少贊譽。
1 月 18 日,馬克 · 紮克伯格宣布,Meta 正在計劃構建自己的 AGI(通用人工智能),将在絕大多數領域中都達到或超越人類智能水平。同時他強調,保證會向大衆開放這一技術,以便人人都能從中獲益。
與 OpenAI 拒絕 Open 他們的算法、路線、論文相反,Meta 選擇 Open 到底。此前震驚業内的大模型 LLaMA,大獲好評的 LLaMA 2,以及正在研發的 LLaMA 3,都是開源的。它們成爲很多 AI 公司研究、學習甚至抄襲的對象。
通過開源這一手段,Meta 在某種程度上打破了大模型的壟斷,成爲 OpenAI 和谷歌雙雄相争之外的第三股力量。一些人将紮克伯格視爲大模型時代的英雄,有人在紮克伯格的帖子下留言,建議 Meta 更名爲 OpenAI,OpenAI 更名爲 CloseAI。
事實上,Meta 過去開源了它研發的幾乎所有基礎設施,比如用于 Web 和 APP 開發框架的 React,以及機器學習框架 PyTorch,而 ChatGPT 就是基于 PyTorch 開發的,OpenAI 也運行在 PyTorch 上。按照 Meta 首席科學家楊立昆的話說,除谷歌外,全世界都運行在 PyTorch 上,因爲谷歌有自己的系統。
隻是,這些東西在過去都被 Meta 的負面新聞掩蓋了——幹預選舉進程、提供虛假信息、危害青少年健康,在矽谷,罵 Facebook 曾是一種 " 政治正确 ", 人們認爲這是一家價值觀敗壞的公司。
如今風評大變,Meta 一時仿佛成了整個 AI 圈的希望,它的股價在 2023 年上漲了 160%,在美國前五大科技巨頭中漲幅僅次于英偉達,最近重返萬億美元市值,股價創新高。而曾以挑戰者姿态崛起的 OpenAI,前不久剛經曆了一場宮鬥,散發出越來越濃的銅臭味。
OpenAI 向左,Meta 往右,兩家原本沒有太多交集的公司,正走出截然不同的路。
OpenAI,走向封閉
在讨論這兩家公司的境況之前,我們先把時間拉回到十年前。
2013 年,有一家叫 DeepMind 的 AI 公司,同時引起了谷歌和 Facebook(當時還沒更名爲 Meta)的注意。
當時這家公司剛嶄露頭角,嗅覺敏銳的谷歌和 Facebook 都想收購它。最終,谷歌在競購中勝出,2014 年 1 月将 DeepMind 收入囊中。三年後,DeepMind 開發的 AI 機器人 AlphaGo,以 4:1 擊敗了韓國圍棋冠軍李世石,一舉成名。
谷歌收購 DeepMind 時,有兩個人心裏很不是滋味。一個是紮克伯格,他當時已經意識到 AI 的巨大前景;另一個是馬斯克,他不想 AI 被谷歌這樣的大公司控制。
于是,紮克伯格決定自己做,他花重金從紐約大學請來了計算機科學領域的權威人物楊立昆,啓動 FAIR 項目,在 Facebook 成立了 AI 實驗室。馬斯克則和奧爾特曼成立了 OpenAI,用來對抗谷歌。
從當時的情形來看,紮克伯格是爲了自己的公司,馬斯克是爲了全人類。馬斯克認爲,由大公司控制的少量 AI 系統很不安全,唯一的辦法是讓盡可能多的人都擁有 AI。所以 OpenAI 一開始就定位開源,是一個非營利性的機構。
馬斯克當時說:" 我們希望有一種類似于 Linux 版本的 AI,不受任何個人或公司的控制。"
一個爲私,一個爲公,兩家公司一開始就選了不同的路。
馬斯克提到的 Linux,是一款免費開源的操作系統。在互聯網早期,計算機剛開始普及時,可用的操作系統不多,要麽源代碼被軟件廠商嚴格保密,要麽收取很高昂的費用。一個歐洲大學生開發出 Linux 操作系統的雛形,然後免費對外公開了自己的代碼。
由于開源,全球程序員都加入進來改進代碼,最終創造了 Linux 操作系統,且使用完全免費。這大大加速了計算機的普及。我們今天熟知的安卓系統,就是基于 Linux 内核,全球大部分手機都跑在這個系統上。
馬斯克的想法很簡單,AI 時代也需要有這樣一個開源開放的操作系統,市場不能讓巨頭獨占。
OpenAI 的啓動資金來源于一批科技大佬捐贈,它一開始的确是按開源的路徑走的,2019 年發布的 GPT-2,就是一個開源大模型,當年還有人用 GPT-2 爲《權利的遊戲》改寫劇本結尾。
但也是在 GPT-2 發布之後,OpenAI 逐漸走向封閉。它随後成立營利性子公司,接受了微軟的數十億美元投資。
在那之後,2020 年發布的 GPT-3,2022 年升級的 GPT-3.5,以及 2023 年 3 月發布的 GPT-4,都是閉源模型,一開始 OpenAI 還公布論文,到後來連模型具體參數都不再公布。
而從整個大模型行業的競争格局來看,"OpenAI- 微軟 ""DeepMind- 谷歌 " 的雙巨頭組合格局正式形成。
馬斯克對此非常不滿。他說,OpenAI 設立時是一家開源公司,現在變成了一個閉源、受微軟控制的逐利公司。這根本不是他想要的。
這期間 Meta 沒閑着。除了折騰元宇宙,Meta 的 AI 團隊一直在研究大語言模型,并發布了一些開源項目。大家各做各的,互不幹涉。
在 OpenAI 發布 ChatGPT 的幾周前,Meta 發布了一個類似的聊天機器人 Galactica,專門用于撰寫科學論文。誰知道這個産品不僅沒引起轟動,還招來一片罵聲,網友痛斥它會破壞科學出版。以至于 Meta 的人取消了演示,覺都睡不着。
當時人們關心的是 Meta 的元宇宙項目是不是快涼了,裁員裁到哪了,沒人關心它的 AI 做得咋樣。至于 OpenAI,大家覺得它代表新勢力,對它更加包容。
按照楊立昆的說法,兩周後 ChatGPT 問世,被視爲救世主降臨。随後的很長時間裏,OpenAI 都是全球科技界的當紅炸子雞,登上神壇奪走了所有目光。人們津津樂道于,OpenAI 是如何沖破谷歌的封鎖,對巨頭形成壓制。
在崇尚個人英雄主義的美國,創業新秀挑戰舊勢力的劇本,向來充滿話題性。于是大模型頭部選手的競争,變成了 OpenAI 和谷歌的雙雄争霸。
但一向好強的紮克伯格不會袖手旁觀。Meta 秘密研發的 LLaMA 大模型,已經箭在弦上。
Meta 才是全村的希望?
2023 年 2 月,ChatGPT 發布之後 3 個月,LLaMA 的第一個版本開源,一開始這個模型隻能用作研究。7 月,升級之後的 LLaMA 2 支持免費商用。Meta 把模型訓練數據、訓練方法、數據标注等大量細節都公布了,起始代碼全部開源。
LLaMA 2 性能非常突出,超過了所有的開源大模型。有人發現,其最大參數的版本比 GPT-3 參數量小,但效果更好。
曾經跟着馬斯克從 OpenAI 跳到特斯拉,後來又被 OpenAI 挖回去的科學家 Andrej Karpathy,将 LLaMA 2 的發布視爲人工智能和大模型發展過程中的重要一天,因爲這 " 是任何人都可以拿到模型權重的最強大語言模型。"
一時間,整個 AI 圈對 Meta 刮目相看。當一批巨頭公司掀起大模型軍備競賽,試圖通過技術封閉實現市場壟斷時,Meta 用 LLaMA 撕開了一條口子。OpenAI 沒做的事,Meta 做到了。
英諾天使基金合夥人王晟戲稱楊立昆爲 "Klaus LeCun"( 楊立昆英文名爲 Yann LeCun,Klaus Fuchs 在二戰期間向蘇聯提供了曼哈頓計劃的信息)。王晟開玩笑:" 不能隻讓美國擁有原子彈。"
王晟發現,ChatGPT 出現之後,科技圈對大模型熱情且迷茫。投資人中很多是看熱鬧," 因爲第一看不懂,第二不敢投,第三投不到。一個新的技術範式出現,沒人知道它的能力邊界在哪裏。"
王晟對「定焦」說,LLaMA 開源對行業影響很大。"Meta 過去這些年積累的大模型技術,本來都是不傳之秘,結果一開源,迅速把很多認知拉平了。"
之前,國内團隊研發大模型,隻能從零到一不斷試錯,一旦有個點被卡住了,即便從技術角度來說并不是太難,但靠自己可能也需要花一兩年時間才能解決,需要親自踩很多坑。現在 Meta 直接把它的經驗和數據拿出來,在思路和方法上給了行業非常重要的指引。
"在這個過程中大家學習了很多。假如沒有 LLAMA 開源,國内大模型今天的水平可能會差很多,我們會大幅度被人甩下。" 王晟說。
這也是爲什麽國内一下子突然湧現出 200 多個大模型。王小川的百川智能在公司成立僅兩個月就發布了一款大模型,其實就是借鑒了 LLaMA。李開複的零一萬物推出的大模型,也是使用 LLaMA 的開源模型架構。
LLaMA 開源對 OpenAI 最直觀的影響,是有一堆中國公司跳出來 " 吊打 "GPT。在他們的口徑中,已經在多項指标上超過了 GPT 模型,雖然很多榜單都是刷出來的。
更深層次的影響在于,大模型開源社區的力量快速壯大,全球的程序員都能爲開源做貢獻。他們開發出各種開源數據集,叠代出更多新模型,縮小與閉源大模型的差距。所以谷歌的工程師說,谷歌沒有護城河,OpenAI 也沒有。
Meta 在科技圈的形象變得高大起來。回顧 Meta 的發展,其實它一直都有開源的傳統。
早在 2016 年,Meta 團隊就開發并開源了深度學習框架 PyTorch,它和谷歌的 TensorFlow 成爲深度學習領域的兩大主流框架。
跟 OpenAI 現在才開始秘密推進芯片制造項目不同,Meta 在三年前就設計了自研 AI 推理芯片,并采用了開源架構。
在語言翻譯方面它推出了很多開源模型,兩年前發布的 NLLB 模型是維基百科的翻譯供應商之一,2023 年發布的 SeamlessM4T 可以翻譯近百種語言,同時它還發布了全球最大的開放多模态翻譯數據集。
有研究人員經過對比認爲,Meta 更傾向于信任、問責制以及通過開源實現人工智能的民主化。
反觀 OpenAI,它依然在技術上保持領先,但拒絕開放。
" 沒人知道 OpenAI 進展到什麽程度了,包括它正在研發的 GPT-5,是不是繼續用的 transformer 都是未知數。現在大家都跟着 GPT-3.5 的技術路線在跑,假設它悄悄變換了方向,那大家就掉坑裏了。因爲沒人知道正确路線是什麽。" 一位 AI 公司的創始人說。
同時它試圖阻擋競争對手,以保持自己的先發優勢。
字節跳動在 2023 年 12 月被 OpenAI 停用賬戶,因爲它在調用 OpenAI 的 API 開發自身大語言模型的時候,違反了 OpenAI 的服務條款。有悖商業倫理的行爲肯定是不對的,但外界由此關注到 OpenAI 的商業條款,它禁止客戶使用 GPT 輸出的内容開發任何可能會給 OpenAI 帶來競争的 AI 模型。
值得注意的是,微軟也有類似條款。它們将商業上的競争優勢看得很重要。
人工智能公司開放傳神(OpenCSG)創始人、CEO 陳冉認爲,開源的市場空間遠比閉源大,但未來一定是開源和閉源兩條路同時走,"OpenAI 開源不開源其實不重要了。"
開源閉源,誰對誰錯?
究竟是 OpenAI 被利益蒙蔽了雙眼,還是 Meta 大公無私要爲全人類做貢獻?
或許,它們在本質上并無不同。OpenAI 既沒有那麽自私,Meta 也不像網友鼓吹的那樣高尚,區别隻在于路線和策略。
若論對整個 AI 行業的貢獻,OpenAI 毫無疑問是最大的。畢竟,這一輪 AI 浪潮是由 ChatGPT 掀起的。它點燃了一把火,加速了大模型的普及。事實上,前兩年大模型開源社區基本是圍着 GPT-3 在轉。
OpenAI 不像谷歌、Meta 那些巨頭擁有雄厚的資金積累,早年大佬捐贈的資金早花得差不多了,沒錢是做不了研發的,總不能用愛發電。所以 OpenAI 抱了微軟的大腿,奧爾特曼想盡辦法爲 OpenAI 賺錢。
陳冉認爲,OpenAI 的成功其實是商業模式的成功,本質是投資人看到了巨大的商業價值和盈利模式。開源與閉源之間的競争方向一定是掙錢模式的創新競争。
Meta 将技術開源,也不是隻爲他人做嫁衣。開源是一種策略,能吸引更多開發人員免費幫它叠代技術、修複漏洞,正所謂衆人拾柴火焰高,但最核心的技術還是掌握在 Meta 手裏,該打擊對手的時候它不會手軟。就像谷歌,它旗下的安卓是開源系統,但國内手機廠商做自己的系統還是會有很多限制。
而在大模型火起來之前,Meta 掉進了元宇宙的深坑裏無法自拔,砸錢、虧損、裁員,看不到任何希望。大模型是那根救命稻草,ChatGPT 則是照亮前路的那束光。
再往深了看,閉源的 OpenAI 和開源的 Meta,從根本上對 AI 的價值判斷有分歧。
如果将 AI 比作未來世界的核武器,OpenAI 認爲它很危險,得謹慎,不能濫用。Meta 則認爲,核武器不能隻掌握在少數幾個玩家手裏,應該開放研究。
關于 AI 的利弊之辯,是科技圈的一個老話題。馬斯克就相信 "AI 危險論 ",他擔心有一天機器的智力、意識都超過了人類,可能會取代人類,摧毀人類文明。所以他當年牽頭成立 OpenAI,隻是後來 OpenAI 沒按他設想的路徑走。
基于 " 防止 AI 取代人類 " 的願景,行業裏又延伸出兩大派别。一派認爲大量獨立的 AI 系統比由大公司控制的少量 AI 系統更安全,AI 的研究應該開源開放;另一派認爲應該封閉研究,這可以減輕安全風險,防止不法分子濫用獲得的代碼。
OpenAI 屬于後者。支持它的人認爲開源策略加大了風險,比如倫敦一家 AI 公司的 CEO 就認爲,Meta 是最不負責任的人工智能參與者,他問:" 我們應該令核武器的設計透明化嗎?"
Meta 将開源視爲最優策略,楊立昆就認爲,機器最終會比人類更聰明,人類無法阻止壞人獲取它,AI 必須是開源的,隻有讓更多人參與其中,最終開發出的系統才會更安全。他認爲馬斯克的 AI 威脅論就是科幻小說看多了。
楊立昆曾經的合作夥伴,跟他一塊獲得圖靈獎的傑弗裏 · 辛頓,則持有不同觀點,認爲 AI 将對人類構成嚴重威脅。他的思想也許對他的學生伊利亞造成了影響。伊利亞是 OpenAI 的聯合創始人兼首席科學家,幾乎決定了 OpenAI 的技術路線,他也是 OpenAI 宮鬥事件中開除奧爾特曼的關鍵人物。伊利亞一直緻力于追求安全可靠的 AGI。業内普遍認爲,商業化和 AGI 的路線之争,引發了那場沖突。
所以,OpenAI 和 Meta 有不同的信念。OpenAI 将 AGI 視爲終極目标,并且相信自己将會第一個實現它;Meta 将開放平台視爲最好的路徑,試圖制定開源标準。當然,它們都希望在這個過程裏拿到應得的商業利益。
往長遠看,AI 的發展是螺旋式上升的,開源也好,閉源也罷,都将爲其注入動能。究竟誰是真的在爲全人類的未來操心,隻有等待時間檢驗了。
* 題圖及文中配圖來源于 Unsplash。
關注并【星标⭐】「定焦」
第一時間收到精彩内容更新