圖片來源 @視覺中國
文 | 矽基研究室,作者 | 山核桃
2013 年,在美國内華達州的一個酒店舞廳裏舉辦了一場私人聚會。幾十名工程師、計算機科學家們圍坐在一起,他們正在慶祝一個人工智能組織的成立。
" 這是一場天堂裏的婚禮 "。說這話的人叫做楊立昆,除了「卷積神經網絡之父」的稱号,在這一年,他做了一個重要的決定,從實驗室走進 Facebook,成爲這家科技公司人工智能研究院 FAIR 的第一代領導者,由此開啓了深度學習的浪潮。
但請注意這是 2013 年,當時科技行業的大多數人甚至都沒有聽說過深度學習,彼時的 Meta(在當時還是 Facebook)還是一家社交網絡公司,人們天然地認爲,它的使命不該是探究最前沿的技術,而是快速擴充規模。但紮克伯格沒有這麽做,他下定決心要押注最前沿的技術,比谷歌、微軟等巨頭們更快。
細數紮克伯格和他的 Meta,曾一度是 AI 界僅次于谷歌、微軟的存在。不僅在深度學習浪潮早期就占盡人和,将楊立昆等明星科學家納入麾下,同時也擁有最前瞻性的目光,紮克伯格甚至參與過 DeepMind 的競購,從微軟裏搶走不少的人才。
十餘年過去,在微軟、OpenAI、谷歌等一衆科技巨頭的「AI 軍備競賽」中,Meta 淪爲了第二梯隊,但紮克伯格并不願意承認這一點。在近期接受 The Verge 的訪談中,很久沒有現身的紮克伯格對外宣布了 Meta 打造通用智能的野心,不僅公布了最新的大模型動态,還大秀算力儲備,借 AI 之風,Meta 股價創曆史新高,市值超過 1 萬億美元。
隻是這一次,紮克伯格的 AGI 野心真的能實現嗎?
Meta AI 前傳:占盡天時、地利和人和
在 AI 浪潮中,曾經的 Meta 是可以和谷歌、微軟掰手腕的存在。
這得益于紮克伯格自身的「野心」,也是「天時」。紮克伯格很早就決定加入谷歌、微軟、蘋果等巨頭的戰争,即便規模尚小,他渴望通過下一項變革性技術,成爲領導者,因此當谷歌率先通過收購「深度學習之父」辛頓的初創公司進入深度學習領域時,紮克伯格就意識到他也必須抵達那裏。
2013 年,當楊立昆決定加入 Facebook,成爲人工智能研究院的第一任主任前,這位學者向紮克伯格提了兩個條件:一個是不會離開紐約大學,另一個則是堅持企業研究的「開放哲學」。
紮克伯格同意了這兩個條件,某種程度上也爲 Meta 在 AI 時代的領先位置奠定了基礎。
「不會離開紐約大學」讓 FAIR 始終緻力于追趕最前沿的技術,充滿着理想主義。據當時從谷歌跳槽到 FAIR 的根據實驗室華人成員田淵棟介紹,FAIR 實驗室不像谷歌那樣條條框框很多,有各種各樣的限制,相對非常自由,沒有産品壓力。" 我到了 Facebook 之後就好像回到了讀博時的狀态,特别有興奮感,在工作上特别有動力,整個人就好像活過來了。"田淵棟說。
可以說,彼時規模尚小的 Facebook 并未有谷歌「大象難轉身」的難題,FAIR 這種自由包容的研究氛圍可以被視爲是第一重「地利」,同時紮克伯格憑借 Facebook 牢牢掌握着流量入口,社交網絡上的圖片、視頻、語音等種種多模态的數據,這是深度學習成長的沃土,這是第二重「地利」。
楊立昆所提出的另一個條件——企業研究的「開放哲學」則爲 Meta 帶來了「人和」。
楊立昆堅信「開放研究」,并以此爲條件,讓這種願景變成了 Meta 的規範。" 因爲如果你的研究秘密進行,你的研究質量會很差,你無法吸引最好的人才,你不會招募到有能力推動最先進技術發展的人。" 楊立昆曾這樣說。
在這樣的企業研究哲學下,Meta 不走封閉的 AI 路線,而是盡可能地對外開源研究代碼、數據集和工具。一方面,取得了看得見的研究成果,直接推動了 AI 的進程,其中最典型的案例有兩個。
一個是自監督和生成模型(Self-supervised learning and generative models)。SSL 一直都是 Meta 布局 AI 的重要方向。楊立昆曾将 SSL 視爲「人工智能的暗物質」。他認爲,區别于監督學習這種範式,SSL 可以利用大量未标記數據來擴大人工智能規模,這對于識别和理解世界更微妙、更不常見的表示模式很重要。2014 年,當 Ian Goodfellow 提出了 GANs 模型(生成對抗網絡)時,科技巨頭們先後跳上了研究 GANs 的彩車,連一向在 AI 上鮮少發聲的蘋果也在當時發布了一篇「如何更好地利用 GANs」的研究論文。
Meta 無疑走在前列,從 2015 年開始,Meta 就關注 GANs 的不同變體,讓其從研究人員着迷的「玩具」變成可輔助人類生産的「工具」。
Meta 的科學家和工程師們認爲,GANs 真正有趣的部分是它們對未來的意義,上圖展示了可參與時尚單品的創作圖源:Meta
2017 年,Facebook 聯合羅格斯大學和查爾斯頓學院藝術史系,針對 GANs 提出了名爲 CAN(創造性對抗網絡),讓 AI 繪畫真正走入大衆視野。據當時研究人員的測試,請觀衆去判斷由 CAN 模型生成的 AI 藝術作品是人類藝術家的作品,還是人工智能的創作。結果,有 53% 的觀衆認爲藝術作品出自人類,這也是曆史上類似的圖靈測試裏首次突破半數。
另一個案例則是 AI 框架 PyTorch。作爲時下流行的開源深度學習框架,PyTorch 被廣泛應用于人工智能和機器學習領域,其地位一度逼近谷歌的 TensorFlow。楊立昆曾說:" 當初谷歌的 TensorFlow 确實比 Torch 更火。然而 Meta 的 PyTorch 出現之後,現在其受歡迎程度已經超過 TensorFlow 了。"
而根據中信建投對 Github 上的項目數量、關注人數的對比,在 AI 工程領域,Meta 工程領域相關能力僅次于微軟和谷歌。
這種「開放開源」更深遠的影響就是吸引了衆多頂尖人才的加入。深度學習發展的曆史,就是一部科技巨頭的搶人史。彼時的 FAIR 可以被視爲深度學習「研究與工程」的人才庫。有 ResNet 網絡的發明人何恺明、VC 維和 SVM 的締造者 Vladimir Vapnik、提出随機梯度下降法理論的 L é on Bottou 等。
天時、地利、人和,Meta 似乎具備成爲 AI 時代的霸主的因素,那麽究竟爲什麽,Meta 和紮克伯格會錯過這次浪潮呢?
FAIR 的兩次重組:Meta 錯過的時代
2014 年,紮克伯格開啓了自己的「亞洲行」,到訪中國時,在清華大學經管學院舜德樓内,用中文演講的紮克伯格闡述了當時十歲的Facebook 在「下一個十年」的三個方向:連接整個世界、發展人工智能、虛拟現實。
" 第一,我們想要連接整個世界,所以我們要幫助所有人用互聯網,第二,我們想要發展人工智能,第三是所有人用手機以後,我相信下個平台是虛拟現實(virtual reality),Oculus 是第一産品,我們希望還有别的很多産品。"
三大方向對應當時 Facebook 最重要三個業務闆塊:連接,即對應來自社交媒體平台所創造的收入。VR,也就是紮克伯格所堅信的「下一代互聯網」,也是後來他口中的「元宇宙」。而人工智能,既是彼時紮克伯格對外展示的野心,也同樣可視爲支撐其他業務的重要技術組件。
紮克伯格曾在說服楊立昆加入時,向這位學者描述過自己的願景——未來,社交網絡上的互動變成獨立完成任務的技術驅動,在短期内,這些技術将識别照片中的人臉,識别語音指令,并在不同的語言之間進行翻譯。從長遠來看,智能體或機器人将巡視 Facebook 的數字世界,接受指令,并根據需要執行指令。
當楊立昆問 Facebook 是否有任何不感興趣的人工智能研究領域時,紮克伯格說:" 可能是機器人學。" 但其他一切——數字領域的一切——都在紮克伯格興趣範圍之内。
按照這樣的戰略邏輯,依靠領先的技術、社交網絡規模化的收入以及 VR 作爲硬件載體,Facebook 理應走出一條更順暢的發展道路。但事實上,誰也難以預料技術的發展與周期變化,紮克伯格與他的 Facebook 也毫不例外。
理解 Meta 爲何沒有成爲當下最熱門的 AI 企業,FAIR 的兩次重組是一個很好的觀察窗口。
在 2018 年之前,FAIR 實驗室主要負責學術研究,另一個被稱爲應用機器學習部門(下文簡稱:AML)則是負責産品團隊成果的轉化,雙方互不幹涉,相對比較獨立。一個強調最前沿的技術,另一個則是注重轉化,因此如何強調團隊之間的協作,成爲了關鍵。但好在,盡管工作方式不同,但兩個團隊的共識都是一緻的,比如強調開放,因此上述問題還并沒有顯露。
轉折的點發生在 2018 年,FAIR 的第一次重組。
2018 年,楊立昆宣布卸任 FAIR 的職位,轉任首席 AI 科學家一職,接任楊立昆的是當時 AML 的領導者 J é r me Pesenti。這次調動不同的點在于,削弱了 FAIR 的獨立性,Pesenti 同時擁有 FAIR 和 AML 兩個部門的話語權。楊立昆在一次采訪中這樣評價這次變動:「AML 和 FAIR 向 CTO 彙報,随着 AI 重要性、圍繞深度學習建立更多系統重要性的提升,CTO 再也不用擔心了。」
楊立昆的「言外之意」其實有二:一是 FAIR 正在去集中化,這意味着未來将更多爲産品和業務服務。二是在當時 Facebook 陷入到了嚴重的監管,CTO 必須要用技術解決公衆的信任危機,因此 FAIR 加大了在識别型 AI 的投入,以促進人工智能的公平、透明和可解釋性。
第二次重組則發生在 2022 年 6 月,Meta 再次宣布 FAIR 重組調整,明确提出 AI 部門不再「集中化研究」,而是分布式的下放到每個組織部門中去。這項改動加速 AI 技術在 Meta 實際業務中的應用,而被引入到不同産品組的業務部被稱爲「AI 創新中心」。其中,FAIR 也将成爲 Reality Labs Research 旗下部門,就在一年前,Facebook 正式改名爲 Meta。
科技公司的組織變動非常常見,畢竟技術的變化太快了。但不同于微軟、蘋果等科技公司,FAIR 之于 Meta,兩次重組的不同點有二:
一是 AI 都是「救急」,而非創新。無論是用以服務社交媒體,識别與解決假新聞等問題,還是應對不成熟的 VR 業務,FAIR 本身聚焦前沿技術的創新被大大稀釋了。
二是缺乏戰略的穩定性。「擁抱變化」盡管是科技公司經常挂在嘴邊的一句話,但參考微軟、蘋果的經驗,總有一個穩定長期的「主線」。例如,蘋果盡管市場被吐槽「擠牙膏創新」,但在圍繞 C 端的軟硬件叠代上始終放大自己的生态、供應鏈等核心優勢。
至此,如果回頭看看十年前紮克伯格給自己留的三個方向:連接整個世界、發展人工智能、虛拟現實,似乎三個都沒有助力其成爲 TOP1。
重新變酷的 Meta,不願再走老路
" 我們可以發現的一點是說,Meta 又變酷了。" 曾在 Meta 擔任 AI 架構總監,如今創業的賈揚清如此評價 Meta 的新變化。
在由 chatGPT 所開啓的生成式 AI 浪潮中,之所以說 Meta「重新變酷」的關鍵有二:一是區别于 OpenAI 等巨頭的閉源路線,Meta 加入戰場的姿态是「開源」。
從 LLaMA 系列開始,Meta 相繼開源了一系列的模型,包括視覺領域的 SAM 和 DINOv2、音頻領域的 AudioCraft 系列模型、多模态大模型 ImageBind 等。而據紮克伯格的最新透露,Meta 正在訓練 Llama 3,且該模型具備更強的代碼生成能力。
而由 LLaMA 所引發的「開源和閉源」之間的讨論已足以證明了 Meta 的變化。楊立昆曾這樣形容開源社區與閉源模型在生成式 AI 上的發展。" 開源人工智能模型正走在超越專有模型的路上 "。
第二個「重新變酷」的原因則是紮克伯格态度的轉變。區别于過去對增長的迷戀以及混亂的 AI 策略,無論是與微軟合作,還是宣布對開源大模型的押注,Meta 的 AI 策略逐步從分散走向整合。具體來說,一是延續開源路線,加大 AI 生态的繁榮,這既符合對 FAIR 當初的承諾,也有利于在開發者和公衆間,改善 Meta 的形象。二是借助 AI 更快抵達元宇宙,一方面利用 AI 降低開發門檻,另一方面,發揮應用優勢,更好地優化體驗。
據「矽基研究室」梳理,區别于谷歌、亞馬遜等巨頭,Meta 的 AI 能力主要集中在 C 端和視覺,包括圖像識别和目标檢測、圖像生成、增強現實(AR)和虛拟現實(VR)、人臉識别和人臉相關技術以及社交網絡數據處理和隐私保護。這些技術儲備在生成式 AI 時代具備先發優勢。
可以肯定的是,紮克伯格和他的 Meta 都不願重走過去的老路,曾經的 AI 王者是否能夠再度翻身,這是時代交給紮克伯格的新命題了,畢竟 Meta 所面臨的挑戰還有很多。
首先,是老生常談的 Reality Labs 的盈利問題。從 Meta 去年第三季度财報狀況來看,廣告業務強勢複蘇,但 VR/AR 業務持續虧損。去年 9 月,Meta 發布了首款消費級 MR 頭顯 Quest 3,據天風國際證券分析師郭明錤的分析,Quest 3 頭顯銷量将明顯少于最初的預期。據機構 IDC 的估計,2023 年 AR/VR 頭顯的出貨量爲 810 萬台,同比下降 8.3%,盡管有蘋 Vision pro 的熱度加持,但市場回暖依舊需要一定的時間。
其次,即便不走過去的老路,AI 戰略已逐漸連貫,但比起微軟、OpenAI 等巨頭,Meta 想做的還是太多了。如「互聯網怪盜團」的評價,當所有科技巨頭都在集中投入 AI 這一個「研發焦點」時,Meta 卻必須将資源分散在兩個「研發焦點」,這不可避免地要面臨資源和精力的分配問題。
時間撥回 2012 年,彼時 Facebook 尚未改名,面對當時股價的低迷、移動化戰略的失誤,紮克伯格回應道:" 我能承受人們的低估,因爲我甯願被低估,這樣才能真正讓他們刮目相看。" 如今在這場關于 AI 的新戰事中,紮克伯格回到了原點,他和 Meta 都急需一場勝仗。
參考資料:
1、福布斯:楊立昆希望用開源戰勝 OpenAI?
2、甲子光年:三次誤判後,紮克伯格這次終于做對了
3、遠川研究所:差一步稱霸 AI:曆史進程中的紮克伯格
4、互聯網怪盜團:Meta 的逆襲:紮克伯格到底做對了什麽?
5、深度學習革命,凱德 · 梅茨