圖片來源 @視覺中國
文 | 盒飯财經,作者 | 趙晉傑,編輯 | 王靖
立志研發通用大模型底座的李開複,正在陷入一場套殼 Meta 開源大模型 LLaMA 的質疑之中。
近期,今年 3 月份從阿裏離職投身 AI 大模型創業的賈揚清爆料稱,在幫助海外客戶适配國内某一新模型中,被朋友告知該模型用的其實是 LLaMA 架構,僅在代碼中更改了幾個變量名。
盡管賈揚清并未點出開發上述新模型的具體公司名稱,但種種迹象都指向了李開複的零一萬物。11 月 6 日,零一萬物剛剛發布了 "Yi" 系列開源大模型—— Yi-34B 和 Yi-6B。
針對外界質疑,11 月 15 日,零一萬物在回應盒飯财經中承認,在訓練模型過程中,沿用了 GPT/LLaMA 的基本架構,但 " 就零一萬物的觀察和分析,大模型社區在技術架構方面現在是一個處于接近往通用化逐步收攏的階段,基本上國際主流大模型都是基于 Transformer 的架構……國内已發布的開源模型也絕大多數采用漸成行業标準的 GPT/LLaMA 的架構。"
如果把模型訓練過程比做一道菜," 架構隻是決定了做菜的原材料和大緻步驟……要訓練出好的模型,還需要更好的‘ 原材料’(數據)和對每一個步驟細節的把控(訓練方法和具體參數)。" 零一萬物進一步解釋道。
在賈揚清站出來爆料之前,有關零一萬物模仿 LLaMA 架構的指控已經開始在開源社區内發酵。
9 天前,convai 高級人工智能應用專家埃裏克 · 哈特福德在 Huggingface 上發帖稱,"Yi-34B 模型基本采用了 LLaMA 的架構,隻是重命名了兩個張量。"
8 天後的 11 月 14 日,Yi 團隊開源總監 Richard Lin 在該帖下回複稱,哈特福德對張量名稱的看法是正确的,零一萬物将把它們從 Yi 重命名爲 Llama。
在今天盒飯财經收到的最新回複中,零一萬物提到:" 對于沿用 LLaMA 部分推理代碼經實驗更名後的疏忽,原始出發點是爲了充分測試模型,并非刻意隐瞞來源。零一萬物對此提出說明,并表達誠摯的歉意,我們正在各開源平台重新提交模型及代碼并補充 LLaMA 協議副本的流程中,承諾盡速完成各開源社區的版本更新。"
李開複個人在今天下午也發朋友圈對此事做了回應。
素有國内 "AI 教父 " 之稱的李開複,在大模型浪潮中收獲外界寄予的更大期望之餘,也不可避免迎來外界更嚴苛的審視。
01
盡管零一萬物已經公開承認其借鑒了 LLaMA 架構,但并不能就此直接給李開複的大模型扣上 " 套殼 " 或者 " 抄襲 " 的帽子。
同樣開發大模型的國内創業者李振告訴盒飯财經,界定某一大模型是否存在套殼行爲,取決于具體的實現細節和底層技術。" 如果零一萬物大模型使用了與 Meta LLaMA 相同的模型架構、訓練方法和數據集,那麽它可能在某種程度上是套殼的。但是,如果它使用了不同的技術或進行了額外的改進,那麽就不能簡單地說是套殼。"
根據零一萬物的聲明,其投注了大部分精力調整訓練方法、數據配比、數據工程、細節參數、baby sitting(訓練過程監測)技巧等。
即便模型架構相似,但在不同的數據來源和數據訓練方法加持下,最終訓練出來的大模型性能依然會表現各異。" 前大模型時代,AI 的主流是以模型爲中心的單任務系統,數據基本保持不變。進入大模型時代,算法基本保持恒定,而數據在不斷增強增大。" 在産業專家劉飛看來,相比算法和算力,數據可能是眼下阻礙國産大模型追趕 OpenAI 步伐的更大鴻溝," 魔鬼都藏在這些數據訓練的細節裏。"
尤其值得一提的是,參數量的大小與最終模型呈現的效果之間,兩者 " 投入産出并不成正比,而是非線性的。"人工智能專家丁磊表示," 數據多隻是一個定性,更重要的是考驗團隊數據清洗的能力,否則随着數據增多,數據幹擾也将随之變大。"
這也爲新晉大模型團隊以更小參數量,在性能上反超更大參數量的模型提供了某種理論可能性。
11 月 6 日 Yi-34B 預訓練模型發布後,李開複将其形容爲 " 全球最強開源模型 ",以更小模型尺寸評測超越了 LLaMA2-70B、Falcon-180B 等大尺寸開源模型。
Yi-34B
但随着越來越多國産大模型在各類測試榜單中登頂,逐一超越業内公認最強的 GPT-4,有關這些大模型是靠實力拿下的高分,還是借助了刷榜手段,再次引發外界争議。
知名大模型測試集 C-Eval 就在官網置頂聲明,稱評估永遠不可能是全面的,任何排行榜都可能以不健康的方式被黑客入侵,并給出了幾種常見的刷榜手法,如對強大的模型(例如 GPT-4)的預測結果蒸餾、找人工标注然後蒸餾、在網上找到原題加入訓練集中微調模型等等。
造成國産大模型屢登測試榜單第一的一大客觀原因,在劉飛看來,是因爲到目前爲止,并沒有真正公認的客觀評判标準和方法。上一代 AI 的 " 單任務模型 " 有公認的數據集作爲黃金标準,但在新興的大模型時代," 由于大模型多任務、開放式的新特性,變得難以預先定義,數據質量的測試既繁重,也難以全面。" 劉飛說。
不過,哪怕不少國産大模型是借鑒 LLaMA 架構訓練而來,其對國内公司而言仍有不可替代的價值。
李振表示,外部公司在接入一個大模型平台時,除了考慮模型的性能和效果外,模型的開放性和可定制性也是需要考慮的重要因素,具體到某些區域,還要特别重視數據隐私和安全合規問題。
盡管目前國内公司可以直接接入 Meta LLaMA 模型,但是由于 Meta LLaMA 是一個國際性的大模型平台,它需要遵守更多的國際法規和限制。此外,如果涉及到敏感領域或數據,還需要獲得特定的授權或許可,甚至不排除海外開源技術随時關停、切換高額收費或限制地區訪問的風險。因此在李振看來,相比冒險接入 Meta LLaMA,國内公司直接調用國産大模型是更爲經濟劃算的選擇。
02
通過借鑒 LLaMA 基本架構,李開複的零一萬物在訓練模型速度上快速起步。
今年 3 月,李開複正式宣布将親自帶隊,成立一家 AI2.0 公司,研發通用大模型。經過三個月籌辦期,7 月份,該公司正式定名 " 零一萬物 ",并組建起數十人的大模型研發團隊。團隊成型四個月後,零一萬物便在 11 月份推出了 "Yi" 系列大模型産品,并借助 Yi-34B 霸榜多個大模型測試集。
據投資界報道,在亮相大模型産品之際,零一萬物已完成由阿裏雲領投的新一輪融資,投後估值超 10 億美元,跻身中國大模型創業公司獨角獸行列。
零一萬物快速崛起的背後,離不開李開複的個人 IP 加持,就連官網都公開感謝 " 李開複博士過往 40 年在人工智能領域的科研和産業經驗 "。
零一萬物官網
出任過谷歌全球副總裁兼大中華區總裁,并在微軟全球副總裁期間開創了微軟亞洲研究院的李開複,通過在 2009 年創立創新工場,完成了從明星職業經理人到 VC 投資人的身份轉變。
過去十多年間,創新工場投資超過 300 多個項目,其中不乏曠視科技、美圖、知乎、第四範式、地平線等行業知名公司。
在 2019 年被晚點問及創新工場回報最好的基金是哪一期時,李開複回答:" 投 AI 項目最多的回報最好……比如曠視回報 400 倍、VIPKID 回報 1200 倍。"
靠着數十年如一日對 AI 的宣揚布道,李開複一度被稱爲中國的 "AI 教父 "。盡管其在 AI 方面的投資可圈可點,但李開複扮演的角色顯然不同于山姆 · 阿爾特曼這樣用劃時代的産品來引領 AI 行業的企業家。
在 2018 年 9 月推出的新書《AI · 未來》中,李開複曾談及中美兩國競争差距,大膽預言:" 人工智能實幹時代競争力的天平将傾向商業化執行、産品質量、創新速度和大數據,而這些要素恰是中國優于美國之處。" 在書中,李開複甚至寫到 "15 年前從‘學習’起步的中國互聯網初創公司從美國商業模式中獲得靈感,激地相互競争……當這一代中國企業家學會利用人工智能時,将徹底颠覆遊戲規則。"
在 ChatGPT 引發的新一輪 AI 颠覆性變革現實面前,越來越多人開始重新打量中美在 AI 方面的差距。
具體到大模型方面,丁磊甚至認爲,相比算法、算力和數據," 真正有領導力的 AI 管理者,像山姆 · 阿爾特曼這樣有能力推動新技術落地應用的技術管理人才,才是國内更缺的一塊短闆。"
03
除了需要向外界展現如阿爾特曼一般的高超技術管理能力之外,李開複的大模型夢還遭遇着諸多挑戰。
如何盡快追趕上 OpenAI 的步伐,是橫亘在李開複等一衆大模型創業跟随者面前的最大拷問。
在國産大模型突飛猛進的大半年間,OpenAI 同樣進步神速,相繼推出了 GPT-4、GPT-4V、GPT-4 Turbo。
阿爾特曼還在帶領 OpenAI 繼續狂飙。今年 10 月份,阿爾特曼首次對外明确,OpenAI 已經啓動 GPT-5、GPT-6 的訓練,并将繼續沿着多模态方向持續叠代。
在國産大模型還在努力追上 ChatGPT 步伐之時,其相比 OpenAI 更先進模型的差距,反而有了逐漸擴大的趨勢。
值得一提的是,2020 年發布 GPT-3 時,OpenAI 曾詳細公開了模型訓練的所有技術細節。中國人民大學高瓴人工智能學院執行院長文繼榮表示,國内很多大模型其實都有 GPT-3 的影子。
但随着 OpenAI 在 GPT-4 上一改開源策略,逐漸走向封閉,一些國産大模型就此失去了可供複制的追趕路徑。
放眼國内,即便宣稱做到了一衆測試榜單第一,但留給零一萬物的挑戰仍難言樂觀。
在發布 Yi-34B 預訓練模型後,李開複宣稱内部已經啓動下一個千億參數模型的訓練。與之相比,國内不少大模型公司已經完成了千億模型的上市發布。
除了需要提速追趕先行者外,如何在商業落地上勝出,将是李開複需要解決的更大挑戰。
經曆過 AI 1.0 時代的李開複,在投身大模型創業後,便對外提到自己 " 做的應用一定是朝着能夠快速有收入,而且能夠産生非常好的利潤、收入是高質量的、可持續的,而不是一次性在某一個公司上打下一個單子。"
實現上述商業化的突破口被李開複放在了 C 端應用上,李開複同樣相信 AIGC 時代将誕生比移動互聯網大十倍的平台機會,将出現把既有的軟件、使用界面和應用重寫一次,改寫用戶交互和入口的新機遇。" 如同 Windows 帶動了 PC 普及,Android 催生了移動互聯網的生态,AIGC 也将誕生新一批 AI-first 的應用,并催生由 AI 主導的商業模式。"
想要實現上述宏偉願景,除了需要将旗下通用大模型打造得足夠先進之外,還需要在一衆國産大模型競争中脫穎而出。
恒業資本創始合夥人江一認爲,這波 AI 大模型浪潮中,國内最終能夠存活下來的通用大模型玩家," 可能有個 3 家就已經不錯了。因爲訓練大模型需要大量投入,要燒很多錢,而且還不一定能追得上 GPT-4。"
無論 Windows 還是 Android,每個時代也隻拼殺出了一個,李開複該如何讓零一萬物成爲 AIGC 時代的 " 唯一 " 呢?