圖片來源 @視覺中國
文 | 财經故事荟,采寫 | 王舒然,編輯 | 萬天南
在大模型甚嚣塵上的當下,一向高舉高打的字節,卻一反常态,低調得讓人不太習慣。
當百度、阿裏、華爲、360 等知名互聯網公司的一把手們親自挂帥,爲大模型站台,并不吝用 " 智能化時代的開端 "、" 科技和商業史上的革命性時刻 " 來贊譽它時,字節卻安靜得多。
相關的官宣隻有兩個,一是 4 月 11 日 , 飛書宣布将推出 AI 助手 "My AI",二是 4 月 18 日,火山引擎推出大模型訓練雲平台,包括自研 DPU(數據處理器)、新版機器學習平台等系列雲産品,以服務于大模型創業公司——字節自研大模型始終未露面。
相反的是,火山引擎總裁譚待公開 " 承諾 ",火山引擎不做大模型,将化身賦能者,爲大模型客戶提供算力等 AI 基礎設施,幫助其做好大模型開發。
此舉似乎表明,字節避開了大模型戰火,選擇以幕後賣水者的身份入局。
隻是,在算力、算法、數據這大模型的三要素上均具備優勢的字節,爲何會選擇 " 韬光養晦 "?字節真的會徹底放棄大模型,甘爲他人做 " 嫁衣 " 嗎?
慢一拍的字節大模型
火山引擎不做大模型,或許并不代表字節對大模型無動于衷,這可能是個文字遊戲。
實際上,雖然字節從未大張旗鼓得官宣自研大模型,但已經有所部署。
據 36Kr 在今年 2 月的報道,字節跳動在大模型上已有布局,會在語言和圖像兩方面發力,語言大模型團隊由字節搜索部門牽頭,目前團隊規模在十數人左右;圖片大模型團隊則由産品研發與工程架構部下屬的智能創作團隊牽頭。
另據《晚點 LatePost》報道,張一鳴開始看人工智能論文,且時常會和一些字節人士分享論文心得和對 ChatGPT 的思考。
這表明,字節并不想缺席這場盛宴,但必須承認的是,字節在大模型上的反應确實有點 " 遲鈍 " 了。
民生證券 4 月 9 日發布的《當大模型不再稀缺》報告顯示,國内至少已有 30 多家大模型亮相。大部分都在 3~4 月份官宣,比如 3 月 16 日的百度 " 文心一言 " 大模型,4 月 8 日的華爲盤古系列 AI 大模型,4 月 10 日的商湯 " 日日新 " 大模型,4 月 11 日的阿裏 " 通義千問 " 大模型 ......
而據 36Kr 報道,字節語言大模型團隊今年初才成立,預期今年年中推出大模型,字節跳動相關技術負責人表示,技術中台在這些領域的探索仍處于初期,尚未成熟。
事實上,大模型競賽的起點并非今天,而在更早的布局,這方面,字節有些晚了。
對比來看,百度、阿裏、華爲、騰訊等企業的大模型均在 2019 年~2021 年間就已有雛形,比如,百度在 2019 年發布了文心大模型,阿裏在 2021 年發布了 M6 大模型,同年華爲發布盤古大模型,這些雛形可以視爲近期發布的類 ChatGPT 大模型的 " 基座 "。
而字節方面,雖然其 AI 布局不算晚,字節 AI Lab 早在 2016 年就成立,與騰訊同一年,但其似乎并未在大模型上下足功夫。
據《晚點 LatePost》報道,一位字節人士稱,在去年底 ChatGPT 出現前,字節對大模型的投入還比較少,表現之一是,約有 100 人的字節 AI Lab NLP(自然語言處理)組,隻有不到 10 人在研究語言大模型,其他人主要在做翻譯和抖音安全等優化。
知乎上一位字節 AI Lab 工程師的回答也印證了這一點,他表示,字節 AI Lab 的主要研究方向和業務應用有關,比如抖音特效、視頻和圖片審核等。
簡單來說,字節對 AI 的探索比較務實,主要服務于自家業務,這種務實而非務遠的策略,或許反而成了其布局通用大模型的 " 阻礙 "。
而除了晚一步之外,字節對大模型的野望似乎也不是很大。
據《晚點 LatePost》報道,字節語言大模型的探索方向主要與搜索相關,可能會在抖音、TikTok 中推出類似微軟 New Bing 的功能;圖像大模型則主要服務商業化需求,以幫助字節的廣告客戶以更低成本制作視頻。
另據字母榜報道,有知情人士稱,飛書推出的 "My AI" 背後的大模型是由飛書自行操盤,而非字節大模型團隊負責。
從上述信息判斷,字節大模型似乎并不打算 " 大包大攬 ",而是與自家部分業務緊密相關,這與百度 " 文心一言 "、阿裏 " 通義千問 " 等通用大模型有所差别。
比如 " 文心一言 ",在發布會現場,文心一言展示了五個使用場景,包括文學創作、商業文案創作、數理推算、中文理解和多模态生成。
" 通義千問 " 的功能則包括多輪對話、文案創作、邏輯推理、多模态理解、多語言支持等,阿裏巴巴集團董事會主席兼首席執行官張勇表示,阿裏所有業務包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等都将接入該模型,應用場景實屬廣泛。
另一個可以側面佐證這一點的是,百度和阿裏均計劃依托自家雲平台,向外界開放大模型服務,打造大模型生态。
比如阿裏雲智能集團 CTO 周靖人表示,各行各業的生态夥伴都可以對千問大模型進行再訓練和精調,打造行業專屬大模型;百度智能雲事業群總裁沈抖也表示,文心一言的能力将通過百度智能雲對外提供服務,會率先在媒體、文娛、企業軟件等行業落地,場景包括智能客服、員工培訓、巡檢日報、知識萃取等。
但字節雲卻 " 反其道而行之 ",火山引擎宣稱隻做基礎設施服務,不對外輸出大模型能力。
這意味着,字節正在探索的大模型定位可能并非是開放生态,而是爲了增強現有業務的競争力。
當然,這隻是初期,字節大模型的全貌尚未揭開,在字節官宣之前,還是變數難料。
字節爲何甘爲他人做 " 嫁衣 "?
值得探究的是,爲何字節對百度、阿裏那樣的通用大模型興趣不高?火山引擎又爲何堅定得不做大模型?
背後原因或許與以下幾方面的權衡有關:
其一,通用大模型燒錢,且距離商業落地 " 遙遠 "。
訓練大模型的一大成本是算力,而算力的關鍵是芯片,那麽,大模型訓練需要多少芯片?
參考 ChatGPT,美國市場研究機構 TrendForce 推算稱,處理 ChatGPT 的訓練數據需要 2 萬枚 A100 芯片。網上流傳的一份《AI 芯片專家交流紀要》顯示,如果是對标 ChatGPT 的大模型,1 萬顆 A100 芯片是入門券。
而據國盛證券估算,按單張 A100 芯片的價格爲 10 萬元算,大模型訓練需要投入約 10 億元。
這還隻是訓練階段的芯片成本,還有模型推出後的綜合運營成本,參考 ChatGPT,半導體研究公司 SemiAnalysis 認爲,GPT-3 每天大規模服務用戶的運營成本高達 70 萬美元,一年則高達 2.555 億美元(約 17.6 億元人民币),新一代的 GPT-4 模型隻會更燒錢。
除此外,還有數據采集、人工标注等軟性成本,加起來可謂 " 天價 "。
像字節這樣的大廠或許有資金實力,但麻煩的是,燒錢的結果面臨不确定性。
雖然大模型前景可瞻,但距離大規模的商業落地還有不小的距離,目前仍在摸索階段,除了像釘釘、飛書、印象筆記等辦公場景的具體落地外,其他的應用場景都還停留在展望階段。
創世夥伴 CCV 合夥人梁宇曾對《21 世紀經濟報道》表示,現在是通用人工智能商業化應用的前夜,AI 大模型還沒有經過大量的商業包裝和訓練,需要從業者像園藝師一樣去修剪,形成符合行業規律的商業化産品。
IDC 中國研究總監盧言霞則認爲,大模型落地的不确定性在于,能不能成功落地,是否真的能産出比之前的 AI 更好的效果,需要多久才能落地等等。
通用大模型投入産出比的不确定性,或許會讓 "ROI 至上 " 的字節有所顧慮。
其二,時間就是力量,在過去幾年内,阿裏、百度等企業已将大模型 " 基座 " 叠代過幾輪,而字節幾乎是從 " 零 " 開始,先發優勢已失,追趕不易,不如務實一點。
如今,字節大模型聚焦搜索、視頻生成等場景,離自身的業務落地更近,在算法和數據的儲備上極具優勢,可操作性更高。
火山引擎定位基礎設施的服務也是同理,其 2021 年開始切入 IaaS(基礎設施服務)模式,至今也有一定積累。
且網上流傳的一份《阿裏雲 AI 專家交流紀要 0401》顯示,在國内大廠的 AI 算力儲備中,字節排名第二,僅次于阿裏。
更重要的是,火山引擎該定位的商業落地十分明确,更容易保障正向現金流。
這是因爲大模型訓練需要巨大算力支持,而雲廠商是公認的算力等基礎設施的最佳載體。
正如阿裏巴巴集團董事會主席兼首席執行官張勇所言,大模型是一場 "AI+ 雲計算 " 的全方位競争,超萬億參數的大模型研發,是囊括了算法、底層龐大算力、網絡、大數據、機器學習等諸多領域的複雜系統性工程,需要超大規模 AI 基礎設施的支撐。
微軟便是先例,微軟 Azure 作爲 OpenAI 的獨家雲供應商,爲 ChatGPT 提供算力和超級計算系統。除了 OpenAI,微軟 2023 财年二季度财報電話會議顯示,安盛、聯邦快遞和 H&R Block 等公司也都選擇 Azure 來部署和管理其模型。
像微軟這樣的雲廠商被喻爲大模型時代的 " 賣水人 ",意爲在大模型淘金的人未必能賺到錢,但爲淘金人提供基礎服務的肯定能賺到。
矽谷知名風投 A16Z 的研究印證了這一點:生成式 AI 的大量資金最終都穩定地流向了基礎設施層,預計生成式 AI 總收入的 10%~20% 都流向了雲提供商。
總之,商業落地風險小,自身又擅長,無怪乎火山引擎如此定位,而抓住這股 " 紅利 ",有機會爲其帶來新的市場增量。
在目前的雲市場中,火山引擎還排不上名次,IDC 最新發布的《中國公有雲服務市場(2022 下半年)跟蹤》報告顯示,目前公有雲服務市場的市場份額排名前五名分别爲:阿裏雲、華爲雲、中國電信天翼雲、騰訊雲和 AWS,它們總共占據了 72% 以上的市場份額,其餘的雲服務廠家份額有限。
或許,以基礎服務切入大模型戰場的火山引擎,未來有機會借此一搏新的市場格局。
火山引擎或遇天花闆
目前看,火山引擎這條路走得還算順利。火山引擎總裁譚待表示,目前國内有數十家做大模型的企業,七成已經在火山引擎雲上,包括 AI 技術公司 MiniMax、智譜 AI、昆侖萬維、毫末智行等。
關于 " 七成 " 的數據口徑,譚待的解釋是,該 " 七成 " 是火山引擎相關客戶與第三方機構統計的大模型企業數量之比,而能獲得這麽多客戶是因爲機器學習平台解決了算力輔助的問題。
這些客戶案例表明,火山引擎在大模型訓練領域已有一定立足之地。
不過,從長遠看,火山引擎也面臨挑戰。
一方面,有能力做大模型的公司畢竟是少數,客戶規模的天花闆很明顯。
據譚待透露,在火山引擎的大模型客戶中,通用大模型公司占比大約爲三分之一,垂直行業公司占比約爲三分之二。
分别來看,在通用大模型方面,雖然目前創業者衆,但大浪淘沙,最終留下的能有幾何?
一位互聯網投資人認爲,中國版 ChatGPT 隻會在 5 家公司裏産生:BAT+ 字節 + 華爲,因爲大廠有錢有人有場景。
北京航空航天大學人工智能研究院教授吳文峻也有類似觀點,其在接受《中新經緯》采訪時表示,在目前宣布進軍大模型的三四十家企業中,最後能做成的或許不超過一半。
當客戶數量有明顯的天花闆時,火山引擎的前景可能也有了 " 瓶頸 "。
而在垂直行業模型方面,客戶數量雖然很多,但也可能面臨阿裏雲、百度雲等平台的 " 狙擊 "。
原因在于,阿裏雲、百度雲均自帶通用大模型輸出的能力,基于此,企業可更方便的生成垂直模型。
比如阿裏雲,阿裏雲智能集團 CTO 周靖人在此前的媒體采訪中表示,阿裏雲會爲企業提供一個專屬數據空間,企業将相關信息存入,且不需要做任何數據預處理,便可調用 " 通義千問 ",一鍵式生成自己的行業專屬大模型。
而如果在沒有大模型的火山引擎上做垂直模型訓練,企業要操心的事顯然更多。
上述投資人認爲,垂直模型企業一般很少會自己從頭做,而是找一個還不錯的 Pre-Train 過的大模型,在此基礎上做 Instruction Tuning(指令微調)。
在此方面,阿裏雲等平台可能更有優勢。
另一方面,未來雲廠商的模式可能是賣模型 + 賣算力,而不隻是賣算力。
Maas 模型即服務的時代已經到來,阿裏雲、百度雲不僅支持專屬行業模型的生成,還支持中小企業甚至個人基于大模型直接開發應用,這就好比個人開發者基于安卓操作系統開發 App。
換句話說,模型層在未來可能成爲新的基礎設施。
李彥宏在 36Kr 專訪中更是斷言,未來企業在購買雲計算時,不看底層算力,而是看大模型的優劣。
這可能給火山引擎帶來一定沖擊,因爲當大量中小企業或個人基于阿裏雲、百度雲開發應用時,雲廠商背後的算力也得到了間接調用,從而規模效應平攤了算力成本,最終使其基礎設施層面的服務也更具價格優勢,這頗有點 " 降維打擊 " 的意思。
事實上," 價格戰 " 已經開始了。
4 月 26 日,在 2023 阿裏雲合作夥伴大會上,阿裏雲推出了史上最大規模的降價:核心産品價格全線下調,降幅最高至 50%。
不過,火山引擎對此好像比較樂觀,至少現階段如此。
其邏輯在于,一來火山引擎拿到的時間窗口還比較長,譚待認爲,國内距離全球最高水平的大模型還需要比較長的時間,現階段不可能用三四十分的模型去做應用,也不可能做好應用。
二來,火山引擎堅信未來是多雲多模型時代,企業會避免單一依賴,而選擇使用多家雲服務,同時,各行業都有自己高質量的私有語料,會形成多模型生态。
言下之意可能是,市場很大,火山引擎總會有立足之地。
總而言之,大模型市場的未來撲朔迷離,參與其中的任何一員的前途均可能有變數," 缺失 " 大模型的火山引擎如此,走務實路線的字節大模型也如此。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App