兩筆融資超過去年中國大模型領域融資總額。
文丨王與桐
2024 年剛開啓 1 個多月,中國大模型領域的資本競争進入新階段。
《晚點 LatePost》獲悉,大模型創業公司月之暗面(Moonshot AI)近期完成了超 10 億美元 B 輪融資,投資方包括阿裏巴巴、美團、小紅書和紅杉中國等。本輪結束後,月之暗面估值超過 23 億美元。
這是目前中國大模型領域的最大單輪融資,但這個記錄不一定會保持太久。
據了解,另一家大模型頭部公司也在進行金額達 10 億美元的新融資,交易已進入後期階段。
兩筆 10 億美元融資,加起來已超過去年中國大模型領域的公開融資總額(約 100 億元人民币)。
大模型創業公司在争奪所剩不多的氧氣:美元基金投資整體低迷,人民币基金更看重确定性,有意願和實力大手筆投入大模型的主要是大型互聯網或科技公司。
作爲有限的投資方,中國互聯網大廠也在展開激烈競争,并已分化出不同動作和策略:一是大量對外投資,服務戰略目标;二是暫不出手,集中精力做自己的大模型。
月之暗面此輪的新股東阿裏和美團都屬于第一派。
阿裏此前已投資過大模型創業公司智譜 AI 、百川智能和零一萬物;美團則投資了智譜 AI,并投資和收購了光年之外。
廣撒網的公司還有騰訊和小米:騰訊去年投資了百川智能、智譜 AI 和 MiniMax 與光年之外;雷軍創立的順爲投資了百川智能、智譜 AI 和 MiniMax,其中百川、智譜 AI 也被小米投資。
百度和字節則尚未投資大模型公司。
阿裏是中國互聯網大公司中,投資大模型最激進的一家。
一位投資人稱,在阿裏、騰訊同時投資的百川和智譜 AI 中,阿裏的占股都更高。此次阿裏又參與了金額超 10 億美元的月之暗面新融資。
動作的區别來自不同的戰略意圖和堅定程度。
阿裏在 2023 年已形成了相對清晰的大模型戰略:最大目标不是靠自研模型賺錢,而是爲一衆大模型提供雲計算能力,把握成爲 AI 算力基礎設施的機會。
矽谷風投機構 a16z 的調查發現,大模型和生成式 AI 創業公司 80%-90% 的早期融資都用于向雲計算平台購買算力;a16z 估計,未來行業更成熟時,模型和應用公司每年也要把 10%-20% 的營收送給雲計算公司。相當于一筆 "AI 稅 "。
收取 AI 稅的方式之一是與有潛力的大模型公司,即 AI 算力買方深度合作:如微軟去年初承諾投資 OpenAI 100 億美元,其中大部分是以雲計算資源而非現金結算;Google 和亞馬遜也在去年承諾給 Anthropic 投資共 60 億美元,Anthropic 将在四年内花費超 30 億美元購買 Google 雲計算服務,同時也會購買亞馬遜的雲計算服務。
重金投資大模型,有助于阿裏雲繼續鞏固中國第一的市場地位和抓住 AI 計算帶來的增量。
對比阿裏,騰訊投資力度更弱,可能有兩個原因:一是雲計算業務對騰訊的重要性不如阿裏,CSIG(騰訊雲與智慧産業事業群)過去兩年一直在精簡人員;二是騰訊希望更聚焦地做好自己的混元大模型。
尚未投資大模型創業公司的百度和字節各有各的邏輯。
據百度 2023 年 Q3 财報,期末的現金及現金等價物不到 350 億元人民币,而字節同期的現金儲備超 300 億美元。
有限的資源下,百度的優先級是做好自己的大模型和相應産品。一位接近百度的人士稱,百度去年已明确了不投大模型公司,重點關注應用公司。
掌握大量可投資金的字節跳動則幾經搖擺。
據《晚點 LatePost》了解,字節在 2023 年上半年一度考慮投資大模型公司 MiniMax 和階躍星辰,但最終未出手。
2023 年年中,字節決定不再投資大模型公司,而是集中精力做好自己的大模型,這是字節抓住 AI 時代超級 App 機會的關鍵。
而就在最近,字節再次接觸頭部大模型公司,重新評估投資必要性。
背景是,字節自己開發大模型的進度沒有達到預期;阿裏的激進出手和近期暗流湧動的大模型投融資競争也帶來了一定壓力。
OpenAI 上周剛剛發布的視頻生成模型 Sora 則是一個新沖擊。
此前市場的一種觀點是,擁有抖音、TikTok 的字節和擁有 Youtube 的 Google 掌握大量視頻數據,更有優勢做出視頻多模态模型。
而 Sora 的強悍表現顯示,足夠強的大語言基礎模型可以覆蓋圖片、視頻等其它的模态能力,模型技術能力可能比數據資源更重要。
原本掌握現成内容或社交産品,進而掌握海量數據的大型互聯網科技公司都不得不重新掂量自己能否領先。" 字節現在可能有點慌,它們之前手裏沒有投資的牌。" 一位從業者說。
此次被阿裏、美團等投資的月之暗面成立于 2023 年 3 月,由清華大學交叉信息研究院助理教授楊植麟創立。
今年 32 歲的楊植麟本科畢業于清華大學計算機科學與技術系,後在卡内基梅隆大學語言技術研究所(LTI)攻讀博士。這期間,他作爲第一作者發表了 Transformer-XL 和 XLNet;前者是首個全面超越 RNN 的注意力語言模型,後者則在 20 項任務上超越了 Google BERT 模型。楊植麟本人學術引用量自 2019 年起已超 2 萬餘次。
接近楊植麟的多位投資人評價他:罕見地聰明,成長速度驚人。月之暗面的特色是聚焦中文、長文本以及 To C 産品驅動。在 2023 年 10 月,月之暗面發布的首個模型 Moonshot 和智能助手 Kimi 能支持 20 萬漢字的輸入,是 Anthropic 的 Claude 2 -100k(約 8 萬字)的 2.5 倍,OpenAI 的 GPT-4-32 K(約 2.5 萬字)的 8 倍。
一位 AI 從業者稱,在去年下半年這個時間點,月之暗面也是中國頭部大模型公司裏投資性價比相對高的一家:它在去年 10 月的 20 億元人民币 A 輪融資後,估值約爲 8 億美元,低于當時估值已接近 20 億美元的 MiniMax 和智譜 AI 以及已是獨角獸的百川智能。
單輪 10 億美元的融資,往往不會發生在一個行業的早期。即使是融資繁榮的上一波 AI 熱潮中,商湯累計融到 10 億美元也用了 4 年,曠視用了約 7 年,而月之暗面剛剛成立 11 個月。
反常的投入力度背後是超常的大機會和投資者的超高期待。阿裏、美團等此次對月之暗面的 B 輪投資,可能會如一顆火星那樣引爆早已彌漫的 FOMO(Fear of Missing Out,害怕錯過)粉塵。