文 | 光子星球
19 世紀中後期,貪婪的歐洲各國對古老而又原始的非洲垂涎三尺,一擁而上将其瓜分殆盡。
120 多年後,冉冉升起的 AI 新星也逐漸走入了雲廠商精心設計好的 " 陷阱 "。
故事的開頭很美好,一方慷慨大方奉上錢和算力;另一方感激涕零,做出來的 "ChatGPT" 式的新貌震驚四座。然而,當初的山盟海誓轉瞬即逝,嫌隙漸生,回過神來的 AI 公司才發現,歸來已是一身負債。
截至目前,世界上主要的雲廠商已通過合作、投資的方式與 AI 公司綁定 CP。國外,微軟與 OpenAI,亞馬遜與 Anthropic。國内,阿裏獨坐莊家,提前鎖定了智譜、月暗、零一萬物、Minimax,行業内的 "AI 五小虎 "。
OpenAI 最新 66 億美元融資注定會成爲一個分水嶺。新一輪融資關閉後,OpenAI 進一步公布了财務模型和利潤規劃表,這相當于宣告了大模型的盈利時刻," 還債 " 指日可待。
環伺在 OpenAI 周圍的微軟與 VC 們已經開始蠢蠢欲動,尾随其後的亞馬遜、谷歌也盯上了各自的獵物。
回到中國,操作簡單粗暴,對照 OpenAI 打打折,也給 AI 六小虎(指智譜、月暗、零一萬物、Minimax、階躍星辰)能賺多少錢估個預期,制定個 deadline。
或許是預感到了即将到來的壓力,近期的 AI 公司相繼呈現出了收縮的趨勢," 開源節流 " 逐漸成爲後期的主線任務。
根據國内外 AI 公司所簽訂的協議,一(雲)對多(模型)的代理人機制下,模型公司淪爲了雲廠商的 " 打工機器 "。既要支付算力賬單,爲其年終業績賬單記上一筆。待未來盈利,還要按照投資股份所占比例,被瓜分利潤。
大模型公司焦慮彌漫,競争内卷,背後隐藏的莊家漁翁得利。投遍 AI 潛力股的阿裏雲、騰訊雲這回要 " 躺着 " 賺錢了。
雲,大模型的 " 信用卡 "
雲計算,是大模型時代堪比黃金的 " 硬通貨 "。
OpenAI 與微軟的百億美元 " 聯姻 " 一度是 AI 圈的佳話,不過,據外媒報道,截至去年 9 月,OpenAI 僅收到 " 一小部分 "。其中 " 很大部分資金 " 用以購買雲服務資源,而非現金形式支付。
在國内,阿裏也借鑒了微軟的投資方式,并在其基礎上靈活改造。同樣用雲給 AI 五虎 " 刷卡 ",預支使用雲的 " 信用額度 ",比如投資月暗的 8 億美元中,雲的信用額度就占了近一半。在此基礎上,阿裏的投資未直接轉給 AI 公司,而是被存放在一個代管賬戶,所劃掉的雲額度可重新計入其收入。
由此,雲其實承擔了兩重角色。初期,得益于算力和大模型的依賴性關系,雲成爲了叩開大模型投資的砝碼。後期,雲成爲了 " 提款機 ",源源不斷地從 AI 公司方支取利潤。
收益主要來自兩部分,一部分是對雲的消耗,AI 公司從模型訓練到後期 API 調用,都會在信用卡上劃一筆,計入到雲廠商的 AI 收入中。典型如微軟與 OpenAI 的關系,GPT 模型訓練和 ChatGPT 産品運行都在微軟雲上,通過 Azure 向客戶提供的 ChatGPT 相關服務也需再次計費。
即使是大模型上雲産生的收入,很大一部分也流入了雲廠商的口袋裏。國外有調查顯示,當客戶在亞馬遜 Bedrock 調用 Claude,或在微軟 Azure 調用 GPT 時,每支付一美元推理費用,約有超過 50% 的收入支付給了雲服務提供商,用以支付基礎設施成本和毛利潤分成。
實際反映到收入上,阿裏更有說服力,畢竟國内一半以上的大模型公司都上了阿裏雲。财報顯示,2024 财年第三季度,阿裏雲營收 280.66 億元,增長 3%,經調整 EBITA 利潤增長 86% 至 23.64 億元。可以看出,即使是短期内,AI" 大戶 " 們的消耗對雲廠商也産生了正向拉動效果。
對此種現狀,雲廠商們半夜躺着都能笑開花,但這可愁壞了 AI 公司。算力額度雖是剛需,但更像 " 空頭支票 ",日常經營、各項成本開支還得靠賬上的流動資金,也難怪 OpenAI 在最近一輪融資前三令五申," 至少支付 2.5 億美元現金 "。
另一部分則是參與 AI 公司的利潤分配。據最新消息,OpenAI 未來的利潤分配主要分爲三層,第一、二層都用于償還給投資者和微軟,等到分配完畢,才能真正屬于 OpenAI 公司。包括 OpenAI 在内的 AI 公司處境一目了然:欲談獨立,先還債。
在國内,雲廠商的話語權更大,特别是阿裏,信用卡漫天撒,終于熬到了 " 讨債 " 階段。相比于 OpenAI,此類絕對頭部的大模型公司,中國 AI 六小虎的生存環境更爲艱難,如何産生收入是關鍵問題。
在國外,已經分化出了兩條道路,向左 To C,代表是 OpenAI;向右 To B,代表是 Anthropic。從雲廠商中 " 虎口奪食 " 需具備前提,即基本模型和産品能力要顯著超越雲大廠。OpenAI 之于微軟,Anthropic 之于亞馬遜皆是如此。以此來審視國内,該前提基本不成立。到現在爲止,雙方未能拉開明顯差距,反而大廠在流量、生态、客戶市場等方面更勝一籌。
AI 公司在雲廠商面前更顯弱勢," 綁定 " 有程度深淺之分。如果隻是透支未來算力而産生費用,總有還完債的一天。但是,雲廠商并不甘于此,有的在雲上又加築了一層 " 專供芯片 ",有的用客戶綁定,有的買斷技術未來。還有許多中間地帶,例如雲廠商對模型的訪問權,用戶數據的所有權等等。
大模型的最佳 " 賞味期 "
現階段,雲生态的鎖定價值大于通用模型本身,這一事實放之國内外皆成立。" 雲 + 大模型 " 本質上在給雲做加法,做厚雲的價值。而單一大模型具有 " 賞味期 ",一旦過了最佳食用期,其價值就會大打折扣。
從去年到現在,整個行業無時無刻不在變化之中,大模型英雄榜随時被揭," 史上最強模型 " 稱号以月爲單位易主。GPT 系列模型從最初的 3.5 進化到了如今的 o1,其競争對手 Claude 系列模型也一路追趕到了 3.5 Sonnet。
盡管這屬于正常的技術叠代路徑,但從模型使用角度來看,新模型使用頻率最高的一定是剛發布的幾個月,後面總會有更強性能的模型替代。比如在編程這一領域,後來居上的 Claude 模型打敗了 GPT-4,成爲了更多編程軟件的選擇。随着時間的推移,我們清楚地看到,模型本身的價值在不斷降低。
此前,行業内曾讨論過 " 大模型是否能成爲商品 " 這一話題。到現在爲止,似乎沒有看到确定性的答案。
通用大模型被集成的趨勢正在加強,一部分被雲廠商集成,一部分被應用産品集成,多模切換調用越來越被采納。光子星球也注意到,國内很多創業公司在運用該技巧,提前測試各家模型的免費額度,在産品運行時及時切換來降低成本。當然,還存在另一種情況,根據用戶調用不同功能來切換模型。
在沒有哪家大模型可以獨霸天下的情況下,雲與大模型融合能夠加快産品化進程。衆所周知,GitHub 雖然是最大開源社區之一,但由于 " 被微軟收購 " 這層關系,也被迫與 "Azure+GPT" 生态進行了綁定。其中,GitHub Copilot 直接采用了 GPT 模型。盡管 GitHub 也推出了相關模型産品,允許支持 OpenAI 之外的模型,但僅限與微軟生态不産生直接競争的模型,生态自帶的排外性不言而喻。
由雲到大模型再到産品,雲廠商的觸角在不斷延伸。大模型公司爲雲廠商生态做 " 嫁衣 ",即使處于最佳 " 賞味期 " 也能無延遲地享用最強性能大模型。此外,繞過 OpenAI 們的收費牆,在生态系統應用中也能嘗鮮部分功能。
在國内,雲大廠的 " 藩籬意識 " 更強,AI 公司幾乎難以觸達到他們生态體系中的産品。就算是以 API 形式輸出,雲廠商也是極其吝啬。這既有競品存在的顧忌,也有出于數據安全的考慮。藩籬之内,雲廠商通過自建模型完成了産品升級。藩籬之外,才能存在站台、共同服務客戶、投資等友好形式。
雲廠商的領地主義,間接地爲 AI 六小虎關上了生态入口。他們無法像 OpenAI 一樣,在擁有規模化的用戶數量和成熟的産品中獲得曝光、反饋。于是,自建入口和主動試探藩籬邊界成爲了不得已而爲之。
新的價值
" 雲 + 大模型 " 的組合并非無懈可擊,MaaS 所提供的仍然是标準化的服務,相當于提供了統一的錘子、釘子套裝,怎麽錘、釘在哪裏取決于使用工具方的能力。能力越強、經驗越豐富的人運行大模型的效果自然越強,這就解釋了,阿裏、百度等廠商爲什麽花費大力氣去打造大模型行業标杆。
雲、大模型到應用存在着巨大的溝壑。To B 靠多對一的個性化解決方案來填補,To C 目前還處于拓荒階段。引用近期紅杉報告的一句話,在雲和大模型之外,新的價值誕生于 " 将模型的原始能力轉化爲引人入勝、可靠的端到端的商業解決方案 ",這需要大量工程化工作。
不可否認,大模型殺死了部分應用,持續升級的能力覆蓋掉了創業公司的項目,以至于很多人強調 " 要站在 OpenAI 射程外 "。多數情況下,行業中不是缺乏最強的模型,而是沒能釋放模型的最強能力。
AI 編程應用 Cursor 的大火一定程度上說明了開發模型能力的重要性。如同上述所言,Cursor 的思路不是提供趁手的工具,而是代替用戶去試錯,基于對代碼編輯、處理速度、處理數量、長上下文本等能力要求,在測試完了市面上前沿模型後,找到了最匹配的模型 Claude Sonnet。
Cursor 在采訪中強調了一點,可能是當下過分追求模型性能群體所忽視的問題," 最好的不一定是最适合的 "。在 Sonnet 之後,他們也在第一時間測試了 OpenAI 的 o1 模型,得出的結論是," 推理能力很強,在某些問題上可以做得很好,但仍比不上 Sonnet"。
這從側面回答了一個問題:當擁有了最厲害的模型後,爲什麽還沒有誕生 Killer App?面對大模型,以前創業公司的課題是做選擇,而現在變成了做優化組合。
或許,到了現在的時間節點,大模型行業才真正進入到了 " 應用誕生時刻 "。