AI 大模型競賽愈發白熱化,下半場将聚焦推理與數據。
2 月 23 日,馬斯克點贊了一條關于 AI 模型競争路線的分析,他稱贊道 " 分析得很好 ",值得一提的是,上周馬斯克旗下 xAI 正式發布 Grok 3 大模型。

這篇推文是由 Gavin Baker 發布,他在文章中表示,AI 産業格局的變革正在加速,OpenAI 的先發優勢消退,微軟也選擇後撤一步。
Gavin 還預計,未來數據成爲競争核心,無法獲得獨特、有價值數據的前沿模型是曆史上貶值最快的資産。Meta 等巨頭通過數據壟斷和算力規模構建護城河,而中小玩家聚焦差異化部署和成本優化。
不過,Gavin 仍看好 xAI 和 OpenAI,他表示,如果 OpenAI 在 5 年後仍然是該領域的領導者,那可能是因爲先發優勢和規模優勢,以及産品影響力。
OpenAI 的先發優勢消退,微軟也選擇後撤一步
Gavin 在推文中指出:
當 ChatGPT 在 2022 年 11 月橫空出世時,OpenAI 通過激進押注 Scaling Law,在生成式 AI 領域建立了長達 7 個季度的統治地位。但這一優勢窗口正在關閉:Google 的 Gemini、xAI 的 Grok-3,以及 Deepseek 的最新模型,均已達到與 GPT-4 相近的技術水平。
就連 OpenAI 創始人 Altman 也指出,OpenAI 未來的領先優勢将更加狹窄;微軟 CEO 納德拉基本上表示,他們在模型能力方面領先的獨特時期即将結束。

據 The Information 此前報道,微軟内部備忘錄顯示,由于預訓練邊際效益遞減,原計劃投入 160 億美元升級預訓練基礎設施的方案已被叫停,微軟轉而專注于爲 OpenAI 提供推理以獲取收益。
納德拉也在此前的播客節目中表示,數據中心可能建設過剩,租賃優于自建,微軟甚至可能會使用開源模型來支持 CoPilot。Gavin 認爲,這些預示着單純依靠參數擴張建立壁壘的 " 預訓練時代 " 已走向終結。
獨家數據資源成爲護城河
Gavin 認爲,當模型架構趨同,獨家數據資源成爲護城河。
Gavin 在推文中表示:
我多次轉述 EricVishria 的話,無法獲得獨特、有價值數據的前沿模型是史上貶值最快的資産,而蒸餾隻會放大這一點。
如果未來前沿模型無法訪問 YouTube、X、TeslaVision、Instagram 和 Facebook 等獨特而有價值的數據,則可能沒有任何投資回報率。
從這個角度來看,紮克伯格的策略似乎也要明智得多。獨特的數據可能最終成爲預訓練數萬億或千萬億參數模型差異化和 ROI 的唯一基礎。
這解釋了爲何紮克伯格将 Meta 的 AI 戰略錨定在社交數據閉環,據媒體此前報道,Instagram 用戶的圖像标注數據,使 Meta 的多模态模型訓練效率提升 40%。
巨型數據中心隻需 2-3 個,推理所需算力占 95%
這一變化也将帶來 AI 基礎設施格局的颠覆性變化,Gavin 預計,
預訓練算力:需超大規模集群(10 萬卡級),但參與者将縮減至 2-3 家,技術堆棧追求極緻性能(液冷、核能供電),這一中心堪比 " 法拉利 " 級超算中心。
推理算力:較小的 6-10 家數據中心,分布式、低成本架構主導,地理就近部署與能效比成關鍵,使用風 / 光能源,基于量化壓縮技術(如 Deepseek R1 的 1-bit LLM)支撐低成本推理,是 " 本田 " 級邊緣節點。
Gavin 強調,推理模型是極其計算密集型的,具備強大的計算能力,模型才能高效地完成推理任務。但與之前那種預訓練和推理階段計算資源分配大緻各占一半的情況不同,現在會變成預訓練占 5%,推理階段占 95%。卓越的基礎設施将至關重要。
整體來看,未來 AI 行業可能呈現 " 預訓練集中化,推理去中心化 " 的兩極格局,數據成爲權力核心,巨頭通過數據壟斷和算力規模構建護城河,而中小玩家聚焦差異化部署和成本優化。