OpenAI 的開發者日活動後,GPTs 模式引發了新一輪的 AI 熱潮,開發者調用過分火爆,甚至導緻 OpenAI 服務器一度宕機。随後,花式把玩 GPTs 的經驗,以及圍繞這種新形态的巨大争議開始湧現。中國的 IT 從業者、軟件開發者與 AI 工程師也積極參與讨論,迎來了一場新的 AI 狂歡。
但在這種氛圍下,卻有一種沉默顯得像個顯眼包。那就是絕大多數大模型公司,似乎都沉默了。爲了模仿類 GPT 的大模型,中國 AI 圈用了一年時間,雨後春筍般打造了上百個大模型。但其中能夠誕生明星應用,能夠推動産品創新,甚至能夠擁有規模化用戶的似乎都寥寥無幾。當 OpenAI 的飛輪效應顯現,這些大模型公司就有種越是模仿差距越大的感覺。于是幹脆不去追新的熱點,埋頭把眼前能做的先做完。
記得今年年初的時候,社交網絡和媒體都在讨論中國能否有大模型?
當時我們說過,這其實是個僞命題,因爲中國早就有大模型。而在 ChatGPT 爆火之後,中國 AI 遇到的問題一定不是大模型太少,而是大模型過剩。
今天,這種問題開始浮現了出來。此刻中國 AI 行業最大的問題,就是大模型太多,而且還挺亂。
摩肩接踵的大模型
中國到底有多少 AI 大模型?經過一年的井噴式發展,這已經變成了一筆糊塗賬。上半年的時候,答案大概是幾十個。時間來到 11 月,有人說是一百多個,有人說是二百多個。總之,中國此刻必然是全世界擁有大模型最多的國家,遠遠超過美國。
但是,這一百多個大模型有人用過嗎?有人對比、評測過嗎?恐怕沒有。因爲除了幾個頭部大模型形成了用戶規模外,其中大部分存在于開源社區,還有一部分隻存在通稿裏。
這就像什麽呢?其實很多人不知道,根據相關數據,中國有 2600 萬足球人口,同樣居世界第一。我們無從考證數據從何而來,反正周圍踢足球的人看着是不多,而國足的成績有目共睹。
爲什麽會出現這麽多大模型呢?
首先是今年大模型賽道好,機會難得。雖然科技闆塊的 VC 市場非常低迷,但在其他互聯網創投項目普遍失效,虛拟貨币被嚴格限制的情況下,AI 大模型成爲今年近乎唯一的故事。因此即便熱錢不多,但還是集中湧向了大模型創業。
其次,與很多人設想的不同,大模型創業并沒有真正意義上的高門檻。一旦以股權、期權等方式吸引到了合适的人才,大模型創業公司過多的費用支出。相比于其他科技領域有産品研發、用戶推廣、硬件化等燒錢選項,在擁有大量開放數據集、免費工具的情況下,僅僅是訓練大模型并沒有過高的成本門檻,并且所謂大模型項目,往往一個科研團隊就可以支撐,不需要像互聯網創業公司搭建較爲複雜的業務體系。
此外,還有一種 " 刷業績 " 式的大模型,極大程度增加了大模型數量。這種一般是高校、科研機構相關團隊,選報大模型方面課題更容易獲得立項。其結項結果發布後,大模型數量就又增加了一個。或者是大型企業上級要求做大模型,于是 IT 部門會根據開源的模型框架搭建一個出來,即使效果不佳,落地困難,也要進行對内對外宣傳。
賽道好、成本低、需要完成任務,這幾種動力,導緻中國大模型越來越多,且産生效率越來越快。
但問題在于,足球人口規模可能确實很重要,但更重要的是有一支能踢進世界杯的球隊。
沒有希望的窄賽道
那麽有人或許要問了。大模型數量說難道不能成爲優勢嗎?我們靠數量出奇迹,說不定數量一多就能選出拔尖的來?
這恐怕并不現實。因爲從種種理由來看,今天龐大的大模型規模,都是不可能持續存在。通稿打造類 GPT 模型而擠入下一個科技時代的美好想法,已經将 AI 大模型變成了一條沒有希望的窄賽道。
我們可以來正視這樣幾個問題:
1. 大模型的數量多,其實和大模型本質背道而馳。
提起大模型,我們會說它的優點是模型的泛化性、高魯棒性,繼而帶來了 " 智能湧現 " 效果。我們總是驚歎 OpenAI 的成績,就是因爲 GPT 系列始終在深度挖掘模型的泛化性。也就是說,大模型的優勢就是一個頂一群,用一個模型代替一堆模型,結果反而出現了數量過剩的大模型,這與大模型初衷南轅北轍,并且浪費了海量的社會資源。
2. 大模型是底層技術,底層技術的玩家不可能很多。
僅僅以 AI 開發爲例,模型之上還有 AI 芯片、AI 框架。在過去幾年,這些領域也有很多廠商布局,但最後大多不了了之。AI 芯片無法出貨,AI 框架無人問津,能夠剩下的隻有頭部一兩家而已。大模型也是同樣的道理,這是一個注定洗牌到存量很少的賽道。
3. 大模型,距離開發者很遠。
絕大多數初創大模型,都會選擇開源吸引開發者的模式。但現實情況是,這些模型無論是與國外開源大模型,還是國内頭部大模型相比,都沒有實際競争力,無法形成規模化的開發者聚合效應。這些大模型普遍是開源時大力宣傳一波吸引關注,但開發者實際體驗後馬上遇冷。
4. 大模型,距離用戶很遠。
在可見的場景中,絕大多數大模型都缺乏商業化支撐,是這個賽道最大的問題。對應大模型創業型企業來說,一開局就是最艱難的局面。後來廣受诟病的機器視覺公司,在開局階段還有智能安防市場作爲支撐。但大模型公司擁有的隻是算法,甚至連一條可行的商業化通道都找不到。
這些問題,導緻堆積了巨大數量的大模型賽道開始變得并不美好。它今天的情況是,說算法,各個創新;說參數,各個龐大;說調用,根本沒人用;說商業,根本沒去想。
模型一多,亂象也多
大模型一多,産業賽道開始熱絡起來,也必不可免出現一些問題。這就是我們說的,大模型不僅有點多,還有點亂。
由于目前階段,有一股 " 大模型用不用不重要,先要擁有大模型 " 的思潮。因此就開始有各種方式降低大模型的開發成本,通過話術誇大價值,甚至硬蹭大模型熱度,把不是大模型技術的項目包裝成大模型,進而導緻大模型圈子裏,開始出現良莠不齊、魚龍混雜的态勢,我們可以列舉其中的幾種:
1. 打榜刷分型大模型。由于大模型數量龐大,且實現思路基本一緻,這就導緻不同公司之間的差異化微乎其微。而爲了凸顯自己的差異化與領先性,目前通用方式是硬造一個技術術語,然後宣傳通過這項技術自身項目刷新了某榜單紀錄,在某測試中跑出了多少分。
事實上,大部分榜單都隻測試模型的某個維度,可以進行針對性調參。打榜刷分并不難,且有比較大的操作空間。類似的,社區開發者打多少顆星,發了多少篇頂會,也都是慣用的包裝方案。
2. 結項爲主型大模型。有很多用作課題結項,或者企業數字化成果結項的大模型。評審結束,結項成功,開源開放,這三條做到就是它們的生命終點。這類大模型不考慮應用場景與後續更新,有某種朝生夕死的精神特質。
3. 動辄開源型大模型。軟件開源當然是大勢所趨,但随着這幾年中國開源事業的興旺發展,AI 模型開源似乎變成了某種 " 時尚 "。加上一些企業更願意将大模型的開源與免費作爲流量聚攏工具。開源,逐漸成爲了低質量、低維護大模型的遮羞布。
4. 冒名頂替型大模型。大模型火了之後,開始有公司打起了蹭熱點的主意。于是,用并非标準預訓練大模型技術冒充大模型,甚至幹脆把古早的對話機器人、應用軟件包裝成大模型的案例屢見不鮮。用大模型的瓶子,裝其他老酒,也成爲了一門生意。
5. 套殼變身型大模型。最近,一些創業公司套殼國外開源模型的事件引起争議。其實業界類似手法并不少見,将開源大模型進行改寫和包裝,搖身一變,成爲自研大模型的例子非常多。
這些大模型隊伍裏的妖魔鬼怪,也紛紛可以通過發明術語、加強定語的方式,來宣傳自己的創新能力和差異化。最終導緻把真正的技術創新,淹沒在了一系列的 " 僞裝創新 " 當中。
中國 AI 之春
在去掉 90% 的大模型之後
如果我們看美國的大模型産業結構,會發現它處在一個每層數量差異不大的金字塔結構裏。即 OpenAI 一家獨大,谷歌、微軟、Meta、X 保持持續競争力,此外還有 20 幾個較爲常用,開發者群落比較活躍的大模型。
當然咱們不是說一定要照搬美國,但從中大概可以看見一個科技大國,在目前情況下大模型産業體量是什麽。
中國大模型,已經在短時間内發展出了遠遠超過本身應有存量的大模型。數量過于龐大的大模型,一方面浪費了極大的研發、算力,以及數據資源;另一方面也蘊藏了一場并不會太久的 " 危機 "。
在資本泡沫相對冷卻之後,我們很容易看到這樣的情況:忽然之間,衆多大模型開始停止更新,緊接着大模型領域的公司大量倒閉。伴随着資本退場,員工待遇下降等問題開始發生,于是媒體開始唱衰大模型寒冬,社交媒體上開始冷嘲熱諷 AI 這門技術。
這種行業猛然轉冷,大概率會給真正具有競争力、創新能力的中國 AI 企業帶來巨大的麻煩。
但是請記住,這并不是 AI 不行了,而是這些 AI 公司和大模型項目本來就不行。
這不是 AI 寒冬,而是中國 AI 的春天剛剛要真正開始。産業優化重組後的大模型産業形态,才是真正能發揮出中國在應用創新、産品打磨、産業智能化落地等領域的優勢。
在中國,相對良性的大模型産業形态,應該是有 5 家左右可以互相競争的主流大模型,1 到 2 個能夠進行底層技術創新,保持全球競争力的大模型體系,同時有一系列開源大模型作爲補充,以及一些學術領域的大模型作爲 AI for sience 的支撐。此外,還要具備較爲完善的大模型配套設施,包括 AI 芯片、AI 計算、深度學習開發框架、AI 開發工具,并且這些領域都有較高的自主化程度。換言之,必須要淘汰今天超過 90% 的大模型。
在這些底層軟硬件基礎之上,應該有大量創業公司、AI 開發者去探索 C 端和 B 端的大模型落地。在大模型與行業結合的垂直領域,組成推廣和複制行業大模型的産業生态;在主要的 C 端市場,比如大模型 + 辦公、大模型 + 娛樂、大模型 + 信息獲取方面,湧入成千上萬家公司,形成互聯網經濟之後的 AI 經濟奇迹。
而從 " 百模大戰 " 中能夠留到那時的隻有三種公司:具備核心技術創新的、形成平台型産業鏈的以及能夠快速找到商業出口,形成正向資金循環的。
我們依舊笃信,有一天 AI 技術上會出現新的抖音、微信、office,甚至更多此前無法想象的東西。
但今天絕大多數的大模型,結局恐怕隻能是躺在曆史空隙與開源平台上,成爲大時代的小腳注。