圖片來源 @視覺中國
文 | 腦極體
一張名爲《大模型的深淵》的圖,在去年廣爲流行。吃瓜群衆驚詫地發現,原來絕大多數大模型,都擠在深不見底的層級 ," 宣稱自己快要落地的 "" 再等等決定啥時候落地的 "" 什麽落地不落地的 "" 怎麽還有這麽多沒聽說過的大模型啊 " ……
時至今日,國産大模型數量已經達到 200 多個," 深淵 " 更深。
其中,很多低水平重複造輪子的大模型,無法滿足個人和産業的使用需求,發布之後無人問津,已經不可能在業内翻起什麽波瀾了。而那些真正具備技術價值和商業價值的大模型,也如同 " 潛龍在淵 ",逐漸顯露出 " 一飛沖天 " 的苗頭。
上一波 2015 年左右開始的 AI 創業浪潮,以 CV 計算機視覺技術爲主導的初創企業中,号稱 "CV 四小天鵝 " 的商湯科技、曠視科技、雲從科技、依圖科技,也被譽爲中國的 "AI 四小龍 ",成爲那一個 AI 繁榮周期中的标志性創新企業。
那麽,由大模型開啓的新一輪繁榮周期中,自然也會有 " 潛龍在淵 "。誰會成爲類似 "AI 四小龍 " 這樣的潛力股呢?答案基本藏在這三個梯隊裏。
大模型 " 四小龍 " 的一鱗半爪
業内流傳一句話:小創新靠大廠,大創新靠小廠。從昔日的 DeepMind 到去年的 OpenAI,這些年輕、新銳的技術團隊,回歸創新本源,一次又一次給業界帶來颠覆性的變化,成爲從業者和投資人眼中的 " 潛力股 "。
所謂大模型的 " 潛龍 ",有兩個基本條件:
一是 " 潛 ",相比谷歌、微軟、英偉達、百度、騰訊、阿裏等科技巨頭,成立時間更短、隊伍更加年輕化,組織效率和靈活度更高。
二是 " 龍 ",有着不輸給大廠,甚至超越大廠的技術創新性,基礎模型是自研的,并且是 L0 級的通用大模型,可以爲行業大模型、垂類大模型提供底座,具備向多個産業轉化的潛力,有望帶來高增長和高投資回報率。
雖然機器視覺公司也都推出了大模型,技術實力不俗,但并不算是 AI 新面孔。而使用開源 LLaMA 架構的零一萬物,以及被大廠收購不再獨立競争的光年之外,雖然夠 " 新 ",但發展遇到較大的轉折點。所以這些企業及其大模型,我們就不放在此次讨論。
總體來說,有三類大模型企業,目前都得到了國内外知名投資機構或行業客戶的支持,擁有較高的技術認可度與商業轉化潛力,可以被看作是 " 大模型四小龍 " 的預備役。
1. 明星派
明星創始團隊,具備在工業界或學術界的知名度和影響力,打造的大模型一出世,便憑借 " 明星效應 ",備受業界關注。
包括,由前搜狗公司 CEO 王小川創立的百川智能(2023 年 3 月,擁有多種參數的 Baichuan 系列大模型);由前商湯研究院副院長闫俊傑創立的 Minimax(2021 年 12 月,擁有 ABAB 大模型);由中國最早從事中英機器翻譯領域的研究者之一、2023 年 ACL Fellow 周明博士創辦的 Langboat 瀾舟科技(2021 年 6 月,擁有通用大模型孟子)。
2. 技術流
相比 " 明星效應 ",技術流更強調技術實力,其中典型代表是智譜 AI。作爲一家清華系初創公司,智譜 AI 在 2019 年成立時就把 OpenAI 當作對标,将實現 AGI 通用智能作爲目标,是中國最早啓動預訓練模型研發的科技公司之一。智譜 AI 最新發布的基座大模型 GLM-4,在一系列評測中的表現也被認爲逼近了 OpenAI 的 GPT-4。
3. 務實派
被寄予厚望的明星派、技術流,都是 " 高高在上 " 的,從業務 / 商業土壤上生長出來的務實派大模型,也可能憑借落地應用而闖出一條路。比如 2023 年問世的 " 天工 " 大模型,由昆侖萬維自主研發,大模型 AIGC 與昆侖萬維的搜索、遊戲、社交、娛樂等業務的結合,快速進入應用周期,也讓昆侖萬維成爲闖入大模型領域的一匹黑馬。
需要說明一下,三個類别是看 " 最長闆 ",并不意味着其他賽道的能力不高。
擁有明星創始團隊的大模型,性能也可能并不遜色于技術流;擁有強大基座模型的技術流,也可能牽起強悍的運營隊伍,帶動産品落地;而務實派是 " 根據釘子造錘子 ",但錘子要是不夠硬,啥也砸不下去,所以技術能力也得過硬。
凝視大模型的 " 商業化 " 深淵
對标 "AI 四小龍 ",可能并不讓大模型企業很高興,反而是憂慮更多。
以計算機視覺爲核心的 "AI 四小龍 " 前期融資能力很強,但普遍遭遇了商業化的艱難探索,面臨盈利難、市值下降等困擾。而大模型的落地 " 深淵 ",背後是更加漫長的商業化之路。
但是,逃避、諱莫如深,是無法打消投資人、市場和用戶的顧慮的。無論大模型企業是否願意凝視深淵,深淵一直都在凝視着大模型。
直面大模型的 " 商業化 " 深淵,相比上一輪 AI,有三新一舊:
三新:新環境、新規模、新要求。
簡單來說,大模型企業面臨着更加嚴苛的融資環境,随着全球流動性衰減,科技企業的高估值都很難保持,龐大如谷歌都在裁員 " 降本增效 ",融資難度更大了,比如智譜 AI 的融資水平就明顯不及當年的商湯科技。
同時,大模型又是一個重投入的行業,基座模型的技術競賽,還遠遠沒到終結的時候,持續向上探索意味着長期燒錢,需要的資金規模更大。而吸取了上一輪 AI 投融資經驗的投資人,面對大模型也格外冷靜,對初創企業的自身造血盈利能力提出了更高的要求。
一舊:AI 标品化依舊很難。
南橘北枳,在中國做 AI,照搬 OpenAI 是絕對不行的,要看到鐵一般的事實:中國 toC 市場對 AI 等軟件産品的付費意願不高,監管嚴格,很難做,真要做也要配備龐大的團隊去确保安全合規,投入并不小。
toB 市場也有很大的差異,國内企業大多不信任 SaaS 模式,更傾向于私有化部署,行業市場分散,中小客戶衆多,需求紛繁複雜,高薪的算法工程師到一線做一個幾十萬的項目很常見。
至于 toG 市場,智能化項目競争激烈,而且事多錢少利潤薄,上一輪機器視覺公司基本在做自動駕駛、智慧城市、安防等業務,都掙的是辛苦錢。一般來說,CV 計算機視覺類項目費用,是比 NLP 自然語言處理類高的,所以大語言模型想要靠項目制獲得高客單價,也是很困難的。
究其原因,ToB/ToG 市場的 AI 項目,大多以解決方案式落地,政企機構更希望打包式引入 AI、雲、IoT 等軟硬件,針對自身打造定制化方案,AI 産品無法以标準化、模塊化的形式快速交付,前期要投入很高的成本。
從這個角度看,整體投入更大、單個項目收益更小,大模型的商業化挑戰,比上一波機器視覺公司更嚴峻。
那麽," 大模型四小龍 ",會重蹈覆轍嗎?
龍躍于淵,大模型盈利出路在哪裏?
悟已往之不谏,知來者之可追。面對 AI 商業化難題,也不必悲觀,事實上,我們看到大模型 " 四小龍 " 預備役們,大多能開始吸取經驗開新局。我們也發現了一些共同點:
共同點一:降本,但不 " 增笑 "。
對内 " 節流 ",提高人效。相比上一輪 AI 創業熱潮中 " 高薪挖算法 / 科學家 ",這些大模型 " 潛龍 " 從一開始就會注重 " 人效比 "。
此前科技行業的高流動性、高估值,也催生了 " 獨角獸 " 們随意擴張,反而造成了大量的低效現象,比如矽谷 " 神員工 " 精通各種編程語言,原來是把工作外包給多個中國工程師,幾年都沒被發現。這種環境也導緻創新大幅度收縮,初創企業招人成本奇高。
而這波大模型創業熱潮中,企業對于人員擴張都是比較謹慎的。周明曾對媒體說過,開始創業時團隊隻有他自己,後來擴展到 5 個人,慢慢開始訓練模型,以一個 " 輕量化 " 的團隊做出的孟子模型,未來應該長期穩定在百人的規模。百川智能、智譜 AI 也是類似的思路。
對外降本,提升大模型企業的盈利潛力。幫助企業和用戶 " 節流 ",降低應用大模型的成本。很多客戶的痛點是,用大模型的成本壓力很大,希望大小模型結合,來提高投入産出比。比如百川、智譜 AI 都推出了多種參數的大模型,來綜合不同需求。
共同點二:聚焦 toB,重視現金流。
這些大模型企業從一開始就聚焦在 toB 市場,智譜 AI 的 CEO 張鵬、瀾舟科技創始人周明都曾明确表示過,優先發展 toB 企業服務業務。
從數字化到智能化,傳統 AI 廠商需要從零開始做用戶教育,去講述 AI 技術降本增效的價值。與之相比,大模型的認知度和接納度,都是非常高的。各行各業對生産力的渴求、對應用 AI 的共識,都非常充沛。這給大模型企業帶來了非常好的增長基礎。
百煉智能發布的《大模型招标需求分析簡報(2023 年 1 月 -11 月 ) 》顯示,7 月起,随着國内 130 個大模型相繼問世,大模型招标需求量開始呈現明顯上升趨勢。11 月迎來增長高峰,需求量較前月翻至近 3 倍。其中選擇投入 10 萬 -50 萬預算進行小規模嘗試的企業最多,同時也有不少以國央企爲代表的企業開始釋放百萬級項目預算。
如前所說,toB 的錢也未必好賺。企業客戶雖然付費意願比 C 端用戶高,但 toC 應用可以标品化、大規模地吸引用戶付費,而 toB 智能化項目卻需要定制化,投入更大。此前機器視覺公司也曾想将 AI 模型跨場景、泛化應用,但發現現實世界的商業模式依然是強定制,成本居高不下。
這個問題,在大模型創業者中有比較廣泛的共識,也都在積極探索解法。百川智能 CEO 王小川曾對媒體透露,要突破 toB 定制化問題,通過可配置、可調整的搜索增強知識庫,以産品化的方式,通過不同的産品組合,來解決客戶的定制化需求。
共同點三:廣交朋友,積極開源。
" 定制化 " 之所以成爲企業的天然需求,一個主要原因是 AI 落地業務場景,是從零開始的,AI 要和業務一起磨合才能發揮作用,很多場景是無法用一個通用産品來解決的。智能化是一門長期的慢生意,是離不開生态合作夥伴,去深入行業,做大量定制化工作的。
這些年,我們團隊實地走訪了不少 AI+ 工廠、AI+ 養豬、AI+ 巡檢、AI+ 煤礦、AI+ 碼頭等智能化項目,最常見的一個場景就是:AI 企業的科學家、算法工程師、産品運營人員、項目經理等各色人等,有的在田間地頭碼頭倉庫,一待就是幾個月,去了解基層人員的工作需求,去從頭設計作業流程。
而智能化往往也伴随着 " 去人化 ",有的時候一線工作人員也會不理解、不配合,大大延緩項目進度。有一年冬天,某煤礦智能化團隊在陝北某場站調研時,工作人員不想搭理他們,就故意不開暖氣爐,想讓他們大冷天的自己知難而退。還有一次,在一家養豬場,管理方希望用智能攝像頭來實時感知豬的體溫,防範豬瘟等傳染病,但算法性能一直提不上去,最後技術人員在現場反複調研,發現是因爲豬皮太厚了,導緻體溫識别準确率下降……
不難看到,這些十萬、幾十萬的中小微企業的小項目,可能客單價比不了大 B/ 政府類客戶,但數量多、規模大,以基礎大模型作爲底座,進行定制化開發,可以極大地提高基座模型廠商的使用率,吸引更多夥伴 /ISV 服務商去打造商業版。
吸引行業夥伴,百川智能、智譜 AI、昆侖萬維、瀾舟科技都相繼開源了數個模型。
但我們都知道,開源容易,做生态難。一個大模型開源之後,生态繁榮不起來,沒有開發者來持續貢獻、打造商業版,無法形成正循環。
要吸引開發者,一是基座模型的能力還是要過硬,理解分析邏輯不能有硬傷。奧特曼就曾經說過,GPT-4 的很多問題會在 GPT-5 得到解決,希望開發者基于 AGI 通用人工智能去設計業務。換句話說,更強大的新模型,可能會将舊模型的商業價值一筆勾銷,讓開發者徹底白幹。所以,開發者一定會選擇将時間精力放在那些最先進的基座模型上,避免被卷得太快。
此外,需要良好完備的工具棧。大模型要用好,軟件也要做一定的适配和改造,則考驗的是大模型廠商的工程化能力,軟件是否對開發者友好。而 " 四小龍 " 中比較多初創公司,工程團隊在規模、人才、經驗、積累等方面可能與 BAT 這類成熟企業有差距。比如任務調度、代碼可讀性、技術文檔、标準數據集等,減輕開發者和夥伴們的負擔,共同把大模型用好。
無論是曾經輝煌的 "AI 四小龍 ",還是正在崛起的 " 大模型四小龍 ",這些企業用銳利的技術和昂揚的理想,一次又一次地推高創新的 " 天花闆 ",是中國科技不可或缺的一支力量。
智能中國正打開更寬廣的天地,這些大模型 " 潛力股 ",一定會有龍躍于淵,遨遊九天。