文 | 節點财經,作者 | 崔大寶
進入 2024 年,大模型似乎有熄火之勢:資本市場,與之關聯的概念炒不動了,英偉達股價動辄暴跌重挫,引發 " 泡沫戳破 " 的擔憂;
消費市場,BATH 們的推新活動少了,産品更新叠代的速度慢了,民衆的關注度降了……
熱鬧的大概隻剩下兩場酣仗:自 5 月 15 日字節跳動宣布 " 以厘計費 ",打響國内大模型 " 價格戰 " 的第一槍,百度文心、訊飛星火、阿裏通義、騰訊元寶等紛紛跟進;
同時,地鐵、寫字樓、機場等白領人群密集區域,百度文心、訊飛星火、阿裏通義、騰訊元寶、華爲盤古的 Slogan,你方唱罷我登台,貼臉營銷如槍林刀樹。
" 海水 " 與 " 火焰 " 交融的場面,不得不讓人思考,大模型的出路究竟在哪裏?難點、卡點、節點又是什麽?
01 難點:盈利難&落地難
強如 OpenAI,也面臨 " 恰飯 " 的難題。
援引外媒報道,OpenAI 預估虧損 50 億美元,全年運營總成本高達 85 億美元,照此估算,其現金流大概率在一年内耗盡。
而在一篇題爲《How does OpenAI Survive》的長文中,作者對 OpenAI 的商業模式産生了質疑:
"OpenAI 的營收在 35 億至 45 億美元之間,但其運營虧損可能高達 50 億美元,其收入遠遠無法覆蓋成本。而爲了推出下一代的大模型 GPT5,OpenAI 需要更多的數據和算力,這又是一大筆花費。"
說千道萬,靠着 " 碎鈔式 " 的大力出奇迹後,大模型卻仍未找到一條合理的盈利路徑。
據《節點财經》觀察,市面上的大模型,大部分都采取 To C+To B,即會員訂閱 + 開發者 API 調用 " 兩條腿 " 走路。
但無論是 To C,還是 To C,能一上來就産生付費的寥寥無幾,若再刨除重負的減項,多半是鼻子大過臉。
以本土大模型先行者百度爲例,2024 年 Q1,其雲業務收入爲 47 億元,同比增長 12%,其中 6.9% 來自外部客戶使用大模型及生成式 AI 相關服務,約爲 3.24 億元。
而在 2023 年 Q4,大模型爲百度雲貢獻了 6.6 億元增量收入。
這是國内唯一披露大模型收益的廠商,本身又是家大業大,有底氣拼到底的巨擘。但隻談創收,忽略創利,就是耍流氓。
可想而知,其餘不敢明示賬目的選手,内心有多迷茫、煎熬。
不掙錢,難掙錢的背後,是大模型落地難的窘境。
雖然大佬們高呼 "ChatGPT" 的問世是 "iPhone 時刻 ",第四次工業革命,新一代的 " 火 " 和 " 電 ",但坦率地講,當下大模型還有很多局限性,包括認知偏差、能動性欠缺、泛化性能弱、幻覺等。
比如,數值運算就是大模型明顯的弱項,或者說大模型是妥妥的 " 文科生 ",做數學題的智商可能連二、三年級的小學生都不如。
《節點财經》親測,在 Kimi 輸入:"9.11 和 9.8 哪個大?" 一頓啰嗦後,Kimi 給出了完全不正确的答案。
圖源:Kimi 官網
比如,大模型資料更新不及時,必須外挂知識庫才能在一定程度上緩解這個痛點,并且還是無法完全解決 " 一本正經地胡說八道 " 的尴尬。
前幾天刷屏的 SearchGPT,就在各地網友興緻勃勃等待灰測展現 AI 搜索的 " 洪荒之力 " 時,《大西洋月刊》澆了一盆冷水,眼尖的記者發現:
問的是關于 " 八月份北卡羅來納州的布恩音樂節 " 的細節,SearchGPT 的回答分爲 5 條,3 條裏包含事實錯誤——有的是把舉辦日期弄錯,有的是把距離和車程搞混,有的是把場館網址張冠李戴。
再如,大模型絕對是 " 健忘症 " 患者,我們在和它對話時,尤其是多輪對話時,難免要化身 " 複讀機 ",一遍一遍重複相同的話術。
而在 B 端,因爲實戰經驗不足,生分于對方的 Know-How,加之環境的複雜多變性,大模型面臨的挑戰更艱巨。某業内人士表示,迄今大模型在行業中尚沒有一個成熟的案例。
02 卡點:數據、算力、成本
深入肌理地分析,大模型的 " 落地難 " 又與自身的三大卡點:數據、算力、成本息息相連。
➊ 卡在數據
如果把大模型比作一頭巨獸,那它的顯著特征之一便是 " 不停進食 ":需要高質量、大面積的語料做長久期、高頻次地投喂、催肥。
換言之," 食物 " 的品質、多寡、新鮮度、多樣性等,決定了大模型的叠代進度和學習效果。
無疑,這對數據的挖掘、獲取提出嚴峻考驗,關系到各方的權益保障、利益分配、版權歸屬等,通常涉及到敏感信息時,數據的清洗、标注、脫敏又會很繁雜。
前陣,免費網文 APP 番茄小說因一份 "AI 協議 " 引發軒然大波。根據該份協議,平台可以将簽約作品,含名稱、大綱、簡介、章節等,作爲 " 哺育 "AI 大模型的素材,用于各種應用場景,如智能對話、智能文本創作等。
不過,這一舉動遭到作者的普遍反對,認爲其不僅威脅網絡寫手的生計,還損害了原創内容的價值,甚至發起聯合斷更以示抗議。
➋ 卡在算力
如果把 AI 鏈路比作一間工廠,那麽算力便是維持工廠運轉,量級誇張且進價不菲的 " 燃料 "(煤、石油、電力等)。
公開資料顯示,初始 ChatGPT 匹配的算力是 1 萬塊英偉達 A100(AI 芯片),花費超過 7 億元。後續調優每天消耗的算力大概是 3640PFLOPS,即 7 至 8 個算力達 500PFLOPS 的 Data Center 的支撐,整體基建開支以百億計。
按照廣發證券的測算,在暫不考慮軟件層面算法優化的前提下,本土 AI 大模型在訓練與判斷、預測階段所需算力,相當于 1.1 萬台或 3.8 萬台(樂觀假設下)高端 AI 服務器,大緻對應約 126 億元到 434 億元的資金體量。
進一步地,随着大模型規模狀大,算力需求會倍數遞增,已然超越硬件的摩爾定律。據悉,ChatGPT 從 1.0 到 3.0,參數量從 1.17 億狂飙到 1750 億。
而目前,我們在算力這塊既面臨外部 " 卡脖子 ",内部建設又相對落後,碎片化、傳輸慢、協同難、人才緊缺等 " 痼疾 " 亟待突破,導緻大模型的實效遜于國外。
" 大模型隻有兩個梯隊,OpenAI 和 Others,國産用哪家都一樣 ",多位 AI 從業者談道。
➌ 卡在成本
大模型 " 桎梏 " 于算力,實際也是 " 桎梏 " 于成本。
計算機飛入千家萬戶,售價下探,變得親民、接地氣,很關鍵;智能手機能人手一部,物美價廉的小米功不可沒;新能源汽車的熱賣,離不開動力電池的 " 跳水式 " 降價……
從人類曆史的進程看,任何一項新技術的推廣、普及,都離不開對成本的有效、大力壓縮、控制。
硬币的背面,是科技發展和工業文明進步共同作用下,制造效率、運算精度提升,人均産值拔高,各類物料愈發便宜等因素集結的強大驅動力,進而減輕 C 端、B 端 " 太貴了,買還不買 " 的糾結。
大模型同理,浩大的開支也是其成長途中的 " 絆腳石 "。試想,當生态裏隻有唯一的 " 賣鏟人 "(英偉達)賺錢,賺頭還不小,怎麽可能持續呢?
好消息是,今年 2 月末,李彥宏透露,自發布以來,百度不斷降低文心大模型在推理方面的成本,已降至去年 3 月版本的 1%。
03 節點:在産業裏 " 種植 " 大模型
毋庸置疑,大模型仍有諸多 " 短闆 " 和缺陷,但新技術的魅力向來在于探索 " 無人區 ",跋涉 " 深水區 "。
很多眼下看似微弱的 " 火種 ",往往都孕育着日後 " 納須彌于芥子 " 的宏壯。盡管迄今爲止的大模型,大家都是拿着錘子找釘子,但我們已經看到,其正逐步向産業邁進,嘗試扮演了一些淺層的 Agent 的角色。
最醒目的标識便是,大模型不再坐而論道,隻會聊天、寫詩、作畫,而是起而動之,走出實驗室,去往礦區、政務、金融、醫藥、金融、物流等具體領域,努力兌現自己的終極使命。
比如,在礦區,下井工人常年深陷光線昏暗、浮塵彌漫的環境,疊加經年累月高強度的勞碌,使不少人都患上了風濕、耳鳴等職業病,更甚者,還可能遭遇瓦斯、透水等意外,但礦區作業又十分依賴人力,特别是主運系統巡檢。
華爲的盤古礦山大模型這時候便派上用場了。其覆蓋煤礦的采、掘、機、運、通、洗選等流程下的 1000 多個細分場景,用 AI 取代人成爲主運智能監測系統的眼睛,能夠精準識别大塊煤、錨杆等異常情況,異物識别準确率達 98%,動作規範識别準确率超過 95%,且全時段巡邏助力工作人員,避免因漏檢造成的安全事故,縮短停機時間。
京東表示,基座大模型是靠卡訓出來的,企業大模型是靠人用出來的。
物流領域,攬收、派送、分揀、輔助,應對突發事件等,快遞員每天都背負着繁重的任務,還要熟悉貨物處理規程、安全操作标準、客服要求等多達上百個規範,把這些統統記牢,肯定要耗費大把功夫,還容易混淆。
京東言犀大模型的小哥終端助手大大化解了上述煩惱。它告别了隻 " 動腦 " 的境界,能直接 " 下手 ",快遞員動動嘴,小哥終端助手就能立即将送貨通知發給客戶。如今,小哥終端助手爲 JD 商城近 35 萬自有配送員 " 效勞 "。
再如,零售行業,基于京東言犀大模型的 AIGC 營銷工具 " 京點點 ",不僅可以幫助商家一鍵出商品圖,還支持了超過 2000 種視覺元素道具;不僅可以豐富吸睛資源和表現力,還能依循商品屬性、特點和宣傳想要的個性化布局,實時、自主撰寫創意賣點、種草文案、直播腳本等。
總的來說,把大模型 " 種植 " 在産業裏,讓大模型在産業裏生長、發芽,俨然是現在大廠的共識,必須攻克的難關。長遠看,該共識亦如 " 星星之火 " 終會燎原曠野。
寫在最後
當喧嚣過後,大模型這場豪華遊戲,能留在牌桌的玩家,注定隻是少數。
面對數據、算力、成本等現實問題,供需兩端漸漸回歸理性。可以預見,在真 " 好用 " 和能 " 吸金 " 之間,大模型還有很長的路要走。