出品 | 虎嗅科技組
作者 | 齊健
編輯 | 廖影
頭圖 | 視覺中國
10 月 17 日,百度召開了 2023 百度世界大會,并在會上宣布了文心一言 4.0。
這一天,還有三家主流大模型創業公司發布了新消息 : 百川智能宣布完成 A1 輪 3 億美元融資;智譜 AI 開源了與清華 KEG 合作的 CogVLM-17B 多模态大模型;面壁智能推出了與清華 NLP 合作的 XAgent 智能體。
ChatGPT 轉眼上線快一年了,國内經曆了半年多的百模大戰,AI 戰火越燒越旺。
百度的官方數據顯示,文心大模型 4.0 在 9 月已開始小流量上線。8 月 31 日文心一言面向全社會開放至今,用戶規模已經達到 4500 萬,開發者 5.4 萬,場景 4300 個,應用 825 個,插件超過 500 個。
在 AI 大模型這波熱潮中,百度幾乎是走得最快的,從模型發布、叠代,到産業落地,再到如今發布的以 "AI 原生應用 " 爲基礎的多款 C 端産品。本次百度世界大會上,李彥宏喊出:"百度要做第一個把所有現有産品都進行重構、重做的公司。"
如此快速地要把過去的産品用 AI 全部重做,對于任何一家成熟科技公司都相當困難,對于百度的用戶來說,最大的興趣點,聚焦在新的"AI 原生應用 " 到底能給我帶來什麽?我又要爲這些新功能,付出什麽?
AI 原生應用找到盈利點了嗎?
李彥宏在本次百度世界大會上的演講題目是 " 手把手教你做 AI 原生應用 ",雖然不知道聽完演講之後,有多少人學會了如何做 AI 原生應用。但百度的确是把 AI 能力全面加入到了已有的産品中。其中搜索、地圖、文庫、網盤等 ToC 産品,更是 AI 原生應用的主力。
百度本次發布的 AI 原生應用,包括提升搜索的交互、推薦激發能力,地圖的智能輔助決策,網盤的多模态搜索,以及文庫的内容檢索與生成等。産品提升的核心是用戶體驗和 AI 助理功能,從而增加用戶黏度,拓展新用戶。
對于 AI 原生應用來說,一直以來主要考慮的問題有兩個其一是安全合規,其二是盈利。目前,在安全合規方面,相關部門已經在立法和監管方面做了很多工作,國内大模型普遍已經可以 " 持證上崗 "。但盈利問題仍比較困難。
AI 大模型在 ToC 領域的商業模式,一直是個争議話題。
從 OpenAI 被曝出的營收情況來看,ChatGPT 的付費訂閱模式在海外市場還是比較受認可的。外媒 The Information 報道稱,OpenAI CEO Sam Altman 在近期的内部讨論中表示,目前 OpenAI 的年收入約爲每年 13 億美元,其中很大一部分來自訂閱收入。2022 年,OpenAI 的年收入僅爲 2800 萬美元。
不過,國内廠商對生成式 AI 的 C 端應用普遍比較看好與現有産品結合,也就是百度正在力推的 AI 原生應用。
百度 2023 第二季度财報中曾經提到過,當季資本支出增加主要是由于購買硬件以支持其人工智能模型和應用程序的訓練和運營。一些百度内部流出的非官方公布信息顯示,文心一言 4.0 的推理成本比 3.5 高 8 到 10 倍。
龐大的訓練、推理成本,擺在面前,對于 AI 原生應用來說,AI 能收回成本嗎?能賺錢嗎?
一種聲音認爲,國内的 C 端産品其實已經做得很好了,AI 大模型很難對用戶的體驗帶來跨越式的提升,甚至沒法給用戶創造特别具體的價值。因此,很難有人直接爲 C 端産品中的 AI 大模型買單。
從 AI 原生應用中的大模型功能來看,更多的還是集中在傳統互聯網消費領域,提供索引和消費決策支持。因此,能給 AI 最終付費的人,大概率仍會是傳統互聯網商業模式的主要收入來源——廣告。
一直以來,百度營收的重點都是廣告,目前主推 AI 的大廠,微軟、谷歌、Meta 也都公開提到過生成式 AI 對廣告業務的促進将會是未來的重點。
不過,從百度地圖、如流更新的打車、機酒、餐飲等功能來看,與生成式 AI 相結合的推薦、預訂業務,應該也會以渠道的形式創造新的盈利點。
AI 打開 B 端局面
國内 AI 在大模型落地方面," 産業先行 " 的呼聲很高。
百度本次也着重強調了兩款 B 端的 AI 原生應用 GBI(Generative Business Intelligence)和如流。雖說 GBI 這個詞算是 " 首創 ",但這兩款産品在國内市場上均不鮮見。多數專注 B 端的 AI 供應商都早有類似 GBI 的産品或功能推出,如流的 AI 助手,則也早在釘釘和飛書上,看到過相似的功能。
百度的 GBI
相對 C 端來說,B 端的盈利模式更好找,但 B 端用戶更看重産品本身的核心能力。
在這方面,雖然百度一直在借 AI 大模型推動文心千帆平台和百度智能雲在 B 端市場的影響力,但行業對百度的認知明顯不夠。
" 我們最近調研過的國内制造業的大模型,華爲和騰訊相對比較适合,我認爲百度更偏消費。" 某知名自動化技術供應商向虎嗅表示,雖然百度在國内 AI 大模型中一直走在前排,但是在垂類大模型方面能力并沒有特别突出。除此之外,由于百度智能雲業務在國内的應用基礎不夠,很多産業用戶并不會優先考慮使用文心千帆或是百度智能雲。
目前,文心千帆不支持疊加公有雲部署,也就是說百度的 AI 大模型,隻能用在百度的公有雲上。
" 如果要達到最好的效果,我們建議還是全套都用百度端到端的技術,如果覺得遷移成本比較高,我們也努力在其它雲上做很好的适配和效能。不過,我們目前是不支持在其它公有雲上去做部署。" 百度智能雲 AI 與大數據平台總經理忻舟告訴虎嗅,雖然不能疊加公有雲,但客戶如果要部署在私有雲平台的話,是可以支持其它雲或是客戶的自研雲平台的。
AI 大模型的 MaaS 模式,其實是 SaaS 模式的一個延伸。對于用戶來說,選擇雲廠商的重點是軟件、服務,選擇 AI 大模型也一樣。雖然公有雲的排他性或許在一定程度上限制了 AI 大模型的産業推廣,但這也使AI 大模型成了百度智能雲在 AI 新時代的雲市場中,成了百度的一張王牌。
文心 4.0,還有什麽沒說清?
百度認爲文心一言 4.0 已是可以直接對标 GPT-4 的大模型。但在發布會上,或許是受限于篇幅,或許是不想講太多難懂的技術細節,關于文心 4.0 模型的技術細節百度并沒有講太多。
其中有兩個與大模型落地直接相關的具體問題,也都是一筆帶過。
首先是大模型的幻覺問題。
AI 大模型落地應用的一個關鍵因素就是準确和穩定。AI 的幻覺問題,直接影響到生成内容的安全合規性,以及能否滿足用戶使用 AI 的需求。與其它廠商的發布會不同,百度并沒有給出量化的幻覺、錯誤下降比率。
關于文心大模型 4.0 的能力提升,在百度 CTO 王海峰博士的演講中,隻是給了一個很抽象的概念:一個月的時間提升了 30%。
不過王海峰在大模型技術方面,具體講解了一下,文心大模型正在通過知識點增強和智能體機制,提高回答的準确度和模型的可解釋性。在技術上,這兩個問題對大模型的應用非常重要。
通過知識點增強提升準确度
另外,就是業内最關心的 AI 大模型的成本問題。
其實關于大模型每次推理和調用的成本問題,多數廠商都沒有給出過具體的數據。不過,在文心千帆的介紹中,百度集團執行副總裁、百度智能雲事業群總裁沈抖簡單地講了一下文心千帆的調用價格。
沈抖在演講中提到,企業利用文心千帆平台基于 RAG 應用框架制作企業文檔問答應用的功能,并介紹了百度與三一重工的探索性合作。
在這個案例中,利用 AI 大模型隻需 10 來分鍾,就可以把 48 頁,20000 餘字的産品說明制作成問答助手,并生成代碼,直接挂在三一重工的網站首頁,解答關于三一重工機械産品的專業問題。
基于文心大模型的三一産品小助手
沈抖表示,制作這樣一個問答助手的成本:隻需要幾百塊錢,後續的每次問答隻需要幾分錢。
文心千帆平台的收費定價是公開可查的。
在文心千帆平台上,大模型的預置服務模塊報價中,ERNIE-Bot 大模型公有雲在線調用服務的定價是 0.012 元 / 千 tokens;Llama-2-70B-Chat 的定價是 0.044 元 / 千 tokens;最便宜的模型是 Embedding-V1 和 bge-large 模型,定價爲 0.002 元 / 千 tokens。
計費規則以 ERNIE-Bot 調優大模型調用服務爲例:
輸入:" 請給我念一首詩 "
輸出:" 春眠不覺曉,處處聞啼鳥。 夜來風雨聲,花落知多少。"
共中文字數爲 27,總計 tokens 爲 27
調用價格爲 0.012 ( 單價 ) x 0.027 千 tokens=0.000324 元
這些隻是文心千帆報價的一部分,具體定價可以參閱文心千帆網站。這個定價對于 B 端用戶有限的業務來說确實不貴。結合沈抖的演講,幾乎可以算出三一重工在這個問答助手上每月的開銷。
沈抖提到的每次問答幾分錢,我們取低,算 3 分錢一次問答。根據網站訪問統計工具 SimilarWeb 的數據顯示,2023 年 7-9 月,三一重工官網的訪問量是 36.8 萬次。如果對三一重工的問答每個訪問是 3 次,那平均算下來這 3 個月的調用成本也就 3 萬塊錢左右,确實不多。
雖說這個價格是對 B 端客戶的不太适用 C 端,不過,我們可以按這個價格大膽估計一下,如果把這個問答助手放在百度官網流量級别的網站首頁,可能花費的調用成本是多少。
同樣參照 SimilarWeb 的數據,百度官網在過去 3 個月中的訪問量是 156.6 億次。如果每個訪問提問 1 次,那這 3 個月的調用成本,也有 4.6 億元了。
這個估算隻是猜測,百度官方對大模型的 C 端成本控制其實非常樂觀。
百度集團副總裁、百度移動生态事業群組(MEG)搜索平台負責人肖陽告訴虎嗅,單看搜索一項,基于文心一言實現 " 極緻滿足、推薦激發、多輪交互 " 的搜索成本沒有那麽可怕。相對于普通搜索,融合了生成式 AI 的搜索在成本方面隻是 " 略高 "。
不過,在搜索的成本一直很高。有百度内部資料顯示,百度搜索本來處理的數據量在七八年前就已經達到千億級别,目前每年純設備成本超過 50 億元,算上研發、運營和維護的人工成本,總開銷每年接近 100 億,且有逐年遞增的趨勢。
肖陽透露,目前百度在搜索方面的 AI 大模型調用量每天已超 3 億次," 這個規模是很大的,如果成本上吃不住的話,早就叫停了。"