大模型談錢,不寒碜。
前些日子朱嘯虎和楊植麟的隔空對話,代表了技術派和市場派的兩種觀點。朱嘯虎不看好大模型創業,認爲現階段大模型公司缺乏場景和數據,估值過高,且面臨開源模型的競争,投資風險大。他更傾向于投資能快速商業化、變現的應用層項目。
楊植麟堅定看好大模型創業,認爲這是未來十年唯一有意義的事,并将其視爲一個結合科學、工程和商業的系統,需要長期投入和堅持,最終目标是實現 AGl。
雖然兩者觀點看起來針鋒相對,但有一點并不沖突,不論是在通向 AGI 的過程中 " 沿途下蛋 ",還是現在就投資能看到産出的大模型應用公司,今年大模型的商業化,一定是離錢越來越近。
若論國内對大模型商業化最熱衷的企業,百度一定是其中之一。據此前報道,2024 年百度創始人李彥宏在百度智能雲方向的 OKR 就是,跑通以大模型爲核心智能雲發展路徑,并且在收入和利潤方面都有要求。
百度智能雲是百度 AI 能力的輸出口,海外市場大模型與雲服務結合得比國内更緊密,這也是百度智能雲希望努力的方向。
3 月 21 日,百度智能雲千帆大模型平台就一口氣發布了 5 款新模型,包括 3 個輕量級大模型、2 個垂直場景大模型,并且千帆 ModelBuilder 以千帆 AppBuilder 也同步升級。钛媒體 App 了解到,百度後續還将發布大模型應用産品,譬如銷售、客服、辦公等産品。
可以說,目前百度大模型商業化隻有一條主線,讓盡可能多的一部分人先用大模型,由此改變自己的産品和面向客戶的服務。
大模型落地 " 值不值 "
初期大模型的火熱,未必能轉化爲實實在在的訂單,在大模型技術和産業的高速發展期,有些廠商已經被曆史的車輪碾過,但卻絲毫不起一絲波瀾。
" 慘烈,我覺得是很慘烈,從去年到現在有很多基礎模型廠商參與到市場競争,也有很多的企業資金鏈受到了一些挑戰,也反映出新技術發展過程中的一些矛盾。" 百度智能雲 AI 與大數據平台總經理忻舟說道。
這其中一個很重要的因素,就是大模型供需之間的錯位,大量企業沒有掏出真金白銀,而是處在觀望階段。從企業使用大模型的角度,主要關注三個因素,一是效果好不好,二是成本是否足夠低,三是效率,因此多數企業并不關心大模型或者小模型,隻會結合自己的預期評估大模型落地到自己的場景 " 值不值 "。
百度也提出了自己 " 效價比 " 的理念,除了極少的大客戶對大模型有極緻的效果追求,更多的企業和機構往往要綜合考量大模型的使用效果、性能以及成本,即 " 效價比 "
面向大模型如何落地,業内想了各種各樣的技術方法,比如 RAG、插件、MoE、小型化、大小協同等等各種各樣的問題,輕量級模型就是公認的 " 效價比 " 突出的方案。
" 業界也逐漸形成一個共識,模型不見得是參數規模越大越好。在很多實際的場景當中,用小尺寸的專家模型也能夠達到我們通用大模型的效果,小尺寸專家模型的推理成本會更低,更便宜。" 百度副總裁謝廣軍表示。
他還提到,本次發布的三款模型都是開發專家模型的基座模型,主要面向兩個場景:一是客戶、合作夥伴結合自己的數據,去做垂類場景模型。二是百度也會基于這些小的基座模型,去開發第一方的行業垂類場景模型,比如做教育行業的教輔答題和解題,可以用一個小尺寸的模型加上一些數據,精調出一個效果很好的解題助手模型。
"3+2",5 款新模型
一月初,OpenAI 發布了多款新模型,價格下降,性能提升,百度本次也是同樣的策略,百度智能雲千帆 ModelBuilder 發布了包括 ERNIE Speed、ERNIE Lite、ERNIE Tiny 在内,參數量由大到小的三款輕量級大模型。千帆 ModelBuilder 的概念就是生産平台,提供整個模型訓練的工具鏈,讓模型開發變得更簡單。
對于輕量級模型,謝廣軍表示,基座模型本身的效率一定要好,百度基于文心大模型的技術領先優勢積累,再把尺寸做小,模型的效果就會做得很好,在很多場景它能夠達到大模型的效果。
同時,百度發布的輕量級模型具備再生産能力,比如支持 post-pretrain、sft、lora 精調能力,基座模型加上精調數據來達到垂直場景下的效果,同時成本更低。
具體來看,ERNIE Speed 在推理場景下擁有最高 128k 的上下文長度,在處理知識問答等任務時,能夠更好的處理上下文的依賴關系,同時,針對特定場景可以将 ERNIE Speed 作爲基座模型進行精調,模型效果可以追平甚至超過旗艦級大參數規模大模型,效價比大幅提升。
ERNIE Lite 的參數量則更小,更适合搭載在低算力的 AI 加速卡上處理推理任務,作爲 ERNIE-Bot-turbo 模型的升級版,ERNIE Lite 在情感分析、多任務學習、自然推理等場景下的應用效果提升了 20%,推理調用成本大幅下降了 53%。
參數量最小的 ERNIE Tiny 則主打極緻低成本、低延遲,可用于檢索、推薦、意圖識别等高并發、低延時等應用場景中,在某對話推薦業務場景中,精調後的 ERNIE Tiny 在搜索引擎推薦詞激發環節,相比 ERNIE 3.5,對話輪次增長了 3.5%,成本下降了 32%。
此外,百度智能雲千帆 ModelBuilder 還推出了 ERNIE Character 和 ERNIE Functions 兩款垂直場景大模型,分别适配客戶在角色扮演類應用場景(如遊戲 NPC、客服對話等)和工具調用場景(對話中使用外部工具、調用業務函數等)中的使用需求。
結合企業實際使用大模型的過程,有些企業起初就用最好的模型看最好的效果,再決定投入的資源程度。有些場景需要快速驗證,企業可以先上輕量級模型,輕量級模型總結一句話—— " 輕歸輕,可破冰 ",在一些場景下完全可用,作爲大模型落地的先鋒軍。
對于注重私有數據的企業和行業,私有數據跟大模型結合也可以先用輕量級模型,不管是知識資産還是數據分析,都可以跑出效果。
" 把大模型應用,喂到企業嘴邊 "
千帆大模型平台上的客戶需求主要分爲三種,第一類是在 AppBuilder 開發應用;第二類,直接調用百度的基座模型的,比如直接調用文心 4.0、 3.5 版本;第三類是生産模型,客戶數據和百度基座模型結合做一個新的垂類模型。
AppBuilder 去年年底推出,從應用的視角讓開發者能夠便捷地開發基于大模型的 AI 原生應用,百度第一方也做了非常多的 AI 原生應用,也是基于這套平台做的,本次 AppBuilder 也進一步升級,進一步降低應用開發門檻。
升級後的 AppBuilder 開放的工具組件多達 55 個,包括基于百度多年技術積累和自有業務沉澱的大模型組件、AI 能力組件,也包括搜索等百度特色的業務組件、和多場景的第三方 API 工具,另外還提供了 RAG(知識檢索問答)、GBI(生成式數據分析)等根據典型應用場景深入調優的高級能力組件。
在組件之上,千帆 AppBuilder 推出的 Agent(智能體)應用框架,具備精準的任務自主規劃能力,對多種應用工具的自動編排準确率超過 90%。AppBuilder 還支持開發者接入自定義工具,實現更複雜場景應用的需求定制。
謝廣軍介紹,AppBuilder 分兩個形态,一個是代碼态,百度提供 SDK,甚至提供底層的組件和能力,這種是大 B 端的場景下的典型客戶畫像。另一個是零代碼态,以小企業、個人開發者爲主,現在零代碼态開發者的數量比較多,百度這兩條路都要走。
根據百度智能雲公布的數據,千帆大模型平台已經服務 8 萬企業用戶,累計幫助用戶精調 1.3 萬個大模型,幫助用戶開發出 16 萬個大模型應用,自 2023 年 12 月以來百度智能雲千帆大模型平台 API 日調用量環比增長 97%
大模型未來一段時間還會不斷快速演進,百度 AI 團隊主抓基礎模型,智能雲團隊主抓商業落地,構成了百度自己的大模型商業落地模式。
(本文首發钛媒體 APP 作者|張帥,歡迎添加作者 mr3right 爆料、交流)