今年以來,大模型的熱度,讓雲計算産業爲之沸騰。要舉出一個最有力的證明,應該是:MaaS(Model as Service)這種全新模式的出現,一座座 " 模型工廠 ",已經建起來了。
所謂 MaaS,模型即服務,指的是用戶可以直接通過 API 調用基礎大模型,爲不同的業務場景,來構建、訓練和部署專屬模型。雲平台會提供從數據、模型到應用服務的全周期管理和工具。
目前,微軟雲 Azure、阿裏雲、華爲雲、騰訊雲、百度雲、京東雲等雲計算大廠,都已經推出了 MaaS 服務。
雲廠商做 MaaS 究竟是爲什麽?一個主要考量是,作爲 IT 基礎設施服務商,也就是 IaaS 模式,長期面臨價格戰的市場競争,而通過 PaaS 和 SaaS 爲政企提供 ToB 的數字化服務,又一直沒有完成行之有效的價值回收。
這種情況下,雲廠商急需要找到一種全新的、高價值的商業模式,大模型就帶來了這個可能。
可是,方興未艾的 MaaS,真的能幫雲廠商 " 翻身 " 嗎?
必然到來的 MaaS
先要聲明一下,MaaS 模式的出現,以及大量 " 模型工廠 " 的矗立,是非常有必要,也是有極大商業想象空間的。
你可能會問了,連 OpenAI 的模型訪問量都在下降,真的有那麽多大模型的訓練需求,要用到如此多的 " 模型工廠 " 和 MaaS 服務嗎?
我們的判斷是,大模型的産業化之路才剛剛開始,而産業化會催生大量細分的、不同參數、不同規格、不同場景的模型需求,必須提升模型訓練部署的效率,推動模型生産走向工業化。不同模型是各式各樣的鋼材,用來蓋起一個個 AI 應用,那麽 " 模型工廠 " 就是 " 煉鋼廠 ",是一定要建的。
MaaS 模式的必然性,有三個支點:
第一,需求。通用性的基礎大模型,已經被快速填滿了。剩下很多企業,更希望調用基礎模型的能力來改造自己的業務,或者開發新的 AI 應用,而這些都需要更懂行業知識、技能更精準、更貼合場景的垂直模型。有數據顯示,行業智能化滲透率将從 2021 年的 7% 增長到 2026 年的 30%,更多行業的核心業務系統會被大模型能力滲透。所以,對于大模型的生産需求,還很旺盛。
第二,供給。目前,大模型的生産力依然有限,首先是計算資源稀缺,大模型的訓練和推理對計算資源和存儲資源有很高的需求,很多企業和機構 " 無卡可用 ",導緻無法進行大模型的訓練和推理。
同時,訓練專有大模型需要大量的高質量數據,數據清洗、預處理等一系列複雜工程,大大影響了開發效率,訓練周期長,無法快速滿足業務上線的要求。
此外,訓好的大模型要進行部署和應用,需要考慮到計算資源、業務場景、不同參數規格、網絡帶寬、安全合規等方方面面的問題,很多企業和機構缺乏相關的技術和經驗,前期投入的心血很容易就打了水漂。
要提高大模型的供給數量和質量,MaaS 模式的 " 模型工廠 " 一定要建。
第三,催化劑。雲廠商有充足的動力,催化 MaaS 模式的成熟,并推向市場。IaaS 基礎設施即服務,造就了公有雲的崛起,但 IaaS 模式的前期基礎設施投入大,營收能力低下,積弊已久。PaaS 需要雲廠商投入大量的人力、回報周期長,SaaS 的價值不足,客單價低,還需要大量定制化和運維服務。這時候,通過 MaaS 這一新模式,向用戶全面輸送模型能力,是一種高價值、強确定性的選擇。
一方面,大模型龐大的數據規模,會帶來更多的計算資源需求和用雲量。另外,行業企業用戶的定制化需求,可以按項目制付費。大量 AI 應用程序調用 API,已經産生了按 token 付費、訂閱付費、商業版等多種商業模式。
如此多的商業化前景,就如同一針針強心劑,促使雲廠商們加速布局 MaaS。
讓我們回歸到現實,來看一看國産雲廠商,是如何做 MaaS 這門生意的。
" 前店後廠 " 的國産 MaaS
今天的整體形式是,國産雲廠商的 MaaS 基本都走向了 " 前店後廠 " 模式。
怎麽理解呢?
雲廠商扮演 " 廠 " 的角色,是利用基礎設施、行業服務能力等優勢,和全流程開發工具與套件,滿足客戶對模型預訓練、模型精調、模型部署、智能應用開發等多樣化需求,保障客戶的大模型能夠順利交付。
以微軟雲的 Azure OpenAI 服務爲例,就支持開發者調用 OpenAI GPT-4、GPT-3、Codex 和 DALL-E 等模型的 API,來構建、微調模型,爲應用提供支持。這就是 " 工廠 " 模式,Azure 主要提供一些企業級功能,如安全性、合規性和區域可用性等。
而縱觀國内雲廠商,會同時強調自己 " 店 " 的能力。
雲廠商扮演 " 店 " 的角色,即還會自己參與開發行業大模型及 AI 原生應用,把控模型和應用的質量,提供精選服務,進行市場推廣和銷售。
比如今年 6 月份,騰訊雲在行業大模型及智能應用技術峰會上推出的 MaaS 一站式服務,就是依托騰訊雲 TI 平台打造行業大模型精選商店,其中包含了騰訊企點、騰訊會議、騰訊雲 AI 代碼助手等多款頭部 SaaS 産品。
9 月華爲全聯接大會 2023,華爲雲的 MaaS 服務,則采用了 5 個基礎大模型 +N 個行業大模型 +X 個場景模型的三層解耦架構,從 L0 層的基礎模型,到适配行業特征的 L1 層,以及開箱即用的 AI 應用 L2 層,并上線了昇騰 AI 雲服務百模千态專區。
而 10 月剛剛舉辦的百度世界 2023,百度智能雲的 MaaS 服務平台千帆,則推出了千帆 AI 原生應用商店,成爲大模型商業機會的彙集地,爲商家提供品牌曝光、流量支持和銷售資源等支持。首批精選應用包含了百度内部的曦靈數字人平台、百度智能雲一念智能創作平台等。
可以看到,智能時代,垂直模型和 AI 應用一定會百花齊放,一定離不開模型工廠。但整個階段才剛剛走出了第一步,目前上遊的底座模型并不少,能力也都不差,但如何做出有說服力的垂直模型和應用,難度還是很高的。
和數字化及 SaaS 市場較爲成熟的歐美市場不同,這一輪國内智能化的主力軍是傳統行業及企業。很多模型和應用的潛在購買者,對大模型的能力并不清楚,不知道什麽模型适合自己的業務,也不知道如何找到需要的模型,更擔心自己的定制模型單子太小不被重視 ……
而 ISV 服務商和開發者,擔心投入時間精力一整套流程走下來,産品已經落後了,或者找不到客戶進行商業變現。
這種情況下,雲廠商僅僅做幕後 " 工廠 " 是遠遠不夠的,需要建立一套更完善的模型供應鏈機制。" 前店後廠 " 就成了國産 MaaS 的主流選擇," 工廠 " 負責生産," 商店 " 負責推介。
而 " 前店後廠 " 模式,則大大增加了 MaaS 的難度。
突出重圍的持久戰
" 前店後廠 " 模式下,雲廠商既是生産者,也是銷售員;既是 ToB 服務生,也是 ToC 開發者。多重身份,不僅讓 MaaS 的競争要素和難度增多,而且也帶來了雲廠商與行業夥伴、客戶、開發者的種種沖突。具體來說有以下幾點:
想賺錢,隻靠基礎模型還不夠。
隻卷基礎模型,像 Azure OpenAI 服務那樣,以 OpenAI GPT-4、GPT-3、Codex 和 DALL-E 幾個精品爲主,是不足以滿足企業用戶、行業夥伴和開發者的需求的。對于國産 MaaS 服務商來說,還需要在重點領域,比如金融、教育、政務、工業等高要求、高頻次的行業類别上,也做出成熟的垂直大模型,來滿足大模型落地行業的需求。
比如騰訊雲的行業大模型精選商店,既提供混元大模型的調用服務,還上架了金融、文旅、零售等 20 多個領域的行業大模型。華爲雲、百度雲等也不例外,都在 " 通識教育 " 的基礎上,對大模型進行 " 專業課教學 ",減少大模型走向行業的門檻。
這就形成了第一個矛盾,雲廠商打造行業大模型,需要有大量人才、時間、資源與行業合作,每個重點行業來一遍,投入不菲,周期不短,增加了 MaaS 的盈利難度。但是,如果雲廠商不打造行業大模型,從基礎模型到 AI 應用之間的縫隙實在太大,ISV 服務商、集成商和開發者不敢走、不會走,大量需求根本無法滿足,也會限制 MaaS 的增長。
第二個矛盾,是算力的充沛與成本。
大模型訓練,算力是基礎。各個 MaaS 都将自身的算力集群規模和性能,作爲首要賣點之一。
我們要意識到,算力充沛對雲廠商來說,意味着極高的計算資源成本、能耗、運維成本等。大模型訓練,需要動辄千卡、萬卡的 GPU 集群,如果一台 GPU 服務器過熱宕機,整個集群都要停下來,訓練任務要重啓,這對雲服務商的硬件性能、運維能力等要求非常高,往往隻有幾大頭部雲廠商能支持。
爲了提升推理效率、降低成本,雲廠商們也在技術層面展開競速。比如爲了實現 AI 算力的極緻性能,華爲雲在基礎設施之上進行了針對 AI 雲服務的技術優化;騰訊雲打造了面向模型訓練的新一代 HCC 高性能計算集群;百度一直通過各種技術優化推理成本,文心 3.5 版本推理成本較 5 月剛發布時,下降到原來的幾十分之一。一味堆卡不是長久之計,降本增效才是賽點。
除此之外,基礎設施層面,雲廠商還面臨 AI 算力國産化、綠色低碳等現實考驗。其中,擁有自研芯片的華爲雲昇騰 AI、昆侖芯片的百度智能雲,能提供更穩定的底層算力,後續應該會有更多機會。而巨大的計算資源,需要用戶規模和使用量級來支撐,随着幾大基礎模型的優勝劣汰,屆時,誰的成本更高、模型使用量更低,就有可能出現資源閑置,屆時該如何回收成本,也是一個考驗雲廠商智慧的問題。
第三個矛盾,則是 MaaS 的教具與教學。
作爲 " 模型工廠 ",MaaS 平台需要提供大模型的全套全流程開發工具與套件,已經成爲行業共識了。
目前,頭部雲平台的準備也非常充分。華爲雲提供了盤古大模型工程化套件,覆蓋了數據工程、模型開發和應用開發三大環節。據稱,完成一個千億行業模型端到端的開發,從過去需要 5 個月縮短到現在 1 個月,整體速度提升 5 倍。百度智能雲的千帆平台,提供預制數據集、應用範式,以及其他幫助企業應用大模型的工具。騰訊雲的 TI 平台,同樣包括數據标注、訓練、評估、測試和部署等全套工具。
如此豐富的工具和平台,相當于把 " 教具 " 交到了行業客戶和夥伴手中,是不是就能實現大模型的工業化生産了呢?
顯然還不行。要訓練好一個垂直大模型,并不是一件簡單的事,有些行業企業的數字化程度高、人才隊伍強,能第一時間用好 MaaS 平台和工具,比如金蝶、中軟國際等。
但是,更多行業夥伴和企業客戶,就算有了這些工具和套件,沒有技術專家深入指導,沒有産品經理、項目經理、運營、程序員等手把手教學,很難搞定定制化需求。
騰訊雲的工作人員曾分享過一個案例,在攜手中央電視台打造 " 央視人工智能開放平台 " 時,面臨數據量龐大、形态複雜的問題,導緻傳統的數據标簽體系都無法達标。最後,騰訊雲重新構建了一套傳媒專屬的數據标簽體系,同時也研發了創新的 " 标簽權重引擎 ",讓數據标簽顆粒度更細,并按照核心度排序。在這套數據标簽體系支撐下,視頻編輯用自然語言就能實現跨模态檢索。
顯然,MaaS 模式也需要雲廠商具備 ToB 服務能力,這是一個慢活、苦活、累活。指望靠 MaaS 工具 " 躺着賺錢 ",至少目前階段,是肯定沒希望的。
" 前店後廠 " 的 MaaS 模式,還有一個隐含的矛盾,就是雲廠商也做應用,如何避免與行業夥伴和開發者争利的情況。
MaaS 平台上需要大量 AI 應用程序,雲廠商不可能全部自己開發,必須像 Appstore 一樣,引入開發者機制,鼓勵軟件企業或個人開發者,來一同基于雲平台創造 AI 應用程序。
但是,基于通用大模型能做出什麽樣的 AI 應用,還有很大的空白,所以雲廠商也會自己 " 打樣 ",上架一些 AI 應用。
比如百度智能雲的千帆 AI 原生應用商店,就上線了百度曦靈數字人直播平台、comate 代碼助手這類百度自己出品的應用,也有來自合作夥伴 WPS365、梧桐招聘助手等應用,并上線了應用精選推薦。
Appstore 曾被 Spotify 等應用開發者質疑,既當裁判員,又當運動員。那麽," 前店後廠 " 模式下的 MaaS 平台,也在做 AI 應用,就必須打消開發者的顧慮,隻做 " 抛磚引玉 " 式的創意型 / 代表性的應用,做好業務區隔,聯合售賣,幫助開發者打通商業鏈路,獲得經濟收益。
和移動互聯網時代開發 ios 或 Android 一樣,開發生态的繁榮,意味着内容和體驗足夠豐富,滿足用戶的訴求,用戶規模又會吸引更多開發者前來掘金,形成 " 馬太效應 ",讓應用商店持續繁榮,用戶和開發者都很難輕易切換到其他平台。
基于大模型的 AI 原生應用,也是如此。據百度智能雲的工作人員透露,百度智能雲爲什麽成爲業内第一個發布 AI 應用商店,就是因爲大家都有從衆的習慣,目前能做的,就是快,客戶的留存率也會更高一些。
MaaS 模式,雲廠商比以往更加需要生态夥伴。百度智能雲的千帆 AI 原生應用商店、騰訊雲行業大模型生态計劃、華爲雲多樣化的夥伴賦能,都說明,不卷應用卷生态,盡量聚攏開發者,是 MaaS 成功的前提。
可以看到,圍繞 MaaS 模式的競争,前程遠大,但道阻且長。一旦卷起來,各項成本都會直線上升,形成新的營收壓力。而如果不卷,就會眼睜睜錯過大模型及 AI 原生應用的機會,徹底沒了從基礎設施服務商 " 翻身 " 的希望。
MaaS 之于雲廠商,并不是一個進退兩難的選擇困境,而是沒有後路的背水一戰。關關難過關關過,終有守得雲開見月明的一天。