AI 風行一年,最大的市場機會,卻不在大模型本身。
2023 年,投身 AI 的入局者不少," 群模亂舞 " 之下,玩家大概可以分成幾類。
大模型時代的下策,是單做模型,意在用技術力擠開市場大門,片面關注在模型能力、參數,硬要對标技術前沿,做最 " 牛 X" 的大模型。
這類現象在去年上半年最火,ChatGPT 掀起的熱潮也捂熱了不少人的大腦,但實際做下來,卻總發現要拿下技術,終歸逃不開大模型的 Scaling Law,投入深不見底,技術差距也無法一時彌補;産品缺乏新意,難以做到與市場需求匹配,自然也難以維持高額的算力、人員支出。
而随着資本市場漸冷,去年,這一批人已經不少,倒在了理想主義的大門前,敗于 " 反複造輪子 " 帶來的生産力浪費。
而中策,是模型和産品兩手抓,用大模型能力帶動 AI 産品的開發,爲人工智能找一個能夠實際落地、産生價值的安身之所。
曾有人說,大模型當下的市場思路,是把一顆上好的松露,放進油紙袋子裏包好,放在顧客面前——無論多好的品質,吹到天上,食客不知道怎麽吃,也不知道怎麽才好吃;
而有經驗的廚師,會把松露輔以牛排、鳕魚、鹿肉等本就鮮美的食材,最大程度發揮松露的優點,把那些 " 傳統 " 的菜式 " 重做 " 一遍。
要制造出 AI 的殺手級應用,也是一個道理:讓 AI 發揮長處,用智能重新爲原有的場景賦能。如果能找到這樣一個恰到好處的結合點,很容易就能捧出下一個字節和拼多多量級的公司。
而歸根結底以上兩點,終歸不是上策。更大的格局,是用一個更龐大的體系,把無數的 " 殺手級應用 " 納入自己的下遊,以技術推動産業和世界的變革,在時代齒輪的扭矩中采掘一個數十年難得的機會——
一個用 AI 操作系統改變世界的機會。
一、人機交互每變革一次,就誕生一個萬億美元規模的機會
在過去一年間,與諸多 AI 業内精英交流的過程中,AI 科技評論總能聽到一個聲音:
人機交互,才是讓一家超級科技公司誕生的 " 金鑰匙 "。4 月 16 号在深圳舉辦的百度 2024 Create AI 大會上,百度集團執行副總裁、百度智能雲事業群總裁沈抖,講了這麽一個故事:
從最早期,人類與計算機的交互靠的還是布線闆,工人手動插拔電纜、轉動旋鈕,人機交互甚至是個 " 體力活 ";
而随着彙編語言、彙編器、高級編程語言和編譯器的出現,人類這才能用一種 " 類似 " 交流的方式,以一種 " 語言 " 和計算機溝通;
時間軸再次推進,很快,單機算力再難面對正急速增長的市場需求,雲計算應運而生,人類也不再滿足同時與一台機器 " 對話 ",而是要按需與多台機器形成的 " 集群 " 協作,把人機交互又推上了一個等級;
而到了今天,AI 大模型的出現,再次給人機交互帶來了新機會——以編程爲例,程序員不必再從語言學起,直接使用自然語言,在 AI 的幫助下,就能實現自己想要的功能;
也是如此,編程也就不再是人類與計算機 " 鬥智鬥勇 ",而變成了人對 AI" 許願 "。
在人工智能慷慨的幫助下," 人人都是開發者 " 的願景已經不遠。
回看這個過程,如同耕者在春季翻開土壤,無數的生機因此出現,每一次人機交互方式的新革命,帶來的都是一次科技行業萬億美元規模的契機。
抓住了這個機會,蘋果做出了第一台個人電腦,後又在移動互聯網時代引領風潮;微軟做出了第一個可視化的操作系統,又利用辦公軟件奠定了今天的辦公流;而在雲業務的加持下,亞馬遜在二級市場 20 年來狂漲近 300 倍,從一家電商平台起家,跻身今日頭部科技公司的行列 ……
細心觀察,人們會發現:這些萬億美元市值科技公司的誕生,都脫不開他們在技術革新的浪潮中,抓住了一個能夠改變人機交互方式的機會。
開頭提到,當下大模型勢頭正盛,如果單純把 AI 看作是一個技術或一個産品,那麽人工智能真正的潛力就仍未被完全挖掘;
相反,隻有把 AI 的能力和矩陣集成爲一個操作系統,管理硬件資源和軟件服務的運行池,提供對外的服務接口,并借此爲人機交互帶來新的變化,才有可能撬動這個萬億美元的機會。
而要做這樣一個操作系統,在人機交互逐鹿之戰中問鼎,又談何容易?
二、做 AI 操作系統,高性能異構計算是 " 硬門檻 "
" 大模型不是免費的午餐。" 在大會上,沈抖如此講道。想要讓 AI 操作系統能跑起來,算力是一個永遠無法跨過的話題。
去年年初,在一衆分析師的論斷中,算力并不是一個關鍵因素:畢竟算力是一個 " 金錢遊戲 ",隻要錢夠,能砸下來足夠多的卡,這個問題也就自然迎刃而解。
然而一年過去,越來越多的人這才發現,當模型參數量級越卷越大," 金錢遊戲 " 所需的金錢量級,也正在超出大多數公司能承受的範圍。
如此,算力問題,單靠 " 砸錢 " 也就再難得出一個令人信服的答案。
連 AI 大模型的 " 領頭羊 " —— OpenAI 的 CEO 山姆 · 奧特曼都不僅一次公開抱怨手裏的算力不足。至少在當下看來,算力問題正強硬地制約着 AI 的發展速度。
大模型的計算也需要 " 降本增效 ",降低算力浪費是一個重要的途徑。
如何讓萬卡集群如同一張卡一樣 " 通力合作 "、讓性能可以線性擴展、任務間不産生間斷,這給 AI 操作系統的算力集群設計、調度和容錯提出了巨大的挑戰。
而新近推出了 AI 操作系統 " 萬源 " 的百度,正通過萬卡集群上的有效訓練時長占比超過了 98.8%,線性加速比和帶寬有效性都達到了 95% 的 " 尖子生 " 成績,讓業界看到了新希望。
(百度智能雲發布新一代智能計算操作系統——萬源)
而僅解決算力浪費問題,似乎還并不足以一勞永逸地完成大模型的 " 降本增效 " ——在國内," 禁運 " 帶來的影響還在持續,要湊齊運載大模型所需的萬卡算力,使用多種性能不同的芯片異構計算,幾乎成了一個必選項。
異構計算,讓不同廠家、不同代際、不同性能的芯片互聯互通,是一個巨大的難題。
過去的通識是,異構計算隻能用不同的芯片解決不同的任務;要把型号不一而足的芯片,放進同一個任務裏——尤其是訓練任務——幾乎是天方夜譚。
要迎難而上,解決異構計算的效率問題,就不得不需要一點 " 黑科技 "。
而要做 AI 操作系統,百度在算力層的底氣,就是他們已經解決了這個 " 不可能 " 的難題,屏蔽掉了不同芯片之間的差異,更是給了用戶選擇芯片組合的自由權。
在百度的異構計算平台 " 百舸 " 上,單一訓練任務下,多家廠商的上萬張芯片相互協作,百卡性能損失 3%,千卡損失不超過 5%,硬生生用技術把異構算力協作的效率提了上來。
也正是如此,芯片的 " 卡脖子 " 難題也就此被百度化解:不僅可以擺脫對單一芯片的依賴,創建一條更具彈性的供應鏈,把風險降到最低;還可以讓成本更加可控。
百度的解決方案,一是将底層通信和上層算子的優化和實現拆分開,讓專業的人做專業的事,自己專門負責底層加速庫 AIAK 的開發,給異構計算搭好一個 " 大舞台 ",讓各家芯片來到百度的集合通訊庫都可以跑通;
二是在加速庫裏做好并行框架的實現,優化并行策略,通過自适應算法自動實現 TP(張量模型并行)、MP(模型并行)、PP(流水線并行)不同的并行策略的參數設定,迅速拿準并行化策略,處置訓練任務的底層設置。
三是在卡間通信上,整合網絡協議,GPU 層面上主要通過 NVLink,而當算力走出機器,百度主要使用的還是 RDMA,對于一些特殊的芯片,百度也有一些相當具體的實現策略。
既然短期内多款芯片并存是現實局面,那麽與其怨天尤人,不如主動擁抱。百度讓 " 百舸 " 争流,主打的就是主動擁抱多樣化的芯片生态,在異構計算上做到極緻。
脫離了 " 雲 " 的硬件,AI 操作系統的實現也就成了 " 空中樓閣 " ——而雲智一體,協同軟硬件優化也正逐漸成爲不少實力的大玩家的共識。
而要跑到一萬張卡,要讓一萬張卡跑到同一個任務裏,還是多家芯片組成的 " 多國部隊 ",對于任何公司來說,都是個難以逾越的鴻溝。
今天的百度,已經跑出了一條路一雲多芯、單任務多芯片的異構之路;
(業界領先的單一任務一雲多芯大模型訓練解決方案)
而其他玩家想要跑通這一套體系,進而在這一套體系上打造新的 AI 操作系統,在 AI 和雲計算領域多年的積累和落地則必不可少。
三、工具鏈," 低成本 " 有 " 高難度 "
如果把計算能力看作 AI 操作系統的 " 内核 ",那麽工具鏈就是鏈接着開發者與 AI 的 " 中間層 "。
歸根結底,算力和大模型再強,使用者用不順手,沒法把大模型用進場景,将 AI 的能力用到極緻,AI 的操作系統就也隻能是空談。
到了這一層,AI 操作系統面臨的就不再隻是一個技術難題。如何理解廣闊市場和紛繁複雜的場景,也成爲了一個必須被回答的問題。
一方面,面對不同預算和需求的用戶,AI 操作系統必須足夠靈活,給出多種能夠最高效解決問題的方案。
盡管去年以來,市場對大模型原生應用的需求正不斷地提升,但在使用中," 性能、速度、價格 " 的 " 不可能三角 ",也讓不少人望而卻步——
如果隻用一個模型,參數規模小了解決不了問題,參數規模大了又難以打平成本、滿足高并發的需求。
這也就要求 AI 操作系統的提供方,不能一味抱持着一以貫之的思路,面對不同的場景,要提供不同規格的基座模型選擇,不讓用戶在操作系統裏花冤枉錢。
以百度爲例,在已經獲得了不少認可的文心 4.0 基礎上,千帆團隊又訓出了 ERNIE Speed、Lite、Tiny 3 個不同量級的輕量化模型,分别針對不同用戶對大模型的不同需求。
而在 ModelBuilder 提供的模型路由服務之下,針對不同難度的任務,AI 操作系統萬源也可以自主選擇最合适的模型完成調用,實現效價比的最優,在效果基本持平的情況下,将推理成本下降了 30%。
而在自有模型之外,千帆也支持 LLaMA、Baichuan 等等第三方的模型産品,主打一個 " 客戶想要什麽,我們就提供什麽。"
一方面,大模型讓人機交互方式走向自然語言,背後也需要一整套的 AI 能力和工具的支持。
一個更好的 AI 操作系統,要讓用戶可以更輕松簡便地完成應用的開發,甚至隻需輸入一小段對應用功能的描述,甚至不用寫一行代碼,就可以獲得實際解決自己需求的應用。
在百度的萬源體系下,内置的 AppBuilder、AgentBuilder 兩個應用開發平台,不僅已經讓上述的想象落進了現實,而且兩個平台的 SDK 也支持二次開發,讓開發者細緻入微的個性化需求得到滿足。
不僅如此,以百度 AppBuilder 開發的應用,可以一鍵發布至百度搜索、微信公衆号等平台,讓應用的分發不再困難;也可以通過 API 或 SDK 的方式集成到自己的系統中。
另一方面,紛繁複雜的場景,使得模型的精調和完善的工具組件體系成爲了必要。
在百度萬源中,支持開發的工具組件數,已經上次的 11 個,高速增長到了 54 個。其中大模型的組件、 AI 能力的組件、插件工具以及數字人的組件等等種類多樣,不一而足,同時還支持一次鑒權全部接入,省去不少繁瑣的手續。
如同搭積木一樣,用戶搭配組合不同的組件,拼裝之後就可以成爲一個工作流,完成符合自己使用需求的大模型定制。
一個人如果長年從事 To B 生意,大多都會發現,To B 的底層邏輯總是 " 樸實無華 ":如何花小錢,辦大事。
" 簡單是終極的複雜。" 沈抖用這句話開始了自己在 Create AI 開發者大會上的演講,就是意在減輕開發者的負擔,爲用戶提供極簡的開發體驗。
當下,百度整個大模型平台的服務客戶數在一個多月裏又增長了 1 萬,已經突破了 8.5 萬。通過千帆精調的模型數,則漲到了 1.4 萬,而開發的應用數現在也超過了 19 萬。
便宜易用的工具鏈,讓百度的 AI 操作系統體系已經有了一個不淺的用戶池子。而積累起了用戶,生态怎麽做,則又成爲了百度萬源的 "One more thing"。
四、做生态,要 " 譬如北辰 "
操作系統的成功,絕不隻是技術上的成功。
十幾年,智能手機剛剛問世,也并不隻有安卓、IOS 兩家獨大——塞班、黑莓、Windows 等等大批的操作系統百花齊放,激烈競逐。而在厮殺的最後,隻有安卓勝利了。
究其本質,還是得開發者得天下。
而得到了開發者,怎麽把開發者留在操作系統裏?怎麽讓開發者找到用戶?賺到錢?這也考驗着 AI 操作系統開發者在市場領域的能力和資源。
在 AI 時代,市場角度上 " 客戶 " 和 " 夥伴 " 的概念,正因爲被進一步降低了的開發門檻而模糊。對于 AI 操作系統的開發者生态,一個點是把他們引進來,一個點是把他們留下來。
引進來,靠的是直接的激勵,以及加入平台的便捷程度。這就要求 AI 操作系統足夠開放,也能投入足夠的成本用于激勵,開辦開發者大賽,讓更多人加入進 AI 原生應用開發的行伍。
在争奪開發者的大戰中,AI 操作系統的先發優勢顯然更加明顯——一方面是能夠首先獲得一個更大的開發者群體,并且讓他們更早在平台上完成産品,獲得收益;另一方面是觸達 AI 原生應用的 B、C 端用戶更早,也能更早讓開發者形成粘性,留在 AI 操作系統上。
而提到先發優勢,就又不得不提到百度。無論在大模型技術、大模型生态,還是 AI 操作系統上,百度都是國内一衆跟進者的領頭羊。
在千帆的應用商店上,已經有 300 個 AI 原生應用上架,而第一批上線的 App 已經開始拿到了分潤。
而要讓人留下來,就得讓開發者能夠在平台上持續地獲得商業收入和正反饋,最終實現用 AI 操作系統的 " 發家緻富 " ——這才是 AI 操作系統能夠提供給開發者的核心價值。
比如,在千帆平台上賣的最好的,是一個叫 ChatPPT 的演示文檔助手,依靠親民的價格和好用的功能,百元左右的價格,至今已經售出了上千單。
而有一家公司,短短一個月的時間,就在千帆發了 20 多款應用,涵蓋背古詩、寫作文、市場營銷、繪圖,一個月的淨利潤就有幾百萬。
如果簡單的工作就能帶來不錯的收入,開發者怎麽會不願意留在平台上?
盡管已經有了不錯的成績,但要扭轉用戶的使用習慣,終歸還是一件不容易的事情。
一方面讓開發者看到 AI 的價值,另一方面也要實打實地給開發者帶來生産力的提升和經濟上的收益。
而萬源的生态體系還不僅如此:
對上,萬源鏈接開發者,通過不斷更新的能力和接口,讓 AI 原生應用大繁榮;
對下,萬源鏈接芯片廠商,擴大芯片适配的隊伍,給開發者提供更簡便易用的異構算力;
向左,萬源可以鏈接企業用戶,讓他們可以基于萬源個性打造自己的 AI 操作系統;
向右,萬源則鏈接智算中心,把更高效的計算方案推廣給更多的用戶。
這條路,如同《論語》中說的 " 譬如北辰,居其所,而衆星共之。" 用更好的生态,将産業鏈路中的每一環都圍繞在 AI 操作系統的身旁,進而創造一個以 AI 爲軸的更廣闊的生态系統。
結語:1+1>2
技術、産品、市場矩陣,要做成一個 AI 時代的操作系統,這三者一個也不能少。
作爲中國第一個提出 AI 操作系統概念的大廠,百度的萬源看起來似乎并不是一個新技術、新産品,而更像是當下百度智能雲技術産品體系的又一次整合。
有人或許會問:這隻不過又是一個新概念,拼拼湊湊算什麽操作系統?要說 AI OS,集成了 New Bing 和 Copilot 的 Windows 才算是真正的 AI 操作系統。
而事實上,萬源的提出,很可能是百度在 2024 年最令人激動的新動向:将諸多技術産品在操作系統上兵合一處,正很好地向外界展現了百度作爲一家 AI 大廠,在人工智能領域上 " 舍我其誰 " 的野心。
而之所以沒有選擇 Windows 的形态,而選擇了 To B,百度萬源對标的反而是微軟的 Azure,做自己更擅長的賽道,找離錢更近的領域。
去年,不少人大談 AGI,夢想着在未來,人工智能将如同科幻小說裏寫的那樣,改變世界;
而仍有不少人," 枯燥 " 地打磨技術和産品,深入行業和場景,隻做最落地的事情——他們也要改變世界,而且他們要在今天就一點點地改變世界。
操作系統,是科技界在人機交互上的又一次爆炸性的機會。而要抓住這個機會,就必須用一整套體系形成規模效應,讓 1+1>2。
在未來,用 AI 操作系統提供全棧 To B 服務,一站式解決用戶的問題,必然是優秀 AI 大廠的大勢所趨,也是雲大廠轉型的必然方向。
其他雲大廠要加入這場競争,不僅需要有足夠優質的大模型作爲支持,還要有足夠深厚的雲技術、場景積累,能做 " 模型 - 開發 - 市場 " 的全鏈路支持。如同一個水桶,不能有一塊短闆。
把萬源 AI 操作系統當成一塊沃土,在上面長出的應用——無論是百度來開發,還是其他開發者來開發——都能夠以多種多樣的形式,走進 B 端和 C 端的很多場景,進而帶動公司在雲領域上的收入。
如此看來,萬源稱得上是百度智能雲最堅實的基石。
" 我們終極的成功," 百度集團副總裁侯震宇在接受采訪時講道," 就是希望我們的 ModelBulider 能夠身材更多的模型,我們的 AppBulider 能夠産生更多的應用,這就是我們最大的理想。