文|戴菁
一年一度的百度世界大會,已經成爲觀察百度 AI 戰略動向以及行業趨勢的一個窗口。
在 2024 百度世界大會上,李彥宏看起來比去年更爲笃定。他說,基礎模型能力就緒,我們即将迎來 AI 應用的群星閃耀時刻。
當 2023 年下半年大模型混戰逐漸出現分野,李彥宏就提出「卷模型不如卷應用」。但從随後的行業發展動态來看,國内應用之「卷」集中在了類 ChatGPT 的 AI 助手層面,其他領域出現颠覆式創新的 AI 應用鳳毛麟角。
其中一個原因,創新是有認知門檻的,開發 AI 應用也是有技術門檻的。
或許是意識到了這一點,李彥宏和百度今年進一步向大模型戰略聚焦,押注智能體的爆發。
如果現在要問百度的第一性原理是什麽,答案越來越清晰——應用驅動。李彥宏還給這個「應用驅動」加了一個有别于移動互聯網時代的注解,「不是要推出一個‘超級應用’,而是要不斷地幫助更多人、更多企業打造出數百萬‘超級有用’的應用。」
01
「做工程不丢人」
過去 24 個月,萬衆期待的 AI 超級應用還是沒有蹤影。一些人不禁懷疑:全球性的大模型狂熱究竟是一場新的技術革命,還是新一輪泡沫?
但如果默念茨維格在《人類群星閃耀時》中所寫的:「那些曆史的尖峰時刻都需要太長的醞釀時間,每一樁影響深遠的事件都需要一個發展的過程」,旁觀者或許會更笃定一些。
作爲這股 AI 浪潮最早和最深的參與者,李彥宏提前看到那個「尖峰時刻」。他對 AI 應用即将爆發的判斷,主要依據有兩個:
其一,底層技術突破。過去 24 個月,AI 行業最大的變化是大模型基本消除了幻覺,回答問題的準确性大幅提升。基于檢索增強技術的進展,百度年初切入 iRAG(image based RAG)——即檢索增強的文生圖技術,進一步讓文生圖也能消除幻覺,從而讓 AI 在影視、漫畫、連續畫本、海報制作等領域落地。
▲根據「愛因斯坦在天壇」提示詞生成的圖片
左爲文心 iRAG 作品 右四均爲其他大模型生成作品
其二,大模型調用量爆發,開發者覺醒。今年 5 月,文心大模型 API 日調用量達到 2 億。當時百度高管們在會上讨論一個問題,大模型怎麽就算「成了」?李彥宏給出的量化指标是,日均 API 調用量一年内漲 10 倍。這說明大家是真需要。到 11 月初,文心大模型的 API 日調用量超過 15 億,比預期發展快了不少。
還有一個現實原因是李彥宏會上并未展開的——調用成本。過去兩年内,大模型每個 Token 的使用成本下降了超過 99%。以美國爲例,現在大模型處理 100 萬個 Token 的成本僅爲 60 美分。在國内,百度的一些模型甚至免費提供。
從會上傳遞的信息來看,百度目前重點押注兩大應用方向:面向 to C 端的智能體,以及面對 to B 端的産業應用。
據我們觀察,在 to C 端,大模型技術應用的廣度可能比技術樂觀派的預期還要高,因爲許多使用場景并不局限于 App 等傳統産品形态。
可以說,AI 應用場景無處不在,但産品形态未必跟從前一樣。去年在大模型爆發之初,人們就憧憬着 AI 的 iPhone 時刻将在大模型領域複刻,諸如移動互聯網時代的《憤怒的小鳥》、Instagram 等超級應用,也會很快在大模型領域出現。
一年後,超級 AI 原生應用還沒有出現,但新的共識逐漸形成:智能體将會成爲 AI 應用的主流形态——
數月前,OpenAI 發文稱,在谷歌、蘋果等科技巨頭的帶動下,2025 年将是 AI Agent 最終成爲主流的一年。在百度世界大會上,李彥宏再次給出智能體的判斷:智能體是大模型最重要的發展方向,即将迎來它的爆發點。
按照 AGI 的進化順序框架,智能體被視爲 Copilot 的下一個階段,它們具備一定自主性,能夠執行長期任務,比如與環境進行多次交互、協同工作等,并且擁有自我進化能力。
目前全球很多頂尖科技公司都在關注智能體,但李彥宏在會上透露,百度已經把智能體作爲大模型的最重要戰略方向。
理由就在于,智能體的門檻足夠低,天花闆又足夠高。去年行業已經意識到應該卷應用,但具體怎麽做、怎麽從模型變成應用,這裏面有太多不确定性,也讓很多人望而卻步。從移動互聯網時代的産品形态變化來看,每一次降低産品門檻,都會帶來一個應用範式的爆發。最典型的是從 App 到小程序的遷移,微信生态從中受益匪淺。
智能體也有相似之處。當平台爲開發者提供了一個高效、簡單的路徑,在大模型上構建智能體越來越方便,「勢」就會彙聚起來。像文心智能體平台上,目前已吸引了 15 萬家企業和 80 萬名開發者,每周都有上萬個新的智能體被創造出來,其中還有 11 歲小學生創造的智能體,然後通過搜索和其他渠道分發出去。
不過從李彥宏的發言來看,百度不是要推出一個超級應用,而是要幫助更多人、更多企業打造數以百萬「超級有用」的應用。
言外之意,百度在 AI 時代的生态護城河寬度,未來要靠這些應用來構建了。
由此就不難理解,爲什麽 AI 領軍人物中沒有比李彥宏更着力于應用落地的人了。百度的 AI 優勢,更多體現在底層技術和模型層。而技術的成功與否,最終取決于它在真實生活中的應用。就像 DeepMind 創始人、微軟 AI CEO 蘇萊曼在最近的一次交流中所強調的,一個沒有明确用途的 AI 模型,不過是一個引人入勝的計算機科學展示。
02
「自由畫布」式的智能體
開始湧現
智能體的爆發離不開「有用」。
李彥宏此前提醒,要避免掉入「超級應用」的陷阱。在 AI 時代,「超級能幹」的應用恐怕比隻看 DAU 的「超級應用」更重要。
結合國内主要智能體平台上的案例來看,目前公司類智能體、角色智能體、工具類智能體、行業智能體是幾個主要發展方向。
這其中,公司類智能體被認爲是于 AI 時代的公司官網。結合百度的搜索引擎底色,我們認爲,這一類智能體是百度搜索的增量機會所在,公司類智能體是百度升級與 KA 客戶關系、提供更多價值的一個觸點。
據百度官方數據,比亞迪的官方智能體上線後,銷售線索轉化率提升了 119%。
不過在整場世界大會中,參會者最感興趣、最能讓人眼前一亮的當屬工具類智能體「自由畫布」。這個由百度文庫和百度網盤聯合發布的 AI 創作新物種,在面向公衆開啓邀測首日,已吸引超 20 萬人排隊預約。
根據現場演示,「自由畫布」就是一個由文心多模态大模型加持的萬能白闆,是百度文庫、百度網盤行業首創的内容操作系統。
通過大模型技術,「畫布」打通了公域與個人授權的私域内容,通過「一拖一圈」的極簡操作,實現對多格式、全模态文件的混合理解、生成、創作,并支持對富媒體文檔的一鍵分享和存儲,實現了輸入、編輯、創作、分享自由。
今年 9 月,百度集團宣布,網盤 C 端業務重新劃歸移動生态事業群組(MEG),并由百度副總裁、文庫事業部負責人王穎接管。如果當時不少人還對這一決策邏輯感到不解。如今「畫布」揭幕,通過 AI 能力進一步打通和重構,文庫和網盤已經成爲全新的智能生産力。
在上述四類智能體中,從商業化角度,《降噪 NoNoise》同樣關注行業智能體的前景。僅以保險行業爲例,此前有專注大模型 to B 方向的 AI 創業者告訴我們,在這個 30 萬億規模的市場,部分保險經紀人的傭金能占到客戶投保金額的 20%-40%。如果大模型将保險專業知識沉澱爲 AI 産品,繼而能在一些簡單險種上爲客戶制定投保方案,會非常有前景。
比如号稱「免費 AI 律師」的法律智能體「法行寶」,上線半年已經回答超 1660 萬個法律問題。産品信息顯示,該智能體由百度自己下場創造的,主界面提供對話交互以及法律計算器、智能法律文書、在線法律意見書等免費工具,還有相似判決案例鏈接可以查閱。
比如用戶可以就一起交通事故、一次工傷,詢問賠償方案、如何計算索賠金額,也可以請智能體代寫一份起訴書。以往有這些法律咨詢方面的需求時,普通人要麽付費求助于專業律師,要麽自己在繁雜的互聯網中搜索,但要同時承擔信息不全或者不準确的風險。
當然也有律師指出,基于專業知識積累和個人經驗而提出的法律策略、分析判斷等專業法律服務,是 AI 目前還很難做到的地方。
換個角度想,這或許正是智能體未來的想象空間,因爲智能體本身是一個有自主性、會持續學習和進化的産品形态。
關于這一點,OpenA 聯合創始人山姆 · 奧特曼也有預警。在最近一次專訪中,他不忘提醒創業者:通過更快地擁抱新技術,你可能會獲得短期的爆發式增長,但長期來看,你仍然需要構建一個能持續提供價值的産品或服務。「每個人現在都能做出非常棒的演示,但要真正構建一個成功的商業,那才是關鍵所在。那是最艱難的部分,而商業規則仍然适用。」
據我們了解,目前文心智能體平台已經逐步跑通商業閉環,實現智能體從開發,到分發,再到變現。單個智能體的單次轉化最高收入達到了 10 萬元,其背後是鏈接挂載、商品轉化、線索轉化、聯盟廣告和膠囊位等商業組件的全方位支持。
03
長期主義、理想主義、現實主義
缺一不可
中美 AI 巨頭經常被拿來對比。相比美國 AI 同行對于 AGI 的宏大願景、以科學研究和底層突破爲驅動的做法,從世界大會上的表态來看,百度是典型的工程思路、應用驅動。
會後接受《甲子光年》專訪時,李彥宏直言,「做工程不丢人。做工程很有可能是比科學更早發現機會、發現規律的。」就像飛機是先飛上天了,人們才開始研究,原來有一個東西叫空氣動力學。所以百度的 AI 路線是優先解決大家在場景和應用中遇到最多的技術問題。
乍看上去,這與李彥宏的社會标簽有一定反差。百度 10 年 1700 億研發投入的故事已經爲公衆所熟知,李彥宏的「長期主義」、「未來主義」标簽也早已得到業内認可。
比如去年 9 月,李彥宏同馬斯克、黃仁勳、奧特曼一起入選《時代》周刊全球 AI 領袖時,《時代》的評語就是,「李彥宏是中國最傑出的未來主義者,長期投身于 AI 發展的浪潮。」在近期沙利文發布的《2024 年全球 AI 生态全景概覽》報告中,百度被列入 AI-Native Giant,與谷歌、OpenAI 位于同一象限。
未來主義少不了理想色彩,但應用驅動的策略看起來又很現實。
看似矛盾的地方,或許取決于參與者如何看待人工智能革命的本質。如果 AI 會帶來一次新的工業革命,那這場變革不是三五年就能結束的,可能會在未來幾十年持續向社會的方方面面去滲透。作爲置身其内的變革參與者,既需要耐心,也少不了源源不斷的、真金白銀的投入,然後以商業上的成功、生态上的高牆,保持在全球競争中的頭部位置。
正如李彥宏在此前受訪時所預判的:未來兩到三年,AI 競争會非常激烈,「至于說誰會是最後的赢家,我的看法是誰賺錢誰就能活下來。」
這或許是李彥宏不厭其煩的布道、呼籲大家做智能體、把 AI 用起來的一個初衷;也是百度一邊自己下場做「自由畫布」「法行寶」等智能體應用,一邊做工具、做基礎平台,不斷去降低開發者應用開發門檻的動機。
比如世界大會上的另一個重磅發布——無代碼開發工具「秒哒」,這個被李彥宏稱爲「迄今爲止人類曆史上最複雜的多智能體協作工具」,爲的就是讓每個人都具備程序員的能力,會說話就能做出應用。此前在設計領域,海外的 Cursor 和 Replit 等産品已經實現在不敲代碼的情況下,隻靠用戶的自然語言指令就能生成應用界面。
▲百度發布的無代碼工具「秒哒」,隻要用中文描述需求,并補充一份帶有大會時間地點主題的文檔,就可以指揮多個智能體協作,完成報名系統的開發。
這類工具又個共通的底層邏輯——讓普通人靠創意就能賺錢。如果類似想法能夠落地,AI 應用無疑距離大規模爆發更近一步。我們也注意到,盡管「秒哒」明年一季度才會上線,據悉已經吸引超過 5000 家企業排隊測試。
沿着前面的思路,同樣可以理解百度爲什麽沒在 OpenAI 的 Sora 驚豔出場後,投入到中國版 Sora 的競争當中。在李彥宏看來,Sora 和多模态是兩回事。Sora 本質上是任意場景下的視頻生成能力,這件事非常有意義,但真正做到需要長期燒錢。
但這并不意味着百度不做多模态,「我們非常非常看好多模态,也在多模态上有非常長期的投入,在真正有應用場景的地方,我們的多模态能力是非常強的。」 百度隻是選擇更落地的方向推進。比如「自由畫布」,便是多模态 AI 功能 all in one 的平台。
李彥宏在大會當日的專訪尾聲被問及有何寄語,他談到,人工智能的革命不是三五年就結束,它更像是三五十年對于社會的全方位重構。需要長期主義、理想主義和現實主義三者相結合。
對于百度來說,未來與現實,或許正是 AI 戰略的一體兩面。
參考資料:
[ 1 ] 《對話李彥宏:應用驅動是百度的第一性原理,基礎模型兩年一個大版本就夠了》,甲子光年
>