前些天的百度世界大會上,百度 CEO 李彥宏很意外地沒有提到兩個詞:AGI 和 Scaling Law。
AGI 的全稱叫「通用人工智能」,它能夠和人類一樣處理各種各樣的任務,是計算機科學家們所想要實現的終極目标之一;而 Scaling Law 則是一種現象,即 AI 的能力會随着模型大小、數據量、訓練量的增加,而不斷攀升,是實現 AGI 的重要手段之一。
在大模型尚火爆的年初,這兩個詞一度随處可見。許多企業都将他們印在 PPT 中,用來标榜自身的技術信仰。
這次百度世界大會,對李彥宏來說,這兩個詞的吸引力并沒有那麽大。在大會期間,李彥宏參與了一場圓桌訪談,他在期間提到,「沒有跑到我心裏,讓我覺得重要到需要在百度世界上一定提一提。」
當然,這并非意味着百度沒有技術信仰。衆所周知,百度是中國第一家成立 AI 研究院的企業,并在十多年間招募了大批赫赫有名的計算機科學家。去年時代周刊評選的「AI 100 人」中,李彥宏更是爲數不多上榜的中國企業家。
作爲人工智能底蘊最深厚的中國企業,百度眼中的技術信仰,到底是什麽樣的?
01 從 1 到 1.1
圓桌論壇上,訪談者抛給了李彥宏一個略顯尖銳的問題:大模型技術的進步是否放緩了?
畢竟在過去一年,社會大衆對大模型的關注度肉眼可見地降低。許多外界聲音認爲,這和技術叠代放緩有很大關系。在李彥宏看來,這一判斷,既對,也不對,取決于看問題的視角。
前面曾提到,大模型能力的增長,很多時候是由模型大小、數據量、訓練量的增長拉動的。然而,由于當下模型規模、數據量都因素漸漸觸頂,其能力的湧現确實沒有前幾年進步那麽大。
「如果就當做一個學術項目,北極星指标就是「哪一年或哪一月能實現 AGI」的角度看,可以說技術進步的速度有所放緩。」李彥宏說道,「但我的視角更多是在應用,大模型的技術進步到底産生了什麽應用。從這個角度來說,我認爲技術進步的速度不僅沒有放慢,甚至有變快趨勢。」

事實上,大模型從「走出實驗室」到「放上貨櫃」,中間還有海量工程問題要解決。其中一個關鍵問題,正是「幻覺」,即大模型有時會一本正經的胡說八道。
過去兩年,以百度爲代表的 AI 企業,其實一直在緻力于消除幻覺。
對此,行業所交出的答卷,叫 RAG(檢索增強):簡單來說,就是讓大模型在說話之前,先從外部資料庫檢索相關内容,然後再結合這些内容輸出回答。李彥宏在百度世界大會上宣布,大模型已經基本消除了幻覺。

并且基于這項技術,百度還推出了專門針對圖像生成的 RAG 技術,叫 iRAG。過去,當 AI 生成圖像時,有時會犯一些事實性錯誤,例如把隻有三層的天壇畫成四層,大大影響了可用性;然而,随着 iRAG 的加入,文生圖的準确性大幅提升了,防止了 AI「瞎畫」。

大衆對技術的關心大多都是好奇心主導,更熱衷于「0 到 1」的「科學突破」。然而,在改變世界的過程中,「從 1 到 1.1、1.2、1.3...」的工程改進,同樣是必不可少的。
從中也可以看出,百度的技術信仰顯然有着務實的一面。AGI 并非不重要,而是百度在長期探索人工智能技術邊界的同時,并沒有死磕 AGI,更強調用新技術來解決各種現實問題。
「很多美國同行,他們做法是把它當做一個 science,有一個終極目标,就想盡各種辦法解決它。我們是把它當做一個問題,可能通過工程的方法,也可能用其他方法來解決。」李彥宏說道。
并且他提到,「做工程」、解決現實問題,有時會比科學更早發現機會和規律。
例如當年,先是萊特兄弟開着飛機上了天,人們才意識到有個東西叫空氣動力學。而今年的諾貝爾化學獎,更頒給了 DeepMind 創始人哈薩比斯這位企業家,進一步印證了這個判斷。
不過,具體到怎麽做,除了前面提到的消除幻覺之外,李彥宏與百度還有别的思考。
02 過河的石頭
在大模型剛剛成爲顯學的時候,産業界曾有這麽一個讨論:誰會做出第一款超級應用?是資源更充足的大型科技企業,還是外頭的不斷湧現的開發者?
李彥宏也思考過這個問題,而他更傾向于後者。
他在内部講話中提到,百度可能會同時做十款或者最多一百款應用,然而外界可能會有一萬家創業公司在嘗試各種不同的賽道,誰的可能性更大,答案不言而喻。所以,百度應該将主要精力,放在底層大模型等基礎平台上,讓開發者能夠更容易地在上面開發應用。
由此可見,百度在利用技術解決現實問題的同時,并沒有執着于閉門造車,而是傾向于和外界開發者一同探索。
然而,大模型終歸是個新事物,底層平台與開發者的合作模式仍有不少不合理的地方。李彥宏在不斷摸索的過程中,意識到底層模型的叠代速度,應該保持一個合理的節奏。
此前,産業界其實存在一個問題:底層模型叠代得有些過快了。
熟悉技術的人或許知道,大模型内部是個黑盒。不同于傳統軟件,大模型的結構過于複雜,我們很難去追蹤和理解,大模型到底是如何從特定的輸入生成特定的輸入的。這也意味着,對開發者來說,大模型的能力邊界在哪,其實并不清晰;想要了解大模型到底能勝任工作,需要時間去摸索。
過快的叠代,會讓外界開發者難以跟上節奏。更糟糕的是,過快叠代底層模型有時還會對開發者的産品産生不小的沖擊。
最典型的案例,莫過于美國曾經的 AI 獨角獸 Jasper。這家初創企業最初的産品,是基于 GPT-3 開發的、面向廣告營銷領域的聊天機器人。然而,随着能力更強大的 ChatGPT、GPT-4 陸續推出,Jasper 的産品很快「過氣」,對公司造成了不小的沖擊。
因此,李彥宏提出,更合适的節奏是兩年一個大版本。
從一步步改善底層基礎模型,到探索新的開發者合作模式,百度顯然已經形成了一套範式。也是受益于此,百度開發者的生态正日益壯大。當下,百度文心大模型的日均調用量已經超過 15 億,這一數字在半年内增長了超過 7.5 倍。在産業端,百度智能雲已經擁有中國最大的大模型産業落地規模,超過六成的央企和大量的民營企業,正在聯合百度智能雲進行 AI 創新。百度智能雲千帆大模型累計幫助用戶精調了 3.3 萬個大模型,開發出了 77 萬個企業級應用。

毫無疑問,率先蹚水前行的百度,俨然已成爲一塊值得後來者摸着過河的石頭。
那麽問題來了,爲什麽是百度做到了?
03 兩條腿走路
衆所周知,人工智能的黃金時代始于 2012 年:彼時,「AI 教父」辛頓所打造的 AlexNet 展現出了驚人的圖像識别能力,引發了産業界的大力投資。然而,人工智能并非從此就踏上了康莊大道,期間其實兩度面臨降溫,一次是 2020 年前後,另一次則是當下。
這其中,百度是少數能夠穿越周期的 AI 企業。百度之所以能做到這一點,核心依舊與它的技術信仰有關。
百度對 AI 的熱情并非「臨時抱佛腳」,而是長期以來的,并且相信它會改變世界。在那個大廠紮堆搞電商、共享單車的移動互聯網時代,百度是少數公開宣揚人工智能的大廠,李彥宏更是逢人都要聊幾句 AI。
「百度信 AI,不是今天才信,也不是兩年前信,是十幾年前就信這個東西。所以文庫的改造也好,或者說非常堅決地做一些在大家看來是全新的東西,沒有太受 legacy 的束縛。我們真正的 legacy 就是我信 AI,一旦你把這個東西當成 legacy,這些東西其實就都很好解釋,因爲就是在做我們多年前一直想做的事。」李彥宏在圓桌論壇上說道。
所以,百度在發力 AI 時,一直都是「兩條腿走路」:
既探索科學技術的邊界,對其充滿敬畏;同時也善于利用工程能力,并積極嘗試使用新技術改變世界。用句略俗套的話來形容,就是「仰望星空,腳踏實地」。
一方面,百度并不吝于投資探索前沿科技。
因爲李彥宏認爲,科學家可以提供 vision(願景),他們往往比大多數人看得更遠。近兩年大語言模型能夠爆發,正是因爲有科學家看到了 Scaling Law 的潛力。
因此,百度的團隊中一直充斥着各種頂級頭腦。知名計算機科學家吳恩達(Andrew Ng)就曾在百度擔任過首席科學家。此前,曾在 Google 任職,然而 Google 不願給他買更多 GPU,因爲太貴了。面對吳恩達的困難,李彥宏隻說了一句話:你來,随便買。

而在吳恩達之後,包括 Anthropic 創始人 Dario Amodei 等技術大牛,也相繼加入過百度。時至今日,百度的團隊中依舊有許多學術成果斐然的計算機科學家。
另一方面,正如前文提到,百度也一直在讓人工智能變得「能用」,乃至「好用」。而且百度并不是從當下才開始做這些事情,早在最開始,百度就在積極探索人工智能的各種可能性,例如自動駕駛等等。
不僅如此,百度也一直鼓勵内部的工程師、産品經理等等,到市場中去尋找人工智能技術的商業價值。
技術信仰與長期的投入,構成了今天百度的底色。
誠然,當下的人工智能行業還有不少問題需要解決,也許超級應用即将誕生,也許會再一次陷入瓶頸。但不論走向如何,百度都将會是牌桌上最不容忽視的角色之一。
04 尾聲
許多科技産業的成功故事,往往有一個共通的主題:相信。
威廉 · 肖克利堅信,全新的半導體材料可以取代笨重的真空管,因此一頭紮進了研究之中,最終打造出了構成現代計算機的基礎——晶體管。而辛頓在成爲「AI 教父」之前,被學術界稱爲「瘋子」。許多當時的權威,都認爲他搞的是「僞科學」,但辛頓沒有放棄相信。
我們作爲後來者,回過頭來看這些故事時,或許會覺得一切似乎順理成章。對于每一項科技成果的誕生,我們總能總結出許多客觀的原因。
然而,那些身處時代洪流中的個人,并沒有後視鏡視角。對他們來說,能夠長期選擇相信才是更加重要的事情。如今,百度能夠穿越周期,其實也是同樣的道理。
很多時候,正如那句老話說的那樣:信則靈,不信則泯。