無論人們以怎樣的視角解剖中國人工智能的激流歲月,在企業巨頭進軍 AI 的這一章,故事總是這樣開頭:
2012 年那場全球知名的「AI 拍賣會」中,出現了一家中國公司——百度的身影。時年,Geoffrey Hinton 率先驗證了深度學習的威力,并将這項成果編撰爲一篇 9 頁的論文發表。研究問世後,Geoffrey Hinton 很快收到了來自百度的邀約。
那時,深度學習還不是一個顯學,但李彥宏卻超前地預見了這項新技術的潛力,率先向 Geoffrey Hinton 伸出橄榄枝。在他的帶動下,谷歌、微軟兩家美國科技巨頭和日後成名的初創企業 DeepMind 也争相邀約,最終将 Geoffrey Hinton 的成果變成了一場知名的「AI 拍賣會」。
從 1500 萬美元開始,2000 萬、2200 萬元、3000 萬元、4300 萬元,競拍開始後的每個小時,價格都在快速攀升,而百度始終是出價最高的那一家。最終,出于非價格的考慮,Hinton 還是決定加入同爲美國公司的谷歌,百度惜敗,但這也讓李彥宏更堅定了開拓中國 AI 的決心。
2013 年,李彥宏在百度主導成立了全球第一個深度學習研究院(IDL),并親自出任院長。然而,此後數年間,深度學習浪潮起起落落,曆經低谷,全力投入人工智能的百度也由此飽經商業回報的考驗;李彥宏本人,由于對技術的追求過于執着,也受到大衆的質疑。
直到 2023 年,ChatGPT 催發 AI 奇點。百度最早推出「文心一言」等一系列大模型成果,人們才發現:百度在 AI 領域十年飲冰,便是爲了等待這一日的迸發。十年前,中國工業界的 AI 發展爲零,百度從頭開始;十年後,百度是全球少數全棧布局芯片、框架、模型與應用四層架構的公司。
9 月 7 日,《時代》周刊首次評選全球百大 AI 人物,李彥宏被評爲「中國最傑出的未來主義者」,與馬斯克、黃仁勳、Sam Altman 等人同時入選全球 AI 領袖。
十年跋涉,李彥宏終于越過山丘。
01「中國 AI 教父」李彥宏
鮮少有人注意到,李彥宏是中國互聯網企業中最早的人工智能追随者與布道者。北京是中國 AI 技術創新的中心,自 21 世紀初始,這裏有兩座 AI 人才聚集的高地,一座是号稱「中國 AI 黃埔軍校」的微軟亞洲研究院,另一座則是百度。
如果從更嚴格的地緣意義來看,百度作爲土生土長的中國企業,其實更具備前者的光環。而這其中,李彥宏對 AI 的追求與人才的重視,是 2012 年深度學習崛起後百度 AI 盛世形成的核心原因。
圖片來源:視覺中國
2012 年李彥宏招入餘凱(後來地平線的創始人)、成立深度學習研究院後,李彥宏意識到,,如要研究深度學習,就一定要招世界上最好的人才。他開始向全球招攬徐偉、張潼、吳恩達等等知名人才,每個人都是親自出馬接待,給予高規格的待遇:
徐偉風骨高存,李彥宏向人請教如何将他吸引進百度,對方随口說了一句「你得請他吃飯」,李彥宏就真的專門去請徐偉吃了一頓飯,徐偉最終入職百度,主導研發了後來的百度深度學習框架「飛槳飛槳」;
2014 年,吳恩達加入百度擔任首席科學家,李彥宏親自發内部信歡迎,吳恩達在線回複。因爲這兩封信,當天六位原先還在猶豫的頂級人工智能專家通過郵件向百度回複,表達了加入百度的意向。吳恩達在百度的三年,帶領百度人工智能團隊增長至 1300 人,其中百度研究院成員 300 人,百度由此培養出大量的 AI 人才。
本次《時代》周刊評選百大 AI 人物,吳恩達、Dario Amodei 等人也入選其中。Dario Amodei 是美國人工智能公司 Anthropic 的聯合創始人兼 CEO,2014 年在斯坦福大學結束博士後研究生涯後的第一份工作就是加入百度矽谷 AI 實驗室擔任研究員。
此外,李彥宏也是「百度少帥計劃」的主要推動者。除了引進張潼、徐偉等「老帥」,李彥宏當時還認爲應該吸引年輕人加入百度,就在深度學習研究院落實了「百度少帥計劃」。通過百度少帥計劃,李磊(後字節跳動 AI Lab 總監)、李沐(後亞馬遜 AI 首席科學家)、顧嘉唯等等傑出青年脫穎而出,嶄露頭角,讓更多年輕人看到國内的 AI 就業機會。
在深度學習的早期,除了從國外引入優秀人才,李彥宏也堅持在百度内部培養人才。李彥宏的想法是,百度正在探索的是前沿方向,現成人才本就稀缺,因此需要自己培養。2012 年後,百度在内部培養了一批批 AI 人才,如王海峰,2017 年接棒百度研究院、如今擔任百度 CTO,負責百度文心大模型的整體規劃;吳華,主導研發了百度文心 ERNIE 3.0 Zeus,是文心大模型團隊的核心骨幹。
十年來,百度研究院爲百度和 AI 行業培養出了數千名 AI 人才。據中國信通院報告,百度以 85.5 分位居「AI 産業創新人才」全國第一,在預訓練大模型、深度學習、自然語言處理等七大領域均排名第一。最近五年,百度 AI 人才的 AI 專利申請量和授權量連續五年位居全國第一。
在 2020 年的《緻股東信》中,李彥宏稱,百度是一家技術公司的另一含義是:百度培養技術人才,并輸出技術文化,讓更多企業看到技術的價值,并重視對技術的投入。多年來,百度堅持在深度學習、對話式人工智能操作系統、自動駕駛、AI 芯片等前沿領域投入,搭建起了中國互聯網的技術骨架。在李彥宏看來,這也是一件意義非凡的事情。
李彥宏本人是技術出身,發明了超鏈分析等基礎技術,并研發出了全球最大的搜索引擎——百度搜索。搜索與廣告是百度的支柱業務,主要涉及文本信息檢索與推薦,與自然語言處理等技術的終極追求天然契合。從做百度搜索的第一天起,李彥宏要解決的就是人工智能最終要解決的問題,即讓機器真正地理解人的意圖、并做出相應的回應。
因此,10 年前,李彥宏就意識到,人工智能技術可以解決搜索問題,并帶領百度在搜索基礎上實現了自然語言處理、圖像、語音等 AI 技術的突破。尤其,自然語言處理被譽爲「AI 皇冠上的一顆明珠」,在 NLP 領域,百度的水平處于中國最前沿。百度研究院曆來的掌舵人,從餘凱到王海峰,都是 NLP 領域的科學家。
李彥宏知道,最前沿的技術浪潮是等不來的,必須提前 10 年、20 年去布局。有人統計,作爲全國政協委員,李彥宏在連續 8 年的「兩會」中,提出了 13 份 AI 相關提案。AlphaGo 戰勝人類世界圍棋冠軍的 2016 年,李彥宏在公開場合提到「人工智能 /AI」500 多次。2017-2019 三年,李彥宏作了 40 次演講共計 15 萬字,均涉及 AI。
2012 年,李彥宏就專門寫了一封郵件,鼓勵全百度産品經理了解 AI 技術的最新趨勢,是中國最早提出「AI 原生」概念的布道者。近十年來,百度累計研發投入超過 1462 億元;在被稱爲「AI 寒冬」的 2022 年,百度研發投入 233 億元,研發強度 18.85%,排名中國民營企業研發強度第一。
02 大模型爆火:未來主義者的破冰時刻
搜索業務與自然語言處理技術息息相關,因此,中美兩國最大的搜索引擎公司——谷歌與百度,都曾經受同一個疑問:百度 / 谷歌是一家搜索引擎公司,還是一家 NLP 公司?
與百度相同,谷歌在 NLP 技術研發上也投入了大量人力與财力。2018 年,谷歌大腦團隊發布雙向預訓練語言模型 BERT,開啓了全球 NLP 的預訓練語言模型時代;2019 年,百度緊随其後,發布預訓練語言模型 ERNIE 1.0,是中國最早的預訓練語言模型成果,爲後來文心大模型的研發奠定了基礎。
追溯百度的大模型迸發,人們知道,這絕非偶然,而是一個堅持長期主義、未來主義的 AI 追随者在曆史長河中的必然。李彥宏與百度,均爲 AI 時代的到來做了長久的積累與準備。
十年前,百度就看到 AI 時代的四層架構。IT 時代,技術棧由芯片層、操作系統層與應用層三層組成,而 AI 時代則變爲芯片、框架、模型、應用四層,百度是全球少數全棧布局與自研的科技企業。芯片層,百度有昆侖芯;框架層,百度有飛槳飛槳;模型層,百度有文心大模型;應用層,百度基于文心開發了文心一言,重構了如流、搜索等等産品。
作爲國内最早關注大規模預訓練語言模型的團隊之一,百度率先在技術團隊與産品創新上邁步前進。據了解,百度文心大模型團隊超過千人,由百度從 2012 年重視 AI 開始培養起來的内部人才王海峰、吳甜與吳華等人帶隊,成員覆蓋算法、交付、安全、生态、社區等環節。以文心大模型爲中心,李彥宏親自帶隊,率領百度各個業務線與時俱進,重視 AI 原生,擁抱新的 AI 時代。
百度的大模型團隊也是國内最穩定的 AI 團隊之一。究其原因,百度從互聯網 PC 時代走來,李彥宏深谙從自然語言處理到搜索的技術邏輯,敢于在不确定的探索時期大膽拍闆,逐漸擴張。
在過去的許多年,即使 AI 研發投入的商業回報不甚顯著,甚至飽受質疑,但李彥宏對 AI 的信仰從未改變。百度在 AI 技術上的追求一直是國内頂尖,技術人員的投入上也是國内最前列。隻有長久的積累,才有爆發的可能。
2020 年 GPT-3 火時,除了學術圈,沒有太多人關注到這項技術的價值,但百度仍分配了大量資源給文心團隊;2022 年年底 ChatGPT 爆火後,人人皆言 NLP 與大模型,擁擠的視覺賽道開始分流給原先冷清的語言社區,但百度已率先發布大模型成果:
3 月 16 日,文心一言開啓内測;6 月,文心大模型 3.5 升級,模型性能在十餘個國内外權威測評中位居第一;8 月 31 日,文心一言全面向公衆開放,首日回複 3342 萬個問題,文心一言 APP 在多家應用商店中登頂排行榜。在過去「得視覺者得天下」的十年,百度堅持投入 NLP 研發,才有了今天大模型時代的先發制人。
文心一言 APP | 圖片來源:視覺中國
9 月 1 日,國家網信辦發布境内深度合成服務算法備案信息公告,百度同時獲批向公衆開放服務備案和深度合成服務算法備案。這意味着,百度躍升「中國大模型雙料王」:繼文心大模型之後,百度數字人、語音合成等也正式完成合規備案。
據了解,今年百度世界大會期間,百度還将推出文心大模型 4.0。
在 2020 年的《緻股東信》中,李彥宏寫道:「每當百度徘徊在十字路口,我都會問自己,什麽能夠讓你真正緻勝未來?
我認爲就是兩方面:一是你信仰什麽,What do you really believe in;一是你有多大的決心,your determination。從過去到現在,我們的信仰沒有變,我們相信技術可以改變世界。我們也有決心,有耐心。我們熬得過萬丈孤獨,藏得下星辰大海。」
從 2021 年推崇雲智一體、喊出「AI 原生」的口号,到如今驅動百度全員以「AI 原生」、「大模型原生」去思考下一個時代的機遇與挑戰,李彥宏始終是中國最敢投入前沿方向的科技領袖。隻有面向未來的未來主義者,才不會被新的時代抛棄。
也是在李彥宏的堅持下,百度這家從 PC 時代崛起的企業,經過十年洗刷,再一次站在了時代的聚光燈下。李彥宏對 AI 的信仰,使百度煥發出新的生機。越過山丘,或許百度将創造一個不一樣的時代。