AI十年浮沉，與改變命運的大模型

2019 年，前谷歌 CEO 埃裏克 · 施密特向白宮遞交了一份頗爲 " 詭谲 " 的報告。這份長達 750 頁的文件，核心觀點其實隻有一句話：若美國再不加大投資，中國将徹底主導 AI 領域 [ 1 ] 。

施密特此舉其實有 " 騙經費 " 之嫌：一年前，谷歌曾迫于輿論壓力退出了一個政府 AI 項目，他一直對此耿耿于懷。但報告本身卻并非胡謅。同年，美國數據創新中心也發布了一份報告，聲稱中國 AI 實力全球第二，且在數據等層面比美國更具優勢 [ 2 ] 。

在全民追趕 GPT 的今天，這則舊聞讀起來頗有幾分 " 魔幻感 "。

報告甚至上升到了 " 國家安全 " 的高度

然而，施密特口中的AI，與如今人們談論的GPT并非一個東西。

以 GPT 爲代表的 AI，指的其實是大模型。它擁有生成圖像、音頻、視頻等内容的能力，像是個文藝青年。但彼時讓美國人深感威脅的，多指識别型 AI（小模型）。它擅長各類數據分析工作，如同一個木得感情的運算機器。

大模型走紅前，識别型 AI 曾被寄予了太多改變世界的厚望，在中國催生了一段群雄并起、熱錢湧動的黃金歲月。巅峰時期，中國 AI 初創企業的融資金額甚至超過了美國——李開複将其形容爲 " 有三個 AI 專家就能估值 7 億、靠 AI 概念就能忽悠投資人 "，也不怪美國人感到焦慮。

隻是好景不長：後來 VC 陸陸續續退出，曾經風頭無兩的獨角獸也褪去了身上的光環，殘暴的歡愉最終以殘暴終結。

對此，百度集團執行副總裁、百度智能雲事業群總裁沈抖曾打過這麽一個比方：大模型出現前的AI像是氧氣——本身很有價值，但自己不會燃燒，必須找到可燃物才能把價值給發揮出來。這裏的 " 可燃物 "，指的是落地場景。

AI 起起落落這十年，成也場景，敗也場景。

舊範式的困境

2016 年，谷歌 AlphaGO 不僅徹底颠覆了圍棋，也改變了當時的 AI 創業。一時間，VC、科學家、大學教授，乃到各路鄉鎮企業家，無一不在談論着 AI 商業化的可能性。短短一年時間，國内誕生了 528 家 AI 企業，催生 371 起 AI 投融資，同比漲幅達到了 38.9%；同一時間，中國 AI 企業申請了 9000 多項 AI 專利，幾乎是美國新增專利數的兩倍有餘 [ 3 ] 。

不過，整個行業閉眼狂奔的同時，鮮有人會注意到初冬的号角已經悄悄吹響。2019 年，繁榮戛然而止。

首先是融資遇冷：這一年的 AI 融資金額僅有 186 億元，相比 2018 年直接腰斬了一個 0。受此影響，AI 初創企業的數量也大幅縮水，僅有鼎盛時期的 1/20。至于那些從競争中幸存、成功 " 上岸 " 的 AI 企業，其财務狀況仍舊慘不忍睹。據不完全統計，近九成 AI 企業都處于嚴重虧損的狀态 [ 4 ] 。

大起大落背後，是AI長期以來的産業化困境。

2021 年之前，業界三大主流 AI 技術分别是計算機視覺、語音識别、自然語言識别，本質都屬于識别型 AI。單從技術層面來看，上述技術都具備着充分的下遊應用空間，想象力充足。

例如在 "AI+ 安防 " 領域，2020 年時已有 453 億元的市場，且增速可觀，預計到 2025 年時市場規模将再翻一番 [ 6 ] 。

可下遊需求不斷擴大，并無法拯救虧錢的 AI 企業。識别型 AI 的技術特點，決定了它是一門技術、投入與産出不成正比的生意。

識别型 AI 采用的是小模型——這是一種專爲特定任務而生的技術。在實際訓練小模型時，研究員隻需給 AI 灌入标注過的特定數據，便能讓 AI 獲得對應的能力。如果想要一個能抓 " 闖紅燈 " 的 AI，那麽無需教它語文數學，隻要讓它從小學習各種闖紅燈的視頻即可。

小模型的優點在于簡單、高效，專用向的 AI 能夠很好地完成對應任務。但其缺點同樣明顯：由于沒學過其他知識，一個 AI 隻能解決一個問題。譬如一個抓闖紅燈的 AI，顯然不會具備識别超速、違規變道的能力。

識别不同元素需要不同的标注數據

由于小模型不具備通用性，導緻識别型AI隻能成爲一門類手工作坊的定制生意。

且具體到實際應用中，一個需求有時還需要定制不止一個 AI。例如在工業領域，在制造冶金鋼卷時有缺陷檢測這一步驟。如果将這項工作交由 AI，定制起來其實相當麻煩。因爲鋼卷分爲冷軋、熱軋，所以 AI 企業需要同時用 " 冷軋 - 合格 "" 冷軋 - 缺陷 "" 熱軋 - 合格 "" 熱軋 - 缺陷 " 四組數據訓練四遍 [ 7 ] 。其繁瑣程度，與 " 五彩斑斓的黑 " 有的一拼。

定制需求繁瑣的同時，對人力要求還不低——這活兒可不是月薪三千的大學生能幹的。

出于業務需要，頭部 AI 企業都聘請了大批科學家、博士生與教授作爲研究員，而 AI 研究員又是出了名的 " 高薪崗位 "。2015 年，谷歌爲了不讓知名研究員伊利亞（Ilya Sutskever）跳槽，曾開出過 200 萬美元 / 年的高薪——後來桑達爾 · 皮查伊繼任谷歌 CEO 時，其基本工資是同一個數字。

财新曾對國内 AI 企業招股書做過一筆測算，發現：它們每掙 1 塊錢，就要花掉 0.75 元的人力成本。再算上定制 AI 的算力、數據開銷、以及其他成本，幾乎做一單虧一單。

人們這才驚奇地發現，AI 這門生意似乎遠不如想象中那麽性感。

陷入死局後，AI 企業們隻能寄希望于一場 " 推翻重來 " 式變革。幸運的是，沒過幾年，暴風雨真的來了。

通用性的價值

紅杉資本率先嗅到了風雨欲來的氣息。2022 年 9 月，紅杉發表了文章《Generative AI: A Creative New World》，預言一場全新的科技競賽即将來臨。投資人同行很快聞風而動，一度冷清的 AI 圈再度人聲鼎沸。

這篇文章發布僅半年，有頭有臉的科技公司們幾乎全部一頭紮進了 AI 浪潮之中，要用人工智能把每個行業都重新做一遍。

例如當下火熱的直播行業，大模型應用的空間就相當廣闊。對于那些養不起專業直播團隊的商家，如今隻需輸入商品信息，百度的文心一言能夠自動生成話術、配音以及數字人主播，直接包攬了整個流程。

企業無需再花錢雇主播、想話術、搞培訓，能輕松實現 7*24 小時直播，對中小企業而言無疑是個重大利好。

在沈抖看來，大模型創業帶來的衆多機會，将帶動數字化經濟更進一步，有機會在全球範圍内掀起一股産業再造的浪潮。

他認爲，随着大模型深入數字經濟，更多産業會出現新的改變。智能化不僅讓整個生産流程大幅提效，也改變了很多原有的生産關系，包括人和人、人和設備、人和系統的關系。以前沒有智能時，很多工作實際上是靠人來操作；有了智能以後，機器、設備、系統都可以按照人的思想去學習。

未來的工作模式，很有可能是一個聰明的人去指導一堆機器人。這些機器人執行人類的決定，重塑整個生産線。沈抖說道，" 生成式 AI 已經形成全球性的‘ AI 再造業務’趨勢，企業迎來‘智能化躍遷’的曆史機遇。"

AI 産業能夠二度迎來春天，背後其實是大模型技術邁向成熟。

這場變革的起點發生在 2017 年：彼時，谷歌幾位研究員公開了深度學習模型 Transformer。以此爲基礎，OpenAI 等機構開始嘗試研究大模型，一種不同于識别型 AI 的全新技術。

其研究成果，正是如今備受關注的 GPT，即 Generative Pre-trained Transformer（生成式預訓練 Transformer）。

衆所周知，一個 AI 由模型、數據、算力三要素構成。相比于傳統的識别型 AI（小模型），以 GPT 爲代表大模型在數據、模型等方面均有不同程度的革新，賦予了大模型更強的通用性。這恰好改善了小模型時代的産業化痛點，AI 實現即插即用。AI 企業終于能擺脫手工作坊般的生産模式，有機會變成一門好生意。

大模型的這一價值，幾乎吸引了全球所有的目光。連早已退休、專心搞慈善的比爾蓋茨，都爲此興奮不已。他在一篇文章中寫道，自己有幸親曆了人類可能最重要的兩場革命的開端：第一次發生在 Windows 萌芽、PC 市場剛剛興起的 80 年代，而第二次正是去年——大模型剛剛開始湧現的時候。

而沈抖認爲，作爲 " 通才 " 的大模型還催生一種全新的産業化路徑：MaaS（Model as a Service），模型即服務。" 根據我們提供的文心一言的大模型服務，企業能夠以此爲基礎，結合他們所在行業去微調出一個行業大模型，再用這個行業大模型去服務整個行業。"

未來，大模型可能會成爲一個類似于安卓的 " 超級底座 "，每個行業都迎來AI再造的機會，并給應用端帶來大量的機會。

而在美國，已經誕生了依托于大模型開展業務的獨角獸。在德克薩斯州，一家初創企業憑借微調後的 AI 應用，在短短 18 個月時間做到了 15 億美元估值，年收入已有 3000 萬美元，比直接做大模型的企業還賺錢 [ 10 ] 。

不過，産業化潛力僅僅是大模型價值的一個方面。不同于過去兩年流行的元宇宙、Web3 等概念，大模型帶來了實打實的生産力提升。

例如長安汽車在參與百度文心一言的邀測時，就體驗了一回大模型的生成 PPT 功能。過去，制作一份 PPT 通常要花費半天甚至一天時間；如今，隻需三分鍾即可做出一份内容齊全、格式精美的 PPT。未來，機械的重複性工作将完全可以交給 AI，員工可以集中于創造更大價值的工作，企業競争力增加同時增加社會财富。

百度智能雲舉行的閉門溝通會上，現場演示文心一言生成 PPT

毫無疑問，大模型将是未來十年科技圈最重要的叙事之一。

百模大戰

" 百模大戰 " 來了，一如當年的 " 百團大戰 "。

國内大公司紛紛紮堆推出大模型，百度文心一言最先，360、騰訊、阿裏、商湯、科大訊飛、字節等紛紛緊追。大模型産品大多同時兼具對話問答、文章創作、代碼寫作等多項技能。市場上供給多了，但這些産品的 " 智力 " 水平卻參差不齊，如何挑選成爲了一個難題。

目前主流觀點認爲，可以有以下兩個标準：

第一，從芯片到框架、模型再到應用的全鏈路環節都具備極爲優秀的性能。

芯片決定了算力，這是 AI 訓練的基礎。OpenAI 曾做過一筆測算：2012 年開始，全球 AI 訓練所用的計算量平均每 3.43 個月便會翻一倍，遠超摩爾定律。在肉眼可見的未來，" 算力不足 " 都将會是制約 AI 發展的最大因素。因此，芯片要做到性能過硬。

隻有制造出算力極強的高端芯片，才能滿足智算時代的計算需求，讓雲好用，這是基礎條件。

而在框架和模型層面，軟件适配程度要更高，算法積累足夠，大模型能力要更強。深度學習框架需要做到全棧自主可控，推動大模型不斷叠代升級。在此基礎上，推出多樣雲服務使得大模型适應各産業的數字、智能化需求，做好模型即服務（MaaS）。

第二，能爲大家提供全鏈路的服務保障。

服務商不僅要具備多元的能力，還需要将它們有機地結合起來：如此一來不僅能帶來更高的可靠性、幫助企業降本增效，還降低 AI 使用門檻，既易用，又好用。

好的智算基礎設施，就是要高效解決算力、算法、數據處理等多維度的問題，而且這些維度之間不是獨立存在的，而是互相依賴，相互優化、緊密耦合，從而提升整體基礎設施效能。

比如芯片解決算力問題，框架解決算法開發問題，大模型解決模型泛化問題，他們三者就猶如三人四足比賽中的團隊合夥人，隻有彼此心有靈犀、協調互補，才能打出完美的團隊配合，赢得比賽勝利。

百度的解決方案，是将文心一言大模型與百度智能雲服務結合起來，提供一種更便捷的一站式服務，即 " 雲智一體 "。

該方案同時提供了算力與大模型服務，企業隻需提供自身行業的數據做微調，即可快速生産出符合市場需求的 AI 産品。不過，百度智能雲能做的還不止微調一項，它還額外集成了推理與托管服務。

推理是大模型所具備的一項能力，指利用訓練好的 AI 去進行結論推導的過程。如果說微調是将已有的房子重新裝修一遍，那麽推理則相當于給你空地和材料，搭建一個全新的房子。雖然推理的成本高于微調，但能讓大模型新增更多原本不具備的能力，滿足企業更深層次的開發需求。

至于托管，則能幫助較爲早期的大模型創業者解決搭建團隊的難題。高薪的 AI 研究員一直是市場上最搶手的資源之一，初創企業不僅資金有限，且很難在人才競争中獲得太多優勢。相比之下，托管服務則會提供一支高度專業的團隊，幫助第三方企業管理他們的 AI 解決方案。

由此可見，微調、推理、托管三大服務的功能各不相同，能夠滿足不同階段企業的需求。

如今，上述 " 雲智一體 " 服務已成爲一種行業共識。百度智能雲作爲這一概念的提出者，具備一些獨有的優勢。

2022 年，百度副總裁沈抖升級了原有的架構，正式對外官宣了 " 雲智一體 3.0"。該架構的優勢在于，形成了 " 芯片 - 框架 - 大模型 - 行業應用 " 的智能化閉環路徑，百度是全球唯一在每一層都有自研産品的公司。比如芯片層有昆侖芯，框架有中國市場份額第一的飛槳。

沈抖認爲，四層架構的高效協同，能實現更高的運轉效率，" 我們能在同等算力投入下，把某個應用的性能提高 100%，相當于讓算力需求降低了 50%。" 這是百度智能雲非常獨特的優勢，也使得百度智能雲成爲國内第一個訓練出大模型的雲。

如今，" 雲智一體 " 不僅僅隻是一項服務，更有可能成爲數字時代的一種新基建。經濟學博士任澤平曾在 2023 年跨年演講中預測，智能雲将成爲數字經濟的重要技術支撐，并在未來 20 年成爲支撐中國經濟繁榮發展的新型基礎設施。

對當今社會而言，這些變化既是将來時，也是進行時—— AI 正在以肉眼可見的速度重塑這個社會。對此，輿論上充斥着許多不安的聲音。不過，當時代的浪潮撲面而來，企業、個體最好的選擇，隻有擁抱它。

尾聲

不論是紅杉資本還是黃仁勳，都喜歡将當下稱爲 "AI 的 IPhone 時刻 "。

初代 IPhone 發布于 2007 年。彼時，摩托羅拉、諾基亞才是手機市場的霸主，張小龍還在忙着做 QQ 郵箱，百度搜索的網頁訪問量每天都在增長，沒人知道世界上第一款智能手機到底會帶來些什麽。

然而，當喬布斯講出那句 " 今天，蘋果将重新發明手機 " 時，世界依舊爲之沸騰，變革的伏筆已經埋下。相比于市面上的其他産品，初代 IPhone 的革新之處其實隻有兩個方面：一是取消了鍵盤，改用觸屏設計；二是借鑒了電腦的設計，嘗試在手機中加入浏覽器、股票、天氣等應用。

10 年之後，初代 IPhone 的這兩大設計已然成爲了智能手機的設計标準，以此構建的移動互聯網改寫了數十億人的生活。

沈抖曾在采訪時提到，初代 IPhone 的出現，将手機分成了兩類：智能手機與非智能手機，而非智能手機最終被淘汰了。大模型出來後，同樣會把企業分成兩類：一類是智能企業，一類是非智能企業——類似的故事有可能會再次上演。

關于大模型的未來，如今看來仍有些模糊，但唯有一點是确信的——新時代的序幕正緩緩拉開，一場重新定義時代的比賽已經開始。

參考資料

[ 1 ] China will dominate AI unless U.S. invests more, commission warns，Axios

[ 2 ] 2019 年 AI 實力對決：美國領跑，中國追趕，歐盟弱勢，智東西

[ 3 ] 烏鎮指數：全球人工智能發展報告（2017）

[ 4 ] 2021 年人工智能行業發展白皮書

[ 5 ] 中國人工智能軟件及應用市場研究報告 -2020，IDC

[ 6 ] 2021 年中國 AI+ 安防行業發展研究報告，艾瑞咨詢

[ 7 ] 正在消失的機器視覺公司，腦極體

[ 8 ] Generative AI: A Creative New World，sequoia

[ 9 ] 揭秘 ChatGPT 身後的 AIGC 技術和它的中國同行們，海通國際

[ 10 ] The Best Little Unicorn in Texas: Jasper Was Winning the AI Race — Then ChatGPT Blew Up the Whole Game，The Information

[ 11 ] AI Developers Stymied by Server Shortage at AWS, Microsoft, Google，The Information

作者：陳彬

編輯：李墨天

視覺設計：疏睿

責任編輯：李墨天