2019 年,前谷歌 CEO 埃裏克 · 施密特向白宮遞交了一份頗爲 " 詭谲 " 的報告。這份長達 750 頁的文件,核心觀點其實隻有一句話:若美國再不加大投資,中國将徹底主導 AI 領域 [ 1 ] 。
施密特此舉其實有 " 騙經費 " 之嫌:一年前,谷歌曾迫于輿論壓力退出了一個政府 AI 項目,他一直對此耿耿于懷。但報告本身卻并非胡謅。同年,美國數據創新中心也發布了一份報告,聲稱中國 AI 實力全球第二,且在數據等層面比美國更具優勢 [ 2 ] 。
在全民追趕 GPT 的今天,這則舊聞讀起來頗有幾分 " 魔幻感 "。
報告甚至上升到了 " 國家安全 " 的高度
然而,施密特口中的AI,與如今人們談論的GPT并非一個東西。
以 GPT 爲代表的 AI,指的其實是大模型。它擁有生成圖像、音頻、視頻等内容的能力,像是個文藝青年。但彼時讓美國人深感威脅的,多指識别型 AI(小模型)。它擅長各類數據分析工作,如同一個木得感情的運算機器。
大模型走紅前,識别型 AI 曾被寄予了太多改變世界的厚望,在中國催生了一段群雄并起、熱錢湧動的黃金歲月。巅峰時期,中國 AI 初創企業的融資金額甚至超過了美國——李開複将其形容爲 " 有三個 AI 專家就能估值 7 億、靠 AI 概念就能忽悠投資人 ",也不怪美國人感到焦慮。
隻是好景不長:後來 VC 陸陸續續退出,曾經風頭無兩的獨角獸也褪去了身上的光環,殘暴的歡愉最終以殘暴終結。
對此,百度集團執行副總裁、百度智能雲事業群總裁沈抖曾打過這麽一個比方:大模型出現前的AI像是氧氣——本身很有價值,但自己不會燃燒,必須找到可燃物才能把價值給發揮出來。這裏的 " 可燃物 ",指的是落地場景。
AI 起起落落這十年,成也場景,敗也場景。
舊範式的困境
2016 年,谷歌 AlphaGO 不僅徹底颠覆了圍棋,也改變了當時的 AI 創業。一時間,VC、科學家、大學教授,乃到各路鄉鎮企業家,無一不在談論着 AI 商業化的可能性。短短一年時間,國内誕生了 528 家 AI 企業,催生 371 起 AI 投融資,同比漲幅達到了 38.9%;同一時間,中國 AI 企業申請了 9000 多項 AI 專利,幾乎是美國新增專利數的兩倍有餘 [ 3 ] 。
不過,整個行業閉眼狂奔的同時,鮮有人會注意到初冬的号角已經悄悄吹響。2019 年,繁榮戛然而止。
首先是融資遇冷:這一年的 AI 融資金額僅有 186 億元,相比 2018 年直接腰斬了一個 0。受此影響,AI 初創企業的數量也大幅縮水,僅有鼎盛時期的 1/20。至于那些從競争中幸存、成功 " 上岸 " 的 AI 企業,其财務狀況仍舊慘不忍睹。據不完全統計,近九成 AI 企業都處于嚴重虧損的狀态 [ 4 ] 。
大起大落背後,是AI長期以來的産業化困境。
2021 年之前,業界三大主流 AI 技術分别是計算機視覺、語音識别、自然語言識别,本質都屬于識别型 AI。單從技術層面來看,上述技術都具備着充分的下遊應用空間,想象力充足。
例如在 "AI+ 安防 " 領域,2020 年時已有 453 億元的市場,且增速可觀,預計到 2025 年時市場規模将再翻一番 [ 6 ] 。
可下遊需求不斷擴大,并無法拯救虧錢的 AI 企業。識别型 AI 的技術特點,決定了它是一門技術、投入與産出不成正比的生意。
識别型 AI 采用的是小模型——這是一種專爲特定任務而生的技術。在實際訓練小模型時,研究員隻需給 AI 灌入标注過的特定數據,便能讓 AI 獲得對應的能力。如果想要一個能抓 " 闖紅燈 " 的 AI,那麽無需教它語文數學,隻要讓它從小學習各種闖紅燈的視頻即可。
小模型的優點在于簡單、高效,專用向的 AI 能夠很好地完成對應任務。但其缺點同樣明顯:由于沒學過其他知識,一個 AI 隻能解決一個問題。譬如一個抓闖紅燈的 AI,顯然不會具備識别超速、違規變道的能力。
識别不同元素需要不同的标注數據
由于小模型不具備通用性,導緻識别型AI隻能成爲一門類手工作坊的定制生意。
且具體到實際應用中,一個需求有時還需要定制不止一個 AI。例如在工業領域,在制造冶金鋼卷時有缺陷檢測這一步驟。如果将這項工作交由 AI,定制起來其實相當麻煩。因爲鋼卷分爲冷軋、熱軋,所以 AI 企業需要同時用 " 冷軋 - 合格 "" 冷軋 - 缺陷 "" 熱軋 - 合格 "" 熱軋 - 缺陷 " 四組數據訓練四遍 [ 7 ] 。其繁瑣程度,與 " 五彩斑斓的黑 " 有的一拼。
定制需求繁瑣的同時,對人力要求還不低——這活兒可不是月薪三千的大學生能幹的。
出于業務需要,頭部 AI 企業都聘請了大批科學家、博士生與教授作爲研究員,而 AI 研究員又是出了名的 " 高薪崗位 "。2015 年,谷歌爲了不讓知名研究員伊利亞(Ilya Sutskever)跳槽,曾開出過 200 萬美元 / 年的高薪——後來桑達爾 · 皮查伊繼任谷歌 CEO 時,其基本工資是同一個數字。
财新曾對國内 AI 企業招股書做過一筆測算,發現:它們每掙 1 塊錢,就要花掉 0.75 元的人力成本。再算上定制 AI 的算力、數據開銷、以及其他成本,幾乎做一單虧一單。
人們這才驚奇地發現,AI 這門生意似乎遠不如想象中那麽性感。
陷入死局後,AI 企業們隻能寄希望于一場 " 推翻重來 " 式變革。幸運的是,沒過幾年,暴風雨真的來了。
通用性的價值
紅杉資本率先嗅到了風雨欲來的氣息。2022 年 9 月,紅杉發表了文章《Generative AI: A Creative New World》,預言一場全新的科技競賽即将來臨。投資人同行很快聞風而動,一度冷清的 AI 圈再度人聲鼎沸。
這篇文章發布僅半年,有頭有臉的科技公司們幾乎全部一頭紮進了 AI 浪潮之中,要用人工智能把每個行業都重新做一遍。
例如當下火熱的直播行業,大模型應用的空間就相當廣闊。對于那些養不起專業直播團隊的商家,如今隻需輸入商品信息,百度的文心一言能夠自動生成話術、配音以及數字人主播,直接包攬了整個流程。
企業無需再花錢雇主播、想話術、搞培訓,能輕松實現 7*24 小時直播,對中小企業而言無疑是個重大利好。
在沈抖看來,大模型創業帶來的衆多機會,将帶動數字化經濟更進一步,有機會在全球範圍内掀起一股産業再造的浪潮。
他認爲,随着大模型深入數字經濟,更多産業會出現新的改變。智能化不僅讓整個生産流程大幅提效,也改變了很多原有的生産關系,包括人和人、人和設備、人和系統的關系。以前沒有智能時,很多工作實際上是靠人來操作;有了智能以後,機器、設備、系統都可以按照人的思想去學習。
未來的工作模式,很有可能是一個聰明的人去指導一堆機器人。這些機器人執行人類的決定,重塑整個生産線。沈抖說道," 生成式 AI 已經形成全球性的‘ AI 再造業務’趨勢,企業迎來‘智能化躍遷’的曆史機遇。"
AI 産業能夠二度迎來春天,背後其實是大模型技術邁向成熟。
這場變革的起點發生在 2017 年:彼時,谷歌幾位研究員公開了深度學習模型 Transformer。以此爲基礎,OpenAI 等機構開始嘗試研究大模型,一種不同于識别型 AI 的全新技術。
其研究成果,正是如今備受關注的 GPT,即 Generative Pre-trained Transformer(生成式預訓練 Transformer)。
衆所周知,一個 AI 由模型、數據、算力三要素構成。相比于傳統的識别型 AI(小模型),以 GPT 爲代表大模型在數據、模型等方面均有不同程度的革新,賦予了大模型更強的通用性。這恰好改善了小模型時代的産業化痛點,AI 實現即插即用。AI 企業終于能擺脫手工作坊般的生産模式,有機會變成一門好生意。
大模型的這一價值,幾乎吸引了全球所有的目光。連早已退休、專心搞慈善的比爾蓋茨,都爲此興奮不已。他在一篇文章中寫道,自己有幸親曆了人類可能最重要的兩場革命的開端:第一次發生在 Windows 萌芽、PC 市場剛剛興起的 80 年代,而第二次正是去年——大模型剛剛開始湧現的時候。
而沈抖認爲,作爲 " 通才 " 的大模型還催生一種全新的産業化路徑:MaaS(Model as a Service),模型即服務。" 根據我們提供的文心一言的大模型服務,企業能夠以此爲基礎,結合他們所在行業去微調出一個行業大模型,再用這個行業大模型去服務整個行業。"
未來,大模型可能會成爲一個類似于安卓的 " 超級底座 ", 每個行業都迎來AI再造的機會,并給應用端帶來大量的機會。
而在美國,已經誕生了依托于大模型開展業務的獨角獸。在德克薩斯州,一家初創企業憑借微調後的 AI 應用,在短短 18 個月時間做到了 15 億美元估值,年收入已有 3000 萬美元,比直接做大模型的企業還賺錢 [ 10 ] 。
不過,産業化潛力僅僅是大模型價值的一個方面。不同于過去兩年流行的元宇宙、Web3 等概念,大模型帶來了實打實的生産力提升。
例如長安汽車在參與百度文心一言的邀測時,就體驗了一回大模型的生成 PPT 功能。過去,制作一份 PPT 通常要花費半天甚至一天時間;如今,隻需三分鍾即可做出一份内容齊全、格式精美的 PPT。未來,機械的重複性工作将完全可以交給 AI,員工可以集中于創造更大價值的工作,企業競争力增加同時增加社會财富。
百度智能雲舉行的閉門溝通會上,現場演示文心一言生成 PPT
毫無疑問,大模型将是未來十年科技圈最重要的叙事之一。
百模大戰
" 百模大戰 " 來了,一如當年的 " 百團大戰 "。
國内大公司紛紛紮堆推出大模型,百度文心一言最先,360、騰訊、阿裏、商湯、科大訊飛、字節等紛紛緊追。大模型産品大多同時兼具對話問答、文章創作、代碼寫作等多項技能。市場上供給多了,但這些産品的 " 智力 " 水平卻參差不齊,如何挑選成爲了一個難題。
目前主流觀點認爲,可以有以下兩個标準:
第一,從芯片到框架、模型再到應用的全鏈路環節都具備極爲優秀的性能。
芯片決定了算力,這是 AI 訓練的基礎。OpenAI 曾做過一筆測算:2012 年開始,全球 AI 訓練所用的計算量平均每 3.43 個月便會翻一倍,遠超摩爾定律。在肉眼可見的未來," 算力不足 " 都将會是制約 AI 發展的最大因素。因此,芯片要做到性能過硬。
隻有制造出算力極強的高端芯片,才能滿足智算時代的計算需求,讓雲好用,這是基礎條件。
而在框架和模型層面,軟件适配程度要更高,算法積累足夠,大模型能力要更強。深度學習框架需要做到全棧自主可控,推動大模型不斷叠代升級。在此基礎上,推出多樣雲服務使得大模型适應各産業的數字、智能化需求,做好模型即服務(MaaS)。
第二,能爲大家提供全鏈路的服務保障。
服務商不僅要具備多元的能力,還需要将它們有機地結合起來:如此一來不僅能帶來更高的可靠性、幫助企業降本增效,還降低 AI 使用門檻,既易用,又好用。
好的智算基礎設施,就是要高效解決算力、算法、數據處理等多維度的問題,而且這些維度之間不是獨立存在的,而是互相依賴,相互優化、緊密耦合,從而提升整體基礎設施效能。
比如芯片解決算力問題,框架解決算法開發問題,大模型解決模型泛化問題,他們三者就猶如三人四足比賽中的團隊合夥人,隻有彼此心有靈犀、協調互補,才能打出完美的團隊配合,赢得比賽勝利。
百度的解決方案,是将文心一言大模型與百度智能雲服務結合起來,提供一種更便捷的一站式服務,即 " 雲智一體 "。
該方案同時提供了算力與大模型服務,企業隻需提供自身行業的數據做微調,即可快速生産出符合市場需求的 AI 産品。不過,百度智能雲能做的還不止微調一項,它還額外集成了推理與托管服務。
推理是大模型所具備的一項能力,指利用訓練好的 AI 去進行結論推導的過程。如果說微調是将已有的房子重新裝修一遍,那麽推理則相當于給你空地和材料,搭建一個全新的房子。雖然推理的成本高于微調,但能讓大模型新增更多原本不具備的能力,滿足企業更深層次的開發需求。
至于托管,則能幫助較爲早期的大模型創業者解決搭建團隊的難題。高薪的 AI 研究員一直是市場上最搶手的資源之一,初創企業不僅資金有限,且很難在人才競争中獲得太多優勢。相比之下,托管服務則會提供一支高度專業的團隊,幫助第三方企業管理他們的 AI 解決方案。
由此可見,微調、推理、托管三大服務的功能各不相同,能夠滿足不同階段企業的需求。
如今,上述 " 雲智一體 " 服務已成爲一種行業共識。百度智能雲作爲這一概念的提出者,具備一些獨有的優勢。
2022 年,百度副總裁沈抖升級了原有的架構,正式對外官宣了 " 雲智一體 3.0"。該架構的優勢在于,形成了 " 芯片 - 框架 - 大模型 - 行業應用 " 的智能化閉環路徑,百度是全球唯一在每一層都有自研産品的公司。比如芯片層有昆侖芯,框架有中國市場份額第一的飛槳。
沈抖認爲,四層架構的高效協同,能實現更高的運轉效率," 我們能在同等算力投入下,把某個應用的性能提高 100%,相當于讓算力需求降低了 50%。" 這是百度智能雲非常獨特的優勢,也使得百度智能雲成爲國内第一個訓練出大模型的雲。
如今," 雲智一體 " 不僅僅隻是一項服務,更有可能成爲數字時代的一種新基建。經濟學博士任澤平曾在 2023 年跨年演講中預測,智能雲将成爲數字經濟的重要技術支撐,并在未來 20 年成爲支撐中國經濟繁榮發展的新型基礎設施。
對當今社會而言,這些變化既是将來時,也是進行時—— AI 正在以肉眼可見的速度重塑這個社會。對此,輿論上充斥着許多不安的聲音。不過,當時代的浪潮撲面而來,企業、個體最好的選擇,隻有擁抱它。
尾聲
不論是紅杉資本還是黃仁勳,都喜歡将當下稱爲 "AI 的 IPhone 時刻 "。
初代 IPhone 發布于 2007 年。彼時,摩托羅拉、諾基亞才是手機市場的霸主,張小龍還在忙着做 QQ 郵箱,百度搜索的網頁訪問量每天都在增長,沒人知道世界上第一款智能手機到底會帶來些什麽。
然而,當喬布斯講出那句 " 今天,蘋果将重新發明手機 " 時,世界依舊爲之沸騰,變革的伏筆已經埋下。相比于市面上的其他産品,初代 IPhone 的革新之處其實隻有兩個方面:一是取消了鍵盤,改用觸屏設計;二是借鑒了電腦的設計,嘗試在手機中加入浏覽器、股票、天氣等應用。
10 年之後,初代 IPhone 的這兩大設計已然成爲了智能手機的設計标準,以此構建的移動互聯網改寫了數十億人的生活。
沈抖曾在采訪時提到,初代 IPhone 的出現,将手機分成了兩類:智能手機與非智能手機,而非智能手機最終被淘汰了。大模型出來後,同樣會把企業分成兩類:一類是智能企業,一類是非智能企業——類似的故事有可能會再次上演。
關于大模型的未來,如今看來仍有些模糊,但唯有一點是确信的——新時代的序幕正緩緩拉開,一場重新定義時代的比賽已經開始。
參考資料
[ 1 ] China will dominate AI unless U.S. invests more, commission warns,Axios
[ 2 ] 2019 年 AI 實力對決:美國領跑,中國追趕,歐盟弱勢,智東西
[ 3 ] 烏鎮指數:全球人工智能發展報告(2017)
[ 4 ] 2021 年人工智能行業發展白皮書
[ 5 ] 中國人工智能軟件及應用市場研究報告 -2020,IDC
[ 6 ] 2021 年中國 AI+ 安防行業發展研究報告,艾瑞咨詢
[ 7 ] 正在消失的機器視覺公司,腦極體
[ 8 ] Generative AI: A Creative New World,sequoia
[ 9 ] 揭秘 ChatGPT 身後的 AIGC 技術和它的中國同行們,海通國際
[ 10 ] The Best Little Unicorn in Texas: Jasper Was Winning the AI Race — Then ChatGPT Blew Up the Whole Game,The Information
[ 11 ] AI Developers Stymied by Server Shortage at AWS, Microsoft, Google,The Information
作者:陳彬
編輯:李墨天
視覺設計:疏睿
責任編輯:李墨天