圖片來源 @視覺中國
文|明晰野望
這一輪由 AI 技術演變帶來的算力爆發,中國算力是否夠用 ? 答案是否定的,算力尤其是智能算力,已經成爲制約中國人工智能發展的最關鍵因素。
近年來,一方面國家大力布局智能算力産業,一方面算力供給 " 鴻溝 " 卻在不斷擴大。這一現象的主因是 AI 加快了中國數字化轉型,AI 應用版圖随之擴大,算力需求自然 " 水漲船高 "。
另一個原因是美國禁售最強 GPU 進行的算力封鎖。目前從國産大模型與 ChatGPT 的差距看,遏制手段已經生效:OpenAI 之所以難以被超越,在于其擁有一個巨大的算力底座,在大模型 ( AI 算法 ) 的訓練和推理中,首先擁有了效率優勢。
算力基礎決定上層應用。事實上,流向 AI 産業鏈的 " 每一滴水 ", 最終都流向了算力。
爲了避免算力産業在關鍵時刻被拉開差距,當下國家正在加快一體化的新型算力網絡體系建設,國内雲廠商也紛紛參與其中。阿裏雲、騰訊雲、天翼雲還發布了讓 " 算力更普惠 " 的智算平台,硬件廠商則乘勢加快了 AI 服務器、AI 芯片、存儲的國産替代進程。
算力突圍戰,再次打響。
01、奇點之路,算力爲基
在 2023 财年 Q1 财報會上,紮克伯格稱 " 生成式 AI 将觸及 Meta 所有産品 ",這已是全球第四家科技大廠做如此表态。
此前阿裏曾表示 " 所有産品都将接入大模型 ",百度強調 " 所有業務全面集成文心一言 ";更早一些,微軟 " 計劃将 ChatGPT 等 OpenAI 的 AI 工具整合入全線産品 "。
這說明,真正的 AI 時代,新的應用都會基于大模型來開發,就像十幾年前的移動互聯網,各種基于安卓、iOS 的應用大量湧現一樣。
這令人工智能的奇點,第一次以可以預見的方式展現在人們面前:AI 滲透到千行百業,達到 " 應用奇點 ",最終迎來強 AI 的 " 技術奇點 "。而算力,無疑是這條 " 奇點之路 " 的路基。
這也是大模型在各種應用領域加速落地,獲取更多訓練參數和數據的長期意義:AI 目前還在線上,但遲早會與物理世界連接。可以想象一下,如果一個基于 GPT-10 的 ChatGPT 與波士頓動力或特斯拉的人型機器人結合,會帶來什麽?
此邏輯并非假想。長期以來,如何令 AI 掌握常識并融會貫通地運用這些常識、形成推理能力,都是巨大的難題。但這次以 ChatGPT 爲代表的大語言模型,突然就邁過這道 " 門檻 ",成爲 " 史上第一個真正意義上的通用人工智能 "。
當然這背後的原因有很多,如自監督學習、Fine-tuning 策略等,但一個重要的底層變化就是 " 湧現 "(Emergent)現象。
大語言模型的湧現現象,在一定規模後迅速湧現出新能力;圖片來源:谷歌、斯坦福、DeepMind:大型語言模型的湧現能力
就是說業界從未想象到的能力,例如基礎社會知識、上下文學習(ICL)、推理(CoT)等等,在訓練參數和數據量超過一定數值後,這些能力就突然出現了。
而人形機器人最主要的技術要點有兩個,一個是機器人的本體,一個是機器人的大腦。前者的難點在于更高功率密度的驅動器,後者的難度就在于通用人工智能。
其實,早在去年 8 月谷歌就将大模型嵌入了機器人的大腦。今年伴随着多模态大模型的快速叠代,阿裏、騰訊、微軟、OpenAI 等多家中美大廠,都加大了該領域的探索。
譬如在 4 月底,阿裏雲将千問大模型接入工業機器人可在釘釘遠程指揮,騰訊 Robotics X 實驗室也公布了機器人靈巧手 TRX-Hand 和機械臂 TRX-Arm。
值得注意的是,騰訊機械手臂擁有三個手指、7 個自由度,這與谷歌去年底推出的 RT-1 機器人自由度一緻。但相比特斯拉 Optimus 使用 5 個手指,擁有 11 個自由度還是有所不足。
這倒不是說騰訊的技術能力不如特斯拉。機器人本身是一項綜合性的技術,不僅對硬件有着極高要求,軟件算法也是機器人的核心要件,但更先進的算法需要更強的算力支撐。
英偉達 A100芯片的數量不足,可能已經影響到中國企業開展更先進算法的訓練和推理。
據《财經十一人》報道,目前中國企業 GPU 芯片持有量超過 1 萬枚的不超過 5 家,擁有 1 萬枚 A100 的至多隻有 1 家。且由于美國去年 8 月開始算力封鎖,這些存貨的剩餘使用壽命約爲 4-6 年。
相比之下,特斯拉依靠領先的算力平台 DOJO ( 使用了 1.4 萬個英偉達的 GPU,含 2022 年最新升級後公布的 7360 塊 A100 ) ,實際上構建了一個其他競争對手難以企及的算力制高點。
在企業層面,另一個算力制高點是微軟。其在 2020 年就與 OpenAI 合作,建成了一台号稱世界前五,擁有超過 28.5 萬個 CPU 核心、1 萬個 GPU 的 E 級超算(每秒百億億次數學運算)。
去年 11 月份,微軟又宣布與英偉達合作開發新型 AI 雲端超算,據說将用到 " 數以萬計 " 的 H100 和 A100。在 2023 财年 Q3 财報會上微軟也表示,将繼續投資于雲基礎設施,特别是與 AI 相關的支出。
02、六年發展,差距猶存
5 月 4 日,李彥宏在百度内部再次提起 " 與 OpenAI 差距 " 的問題,他稱媒體報道的 " 大約是兩個月 " 有點斷章取義,因爲後面緊接一句是:" 這兩個月的差距我們要用多長時間才能趕上?也許很快,也許永遠也趕不上。"
李彥宏 " 永遠也趕不上 " 的考量,自然包括算力上的差距,至少目前看是如此。據外媒報道,OpenAI 已經使用了約 2.5 萬個英偉達的 GPU。
所以,算力也決定 AI 技術王權的更叠。
馬斯克也不滿足。上個月有消息稱其搶購了一萬枚 A100,主攻大模型,再關聯到特斯拉的智能汽車及寄予厚望的人型機器人,其對算力的需求近乎沒有止境。
業内人士認爲,随着 AI 技術的爆發和成熟,機器人發展将逐漸進入颠覆式階段。但大模型不可能裝進單體機器人大腦,它必須變成 " 雲 " 大腦,通過在雲、邊、端分布式算法、算力和大數據,形成一個智能化的核心載體,這使機器人對算力更加依賴。
智能汽車,一樣可以理解爲汽車機器人,從智能座艙到自動駕駛都是 " 吃算力 " 的大戶。
同時放眼宏觀,這兩個行業在 " 中國智造 " 的總體規劃中,所占份量也自不待言。
僅人型機器人,據 Stratistics Market Research Consulting 預測,2035 年全球市場規模将達到 1520 億美元;另據 SNE Research 日前發布的報告,2023 年全球電動汽車市場規模預計将增至 1210 億美元。
也就是說,十餘年後的人型機器人的市場規模,可能媲美今天的電動汽車。
爲此 2021 年 12 月,工信部等多部門就印發了《" 十四五 " 機器人産業發展規劃》;今年 1 月,工信部等十七個部門又發布了《" 機器人 +" 應用行動實施方案》;3 月初,工信部相關負責人表示,将加快布局人形機器人、元宇宙、量子科技等前沿領域。
從中長期看,在國家政策扶持下,國産機器人乃至數字化産業各細分領域,都有望具備國際競争力。但短期來看,這些領域所必須的智能算力,依然是掣肘因素。
算力分爲三類,即通用算力、智能算力、超算算力。一般産業數字化的場景通用算力就可滿足,天體物理、航空航天等複雜運算則需要超算算力,AI 應用及模型的訓練和推理,對應的是智算算力。
智算,又稱異構計算,相對于隻用 CPU 的通用計算,在服務器裏 CPU+GPU 就是異構計算,當然也可以根據應用範圍采用不同的組合方式,如 CPU + TPU、CPU+FPGA 等。
從中國算力發展史看,最早可以追溯到中國首台超算 " 銀河一号 " 誕生的 1983 年;2009 — 2011 年,阿裏、騰訊、華爲先後入局雲計算,是中國企業探索算力的起點。
2017 年,國家發布了《新一代人工智能發展規劃》,這一年是 AI 商業化應用的元年,也是中國智能算力發展的元年。
從彼時起,通用算力占比開始下降,智能算力占比開始逐漸增長。
中國信通院數據顯示,2016 年智能算力在中國算力中的占比僅爲 3%, 到 2021 年占比已經超過通用算力,達到 51%。
另據 IDC、清華全球産業院于 2022 年 3 月聯合發布的報告,過去 5 年中國 AI 計算首次超越美國成爲全球第一,AI 服務器支出規模同比增長 44.5%。
但必須指出的是," 智能算力占比超過通用算力 ","AI 計算首次超越美國 " 的結論,都是基于 AI 服務器出貨量測算,并不是實際在用的數據。
在用數據如何呢?中國信通院的公開數據表明:截至 2022 年底,全國在用數據中心機架總規模超過 650 萬标準機架,算力總規模達到 180EFLOPS,近五年年均增速超過了 25%,位居全球第二,存力總規模超過 1000 EB。當前的算力規模中,有超過 20% 的算力是智能算力。
《中國算力指數發展白皮書(2022)》也顯示,中、美在全球算力規模中的份額分别爲 33%、34%,其中通用算力份額分别爲 26%、37%,智能算力分别爲 28%、45%,超級算力分别爲 18%、48%。
經過六年的發展,中、美總算力規模近乎持平,通用算力差距也在不斷縮小,但智能算力、超級算力差距依然很大。
03、破籠解鎖,關鍵挑戰
智能算力不足,已經嚴重制約了我國在 AI 領域的創新能力,成爲算力增長下的 " 隐傷 "。
這一點也一直被業内人士所憂慮。如王恩東院士在 2021 年接受采訪時就曾提到:" 雖然目前無法具體統計 AI 算力缺口數據,但中國正在加速數字化轉型 "。
言猶在耳,這一輪大模型引發的算力需求井噴,令 " 隐傷 " 再次放大。
其實國家對算力發展一向重視。2020 年 4 月,國家發改委明确新基建的範圍包含以智能計算中心爲代表的算力基礎設施,算力供給基建化自此成爲趨勢。
2021 年 5 月,《全國一體化大數據中心協同創新體系算力樞紐實施方案》頒布,提出布局全國算力網絡樞紐 節點;2022 年 2 月 ,國家發改委等部門同意在京津冀、長三角等 8 地啓動國家算力樞紐節點建設," 東數西算 " 工程全面啓動。
據至頂智庫統計,截至 2023 年 2 月,全國投入運營、在建的人工智能計算中心達 23 個,其中上海成爲首家智算超算雙中心。從合作方來看,華爲、騰訊、百度等大廠都在積極參與。
智能算力規模也成倍增長。
中國信通院數據顯示,2016-2021 年 6 年間,AI 服務器累計出貨量超過 50 萬台,其中 2021 年就達到 23 萬台;另據 TrendForce 數據,2022 年全球 AI 服務器采購量中,Google、AWS、Meta、Microsoft 合計占比 66.2%,字節、騰訊、阿裏、百度的采購占比分别爲 6%、2.3%、1.5%、1.5%。
AI 芯片目前以 GPU 爲主。IDC 數據顯示,國内 GPU 服務器在 2021 年占國内服務器市場規模的比例超過 88.4%,英偉達的産品占比超 80%。
問題來了,AI 服務器通常需要 4 枚 -8 枚 GPU,僅以 2021 年的出貨量按最低配置計算,需要至少近 65 萬枚英偉達 GPU。但在美國 2022 年 8 月開始的算力封鎖下,之後的訂單從何而來?至少也是縮水版。
這也是中國 " 破籠解鎖 ",做強做大算力産業的關鍵挑戰。
一位國内雲計算從業人士表示," 在封鎖背景下國産替代勢在必行,但過程注定艱難 "," 尤其是制程工藝的限制,美國去年限制是互聯帶寬超過 600G,算力超過 600T 的産品,不能使用台積電的先進代工工藝 "。
該人士解釋到:" 就是國内産品不能超過 A100 的規格,否則不能使用 7nm 或者 5nm 的生産工藝 "," 目前國内有 7nm 産品的隻有中芯國際,但從成熟度和産品産能上都和台積電有差距 "。
不過這位人士認爲,即使有差距,國内公司也會陸續通過中芯國際的生産工藝去生産相關芯片,并通過 chiplet 等先進的封裝工藝将多個 7nm 芯片高速互聯,實現算力的提升。
實際上,高性能計算芯片也不止 GPU 這個處理架構。如像寒武紀的 ASIC 和 GPU 是同樣的應用場景,隻是技術架構不一樣。而算力芯片,不光隻有 GPU,也包含 ASIC、FPGA 芯片。
因此業界認爲,美國封鎖其實有利于國内廠商,如海光信息、寒武紀等獲得更多市場份額,從而加速國産替代進程。另外,随着大模型部署成熟,對性能要求稍低的推理芯片的占比将日益提升,也有益于國産 AI 芯片占比提升。
同時英偉達中國市場特供産品 A800、H800, 雖然性能有所縮水,但在一定程度上緩解了眼下算力供給的壓力,給自主替代留下了緩沖時間。
資料來源:公開信息
當下,H800 正在被阿裏、騰訊、百度等大廠雲計算部門使用。如騰訊雲發布的面向大模型訓練的新一代 HCC 高性能計算集群,就全面搭載了 H800,互聯帶寬達到了目前業界最高的 3.2T。
從長遠來看,據國家信息中心,未來 80% 的場景都将基于人工智能,算力主要由智算中心提供。所以,堅持算力國産化 , 才能最終破局。
爲此,今年 3 月科技部頒布了 " 公共算力平台的建設指引 ",要求在公共算力平台中,自主研發芯片所提供的算力标稱值占比不低于 60%,國産開發框架使用率不低于 60%。
從 AI 服務器産業鏈看,浪潮、聯想、新華三等國内廠商的産品已經占到全球市場 30% 以上的份額;支撐服務器的基礎軟件環節,像阿裏、騰訊、百度的操作系統,也都是基于開源自主研發;數據庫方面,集中式數據庫國外品牌占據了市場份額 90% 以上,但分布式數據庫國内外已經基本相當。
所以,制約中國算力發展的主要瓶頸,還是以 CPUGPU 爲代表的芯片短闆,英特爾、英偉達在國内還占據着較高的市場份額,ChatGPT 大模型 +CPUGPU 芯片的技術壟斷新聯盟也初步形成。
因此,如果說 " 智算中心被納入新基建 " 是新計算時代的算力突圍,如今兩年過去了,這場突圍戰再次打響,或從未結束。這是一場硬仗。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App