10 月 17 日,美國加強了面向中國市場的 AI 芯片禁令。其中明确将性能、密度作爲出口管制标準,将單芯片超過 300teraflops 算力,以及性能密度超過每平方毫米 370gigaflops 的芯片都納入了禁止出口行列。
雖然在這一禁令下,AMD、英特爾等公司提供的高端 AI 芯片也受到影響。但由于英偉達在全球 AI 芯片領域一家獨大,本次禁令涉及 A100、H100 等主流 AI 訓練用英偉達 GPU,因此這次的芯片禁令也被稱爲 " 英偉達禁令 "。
消息一出,立刻引起了 AI 産業的熱議。但讨論大多集中在禁令何時施行,是否有緩沖地帶,具體涉及哪些 GPU 型号,禁令期限是多久等。這就導緻一個顯而易見的宏觀背景被忽略了:自貿易摩擦發生以來,中美經貿關系雖然時有波動,但面向中國的芯片管控卻始終有增無減。尤其是高端 AI 芯片禁令,在諸多争議中依舊被堅定推行。
至此,AI 行業似乎已經必須形成一個基本的共識:抛棄幻想,準備鬥争。
與其斤斤計較哪些 GPU 被禁,是否有解禁可能。不如重新審視在芯片鐵幕時代下,中國 AI 計算究竟何去何從?
本文希望從目前的産業局面出發,和大家一起思考 AI 計算的前行之路。
目前的局面
首先我們必須了解一個問題,那就是爲什麽這次英偉達禁令出台之後,大衆輿論與 AI 行業的反應都沒有 18、19 年芯片封鎖剛開始時嚴重。似乎隻有在消費級顯卡 RTX 4090 是否被禁問題上,引發了遊戲玩家和相關商家的一些争論。
這背後的宏觀邏輯在于,行業是非常不願意看到高端 AI 芯片被禁售的,但其實也對這種局面早有預料。一方面是美國對華芯片封鎖推動多年,此前英偉達部分高端 GPU 已經被禁,産業界的反饋早就從驚愕調整爲了泰然處之。加上 ChatGPT 爆火之後今年全球高端 GPU 行情陡然看漲,随之而來的是美國方面屢次表态要推動對華整體性的高端 AI 芯片禁售。虛虛實實幾個月之後,最終落下一錘也不外如是。
爲了應對這次可預見的禁令,同時也有大模型發展的客觀推動,去年年底到今年上半年大量中國科技、金融、汽車等領域的企業集中囤貨英偉達高端 GPU,已經造成了市面上一卡難求的局面。換句話說,對于很多中國中小型科技企業、AI 創業公司來說,高端 GPU 本就買不到,禁售之後并沒有太多改變。
另外一個真實情況是,高端 AI 芯片并非無法國産化。早在 18、19 年貿易摩擦開始之後,國内 AI 芯片産業加速發展。這就導緻在 AI 訓練需求上,英偉達高端 GPU 雖然很難被替代,但并非不可替代。
加上 AI 芯片并不像手機芯片那樣事關大衆消費者,且華爲已經在手機芯片上完成了突破。種種迹象合在一起,導緻無論是大衆還是行業,都對這次禁令産生了一種坦然,甚至有點見怪不怪的心态。
但必須客觀看到的是,這次禁令絕非對中國 AI 行業沒有傷害。一方面短期内更換英偉達 GPU,無論在芯片産能、生态兼容性等問題上都非常困難。并且禁令還将直接在 AI 服務器等領域,給大規模使用英偉達産品的廠商造成傷害。
而更關鍵的問題在于未來,如果禁令長期存在,中國 AI 計算将逐漸與全球高端芯片脫鈎,那麽可能帶來的長期負面影響是非常複雜的,比如說:
1. 英偉達高端 GPU 代表的 AI 芯片在更新叠代之後,是否會造成中國 AI 算力的發展脫節?
2. 底層算力出現發展分歧後,中國 AI 産業是否會在大模型等軟件技術發展中掉隊?
3. 本次 AI 芯片禁令,已經呈現出大規模封鎖的特征。這種科技封鎖真的隻會停留在 AI 芯片領域嗎?通用算力、存儲、基礎軟件等數字化基礎能力是否将成爲接下來的打擊目标?
總而言之,這次的 AI 芯片禁令,對中國來說是一次有準備的博弈,而非一場奇襲。想要成功度過這一關,也需要将手中的每一張牌都打好,打出配合,從而降低傷害烈度,提升長期發展的勝率。
而就目前來看,中國 AI 計算有三項必須同時發力的 " 突圍方案 "。
方案 1
用好 " 買家 " 身份
有個簡單的道理,商業市場的行爲邏輯是由供需決定的。但在以芯片爲代表的中美科技貿易中,我們經常會陷入一個思維誤區:認爲絕大部分遊戲規則是由美國政府和企業制定的,他們想賣我們就買,他們不想買我們就無奈。
作爲全球芯片市場的最大 " 買家 ",中國企業卻沒有話語權,這是非常荒謬的。
事實上,針對中國市場的 AI 芯片禁令,最直接傷害的就是以英偉達爲代表的美國科技巨頭。目前,英偉達 AI 芯片方面最大市場需求來自中國。此前英偉達 CEO 黃仁勳就明确表示," 如果被剝奪了中國市場,我們是沒有應急措施的,世界上沒有另一個中國 "。
在這種情況下,我們能看到追求商業利益的美國科技公司,與追求政治利益的美國政府之間有着鮮明的矛盾。美國科技企業總是想方設法尋求反對禁令和繞過禁令,比如英偉達就從去年開始推出了應對禁運政策的中國特供版 GPU。
中國市場,消化了美國科技企業約三分之一的産能,二者之間的供需紐帶是無法長期割裂的。面對美國愈發明顯的整體性科技封禁,中國市場也應該積極用好 " 買家 " 身份,讓自身的行爲更具鮮明立場與可預測性。
避免造成一種 " 賣了就歡迎,不賣隻能無奈 " 的表現和印象。
" 買家身份 " 應該是一種有立場、有力量且會憤怒的身份。
方案 2
以雲代卡,算力集中
在可見的較長時間裏,美國對中國的 AI 芯片封禁恐怕都隻會加強,而這個時機恰好對應上 AI 大模型發展的關鍵階段。很多業内人士認爲,大模型發展雖快,但沒有呈現出此前其他科技風口的迅猛局面,投資缺錢,計算缺卡是主要原因。
那麽如何解決中國 AI 産業在禁令之下的算力缺口問題呢?首先的應急方案就是企業加大雲端 AI 算力的配置和投入,推進以雲代卡。
事實上,在高端 AI 芯片可能被禁的大趨勢下,中國幾大公有雲廠商都做出了加強囤積英偉達高端 GPU 的動作。這一方面是因爲雲廠商自身要加大大模型投入,打開 MaaS 市場,所以對 AI 算力有直接需求。另一方面也是因爲 GPU 轉化爲雲資源池之後可以長期複用,對于雲廠商來說是一個進可攻,退可守的局面。因此,今年上半年一度出現了市面上高端 AI 芯片全都流向雲廠商,中小企業一卡難求的局面。
客觀來看,這種高端 AI 芯片集中向雲的舉動,對整個中國市場統籌應對 AI 芯片禁令是有利的,并且也符合東數西算的戰略思路。
另一個利好雲端 AI 算力的趨勢在于,随着大模型參數和使用數據量的不斷加大。本地化的卡池訓練已經愈發吃緊。必須在雲端發生的千卡、萬卡訓練成爲未來主要的發展方向,因此企業用戶天然會更積極走向雲端。
同時,雲端 AI 算力也不會僅僅停留在囤積英偉達 GPU 的層面。接下來,國産的自主 AI 算力駛入雲端是大勢所趨。在相關政策的推動下,雲廠商正在加大自主 AI 芯片的采購力度。根據 IDC 數據,2023 年上半年中國 AI 服務器已經使用了 50 萬塊自主開發的 AI 加速器芯片。在自主 AI 算力的服務化方面,華爲雲已經推出了昇騰 AI 雲服務。雲端化與自主化結合的 AI 算力,将在 AI 芯片禁令背景下得到極大發展。
加上近些年在東數西算大背景下,各地陸續建立了大量采用自主 AI 算力的 AI 計算中心,整體來看中國的雲端 AI 算力是供給穩定、保障可靠的。
而很多企業依舊傾向于采購本地 AI 算力。這一方面是因爲英偉達 GPU 市場緊缺,保值性特别好,甚至能作爲企業的核心資産。另一方面是因爲雲端 AI 算力往往會有排隊、宕機、軟件服務缺失等問題。
如何進一步提高開發者的雲端 AI 算力使用體驗,是公有雲廠商接下來需要發力的方向。
方案 3
讓國産 AI 算力爆發式成長
面對新一輪 AI 芯片禁令,中國 AI 産業最大的底氣是什麽?是多年之後的習以爲常,還是大量屯卡之後的家有餘糧?都不是。最關鍵的節點在于經過多年發展,中國 AI 芯片産業已經得到了巨大發展。英偉達的高端 GPU 确實依舊重要,但已經不是毫無替代選項可言。
根據 IDC 此前發布的數據,2022 年中國 AI 加速卡出貨量約爲 109 萬張,其中英偉達市場份額達到了 85%,華爲昇騰實市場占有率 10%,百度昆侖爲 2%,寒武紀和燧原科技均爲 1%。
從中可以看出,國産 AI 算力已經實現了一定程度的市場占比,而不僅僅是概念與理論中的 " 紙上談兵 "。同時也應該看到,國産 AI 芯片在核心性能、軟件生态以及出貨能力上依舊不理想,還有很長的路要走。在英偉達禁令的客觀條件倒逼下,國産 AI 算力必須在短期内跨越這些困難,加速自身的成長與成熟周期。
爲了實現這個目标,有幾件事非常重要:
1. 形成産業共識,避免概念混淆。
提起 AI 芯片,我們經常會說它有非常多的實現方式,有很多自主品牌參與這個市場,看上去一片繁榮。比如 AI 芯片有 GPU、FPGA、ASIC、存算一體和類腦芯片等,國産 AI 加速芯片廠商有阿裏、百度、華爲、寒武紀、海光信息、燧原科技、天數智芯、壁仞科技、摩爾線程、龍芯中科等。
這種 " 繁榮 " 的表述,不僅在大衆輿論和投資市場上具有迷惑性,還經常出現在一些行業報告與政策分析當中。但其中蘊藏的問題在于,普遍過分拓展了 AI 芯片的定義。比如說,類腦芯片在可見的未來中都僅僅是技術暢想,如果每次讨論國産 AI 芯片都把類腦加上,那隻會浪費時間,分散精力。再比如,有些 AI 芯片廠商隻能做自用芯片,無法面向市場出貨。有些廠商目前還不具備商業化能力,處在早期建設階段,他們短期内對于 AI 計算自主化的貢獻也就非常之小。
爲了應對英偉達高端 GPU 禁售問題,我們需要把目光集中在可行、有效的 GPU 替代品上,而不是進行過多聯想和發散。隻有形成了這一産業共識,才能聚集力量解決問題。
2. 走向規模化商用,避免 PPT 造芯。
事實上,無論從 AI 加速芯片還是服務器整機來看,國内目前能夠出貨的 AI 芯片廠商都寥寥無幾。主要集中在華爲、百度兩家,燧原科技、海光信息也有一定的出貨。而大量半導體廠商與 AI 企業,更多還停留在打造芯片的計劃與願景上。這就導緻大量受到政策支持與投資市場期待的國産 AI 芯片停滞不前,甚至有停留在這一階段享受金融市場紅利的嫌疑。
接下來的産業導向,應該從 AI 芯片的立項走向出貨,幫助 AI 芯片廠商獲得直接的商業回饋,産品與産能接受市場檢驗,逐步塑造正向的現金流。
3. 加強軟件生态,強化遷移能力。
英偉達 GPU 之所以重要,不僅在于硬件性能,更在以 CUDA、PyTorch 爲核心的軟件生态能力,因此發展國産 AI 芯片絕不能低估軟件的能力。在強化自主軟件生态建設的同時,也要重視基于英偉達生态打造 AI 模型的遷移能力與遷移成本。
爲此,已經有大量廠商進行了探索,比如海光信息的 DCU,就在生态、編程環境等方面與 CUDA 高度相似,CUDA 用戶可以以較低代價快速遷移至海光的 ROCm 平台。而在此前,PyTorch2.1 版本宣布支持華爲昇騰。可見國産 AI 芯片已經具備了一定的規模化影響力,可以更多融入全球軟件生态當中。
未來想要實現國産 AI 計算的爆發,是無法離開國産 AI 基礎軟件生态爆發的。
4、加大對 " 主品牌 " 支持,形成規模化效應。
對于美國 AI 芯片,除了英偉達 GPU,你還知道哪些?這個問題即使是問一些 AI 開發者,答案也很大程度是不清楚,或者沒試過。從中可見,AI 計算就像通用計算、圖形計算一樣,極大概率是會最終出現一到兩個 " 主品牌 " 的。這屬于客觀的市場規律,沒有必要以揠苗助長的方式實現 " 百花齊放 " 的局面。
甚至就目前中國 AI 計算必須加速成熟,完成自主化替代的目标來說,盡快實現一超多強的局面是件好事。這可以避免生态割裂,避免産業在搖擺形成大量 IT 投資浪費。這個過程理應交給市場選擇,慢慢成型。但在芯片禁令的大背景下,國産 AI 計算崛起已經時不我待,與其讓 100 種 AI 芯片慢慢成熟,慢慢洗牌,比如加速形成 " 主品牌 " 快速替代的局面。
而從目前局面看,昇騰是最有可能成爲國産 AI 算力主品牌的一支力量。科大訊飛創始人、董事長劉慶峰此前表示,華爲 GPU 已經對标英偉達 A100。根據數據顯示,昇騰 310 整數精度算力達到了 16TOPS,昇騰 910 整數精度算力達到 640TOPS。這意味着昇騰 910 性能已經接近英偉達 A100。
同時,昇騰也是目前唯一穩定占據市場份額的國産 AI 算力,并且在軟件上孵化了類似英偉達 CUDA 的異構計算架構 CANN 和 AI 計算框架 MindSpore。在核心性能、軟件生态與市場占有率三項指标來看,昇騰都已經具備了可以加快成長,實現 AI 算力大規模國産化替代的可行性。
規範行業标準,強化軟件建設,提高自主品牌支持,是短期内推動國産 AI 算力快速成長的主要途徑。
英偉達禁令,是一個中國 AI 行業普遍不願意看到,盡量避免,甚至到今天也有些諱莫如深的問題。但形勢比人強,在不斷加速的逆全球化進程與 AI 競賽中,類似禁令未來大概率隻多不少。
逃避、迂回、噤若寒蟬,都無法解決問題,隻有坦然應對,奮力自強,才能從根本上解決受制于人的問題。
禁令之下,中國 AI 計算何去何從?
答案是我們已别無選擇,所以要給世界第二個選擇。