美國政府的最新 " 芯片禁令 " 提前生效。
10 月 25 日,英偉達向美國證券交易委員會遞交的一份文件中披露,美國政府通知該公司,針對适用于總處理性能大于等于 4800TTP 并爲數據中心設計或銷售的産品的相關出口管制,立即生效。該管制影響到的英偉達産品有 A100、A800、H100、H800 和 L40S 等。
事情緣起當地時間 10 月 17 日,美國商務部工業和安全局更新了針對中國的 " 先進計算芯片和半導體制造設備出口管制規則 "(下稱 " 新規 "),新規設置了 " 性能密度阈值 " 作爲參數,隻要芯片總算力大于或等于 4800TTP,不論互聯帶寬多少都受管制。在新規的補充說明裏,美國商務部毫不掩飾地表示設置這一參數的目的就是限制芯片被用于訓練大型兩用 AI 基礎模型。
該新規将英偉達、AMD、英特爾等廠商現有的高性能算力芯片全部涵蓋。此外,美國商務部還擴大了芯片制造工具出口限制清單,中國兩家國産 GPU 制造商摩爾線程、壁仞科技被列入 " 實體清單 "。媒體還爆料,美國政府在考慮限制向中國 AI 公司出租雲服務,确保美國企業不能 " 靈活運用 " 規則。
原本新規有 30 天公示期,被行業人士視爲 " 最後 30 天窗口期 "。在窗口期内,中國企業可以集中采購、運輸急需的高端 AI 芯片。出于對中國市場的依賴和商業契約,理論上美國芯片企業會配合盡快完成中國企業的訂單。
結果 8 天後,新規提前執行。受此消息影響,英偉達股價在當天下跌 4.31%,第二天又下跌 3.48%。而對于中國科技、大模型創業企業來說,同樣是影響巨大的,這意味着無法再獲得訓練大模型所需的高性能算力芯片。
《最話》了解到雖然提前儲備了不少 H800 芯片,但面對新規提前執行,各家中國科技企業并沒有解決辦法。
如果說有,那就是 " 推動算力國産化 "。
從目前來看,除了租用雲服務算力,能大量采購到的部分替代英偉達的高性能算力芯片,隻有華爲昇騰系列(HUAWEI Ascend)AI 算力芯片。
《最話》從接近華爲的人士了解到,目前無論是華爲 AI 集群的算力,還是涉及到的硬件設備," 供應都是非常充足的。"
01
" 卡脖子 "
自從生成式 AI 浪潮席卷全球,各大科技巨頭紛紛加碼大模型開發。訓練大模型需要大量高性能 AI 算力芯片。據市場調查機構 TrendForce 數據顯示,如果以英偉達 A100 芯片的處理能力計算,GPT-3.5 大模型需要上萬塊 GPU 來處理訓練數據。
中國科技企業開發的大模型所需的高性能算力芯片也在萬塊以上,并且随着大模型叠代,所需的芯片量還會增加。
按照一份流傳出的交流紀要,阿裏雲 AI 專家提到,阿裏雲在雲上就有上萬片的 A100,整體能夠達到 10 萬片,集團體量應該是阿裏雲的 5 倍。騰訊雲利用 H800 加速卡打造的大模型算力集群,集群規模達到了數千台服務器。
2022 年 10 月,美國發布了針對 A100、H100 和 GH200 等 AI 芯片的限制措施,停止向中國出口。
一時間 A100 芯片價格暴漲,《最話》了解到今年原價 1 萬美元 / 張的 A100,年中在市場上報價 15 萬元 / 張,更有 " 黃牛 " 報價 155 萬元 / 張,是原價的 21 倍。
英偉達通過減配等方式繞過了美國 " 芯片禁令 ",可以繼續對華銷售 H800 和 A800 型号芯片,綜合使用效率雖然隻有 A100/H100 的 60%,但已經是中國企業在從英偉達手裏買到的最好的芯片。
根據英偉達 2022 年财報 , 中國區銷售收入占到總收入的 20%。媒體推測,僅中國四大互聯網巨頭百度、字節跳動、騰訊和阿裏巴巴就向英偉達下單購買了價值 50 億美元的 A800 顯卡。
英偉達當然不想失去中國市場,今年初,英偉達 CEO 黃仁勳就在媒體面前反複強調着中國市場不可替代的重要性," 沒有另一個中國,隻有一個中國。" 他甚至還表示,限制向中國出口人工智能芯片将導緻美國行業永久失去機會,也不可能限制住中國的發展。
雖然英偉達舍不得數十億美元的訂單,但作爲一家美國企業,英偉達必須要遵守美國監管機構的新規。
在新規公布後,英偉達緊急表示:" 鑒于全球對我們産品的需求,我們預計新的規定短期内不會對我們的财務業績産生實質性的影響。" 不過,官方也承認:" 新規定可能會影響公司的開發和交付能力,包括按時完成某些産品開發,爲現有客戶提供支持,或者向受影響地區以外的客戶供應這些産品。"
坊間流傳的消息顯示,英偉達建議國内客戶在 10 月 17 日晚 12 點前增補訂單,并間接承認後續新增訂單将很難獲得供貨保證。
而現在未交付的訂單和增補的訂單都打了水漂。對于此前下了訂單,等着芯片構建算力集群的中國科技公司來說,新規提前執行,芯片沒了,也不知何時才能拿到。
一位雲計算企業人士說," 合同都提前寫好了不可抗力會免責,這沒辦法。" 對于租用他們算力的大模型客戶,雲計算企業也要求客戶給予免責。至于自建算力的大模型企業,同樣面臨着 " 停芯 "" 後續無芯可用 " 的窘境。一連串連鎖反應正在發生。
國際市場調研機構 Counterpoint 估算,目前中國科技企業落後 OpenAI 的 GPT-4 等頂尖大模型大約 2.5 年到 3 年。芯片供應不穩定的狀态下,該機構認爲,中國科技企業與全球同行的差距,在未來幾年将繼續拉大。
02
"B 計劃 "
所以,無論是從自主可控還是從經營角度,中國科技企業必須盡快另覓高性能算力芯片的供應商。
算力芯片粗略可分爲訓練、推理兩種用途,前者需要更大的算力規模。從目前來看,國内投入大規模量産并在業務上使用的算力芯片有華爲昇騰 910、阿裏倚天 710、百度昆侖芯 2 代、騰訊紫霄、海光 DCU Z100 等。
據《電子工程專輯》發布的《45 家國産 AI 芯片廠商調研分析報告》,阿裏倚天 710 是 CPU,用于邏輯計算,而非 AI 推理訓練;百度昆侖芯 2 代被應用于文心一言大模型的推理端,訓練端主要還是使用英偉達 V100 和 A100;海光 DCU Z100 訓練算力較小,不到 100TFLOPS,隻适合一些推理場景,不足以支持訓練大模型;騰訊紫霄雖然大規模投入實際業務中,但定位于偏中低端,用于 AI 推理。
2019 年 8 月 23 日正式推出的華爲昇騰 910 是國内算力最強的 AI 處理器,芯片基于自研華爲達芬奇架構 3D Cube 技術。昇騰 910A 隻支持 FP16 半精度計算,而昇騰 910B 已升級到支持 FP32 單精度計算,昇騰 910B 的 FP32 單精度計算算力可達 75T,支持 HBM 内存技術,可以用于大模型訓練,已适配盤古、Llama、清華大學自研大模型等。
科大訊飛在第三季度業績說明會上曾透露,公司已于今年初與華爲昇騰啓動專項攻關 , 如今華爲發布的昇騰 910B 能力已經基本做到可對标英偉達 A100 芯片 , 未來算力緊張狀态将得到緩解。
昇騰 910 系列芯片采用 7nm 工藝制程,此前由台積電代工。一位數碼博主在微博上稱," 華爲芯片制造問題解決了,往後幾年将是海思各類芯片的井噴,華爲昇騰也全面開花了 "。
這與《最話》了解到的情況大緻相同,麒麟 9000S 芯片的良品率已經基本達到台積電水平,這意味着 7 納米的良品率和産能已經不是大問題,目前華爲内部各條業務線都在搶産能,其中就包括昇騰 910 系列芯片。
《最話》從接近華爲的人士了解到,目前昇騰主要有兩種類型的客戶,一類是制造業客戶,買兩三台做 AI 質檢,對并行計算沒什麽要求;還有一類是央企國企背景的企業,會與華爲有深度溝通和合作。但一些中型或者大型科技企業," 目前合作是比較少的,它們過去肯定是優先購買英偉達的産品,現在有可能轉向購買國産 AI 算力芯片了。"
" 目前來看,華爲無論是平台的算力,還是涉及到的硬件設備的供應,都是非常充足的。" 該人士表示。
昇騰 910B 支持的 FP32 單精度計算,對于一般圖形處理計算、深度學習、大模型等領域,已經夠用。但對于需要處理的數字範圍大且需要精确計算的科學計算,如計算化學、分子建模、流體動力學等,就需要支持 FP64 雙精度計算。
原定于 2021 年推出的昇騰 920,因受 2019 年美國對華爲的制裁影響,進度大幅延宕。今年 5 月,在華爲昇騰開發者峰會上,一張 PPT 引發了關注,很多人在猜測雲腦Ⅲ 原型機采用的會不會就是昇騰 920。這就隻有時間來證明了。
同時,華爲也在開發技術工具,幫助客戶在不同計算卡間解決算力調度問題,方便客戶混合部署。
03
背水一戰
新規出台後,黃仁勳強調,中國本土也有包括華爲在内很多優秀的科技廠商,英偉達必須努力與這些企業競争。
但誰都知道,英偉達在 GPU、高性能算力芯片領域的地位是短時間内難以撼動的。花旗研究分析師 Christopher Danely ( 克裏斯托弗 · 丹尼利 ) 表示,英偉達将占據 AI 高性能計算芯片市場至少 90% 的份額。
新規如果不能解除,那就意味着絕大部分想自研通用大模型的中國 AI 創業企業将面臨巨大挑戰,當然,資金實力雄厚的科技大企業,還可以通過與華爲等協同攻關或直接采購以熬過難關。
這是在與時間賽跑。
英偉達首席科學家表示:" 随着訓練需求每 6 到 12 個月翻一番,這一差距将随着時間的推移而迅速擴大。" 生成式 AI 實在發展的太快了,新規毫無疑問是想拉大國内企業和美國企業在人工智能上的時間差和代差。面對英偉達在硬件上、Open AI 在算法上不斷叠代,中國科技企業并沒有太多猶豫時間,也沒有太多試錯機會,必須保證每一步做出正确的決定。
美國政府一紙規定,就讓英偉達被迫退出中國高性能算力芯片市場,這一局面不是黃仁勳希望看到的。10 月 21 日,黃仁勳曾表示,英偉達會遵循美國政府的相關規定,但也 " 希望盡可能擁有較大的市場,會盡量支援各個市場需求,也支持中國大陸市場客戶。"
隻是處在夾縫中的英偉達并沒有選擇的餘地。同樣沒有選擇餘地的還有 AMD、英特爾,AMD 的 MI250X、MI300,英特爾的 Gaudi 2、Gaudi 3 也上了管制名單。據報道,黃仁勳、英特爾高層和美國高級官員交涉過,但無功而返。
AI 算力芯片折舊一般 2-3 年,最長不超過 5 年。管制新規生效後,即使國内科技大廠、大模型創業公司囤積了不少 H800,很會在未來兩三年後面臨折舊、換代的需求,如果得不到補充,将面臨巨大困境。
與此同時,哪怕其他國産 AI 芯片企業能解決授權、設計問題,在制造領域還得靠台積電等芯片企業代工,在供應渠道上也有一定不确定性。
現在就需要看國内企業能否通力合作解決半導體制造全産業鏈問題了。
此時此刻,所有科技公司都在夾縫中尋找生機,英偉達、AMD、英特爾掌握着先發優勢和巨大市場,新規并不會造成緻命影響,但對于國内科技、算力芯片企業來說,在管制新規的高壓之下,想要活下去,唯有背水一戰。