美國芯片老大英偉達最近越來越 " 高處不勝寒 " 了。
不久前的 SC23 超算大會上,AI 芯片獨角獸公司 Cerebras 首席執行官 Andrew Feldman 公開批評英偉達爲規避美國對華半導體出口限制采取的一系列舉措,認爲這樣做無異于 AI 軍火商," 不符合美國精神 "。
Andrew Feldman 本身來頭不小,早在 2012 年,他創立的低功耗服務器先驅公司 SeeMicro 就被 AMD 收購,他本人負責監管 AMD 服務器芯片業務。2021 年他領導 Cerebras 造出全球最大 AI 芯片 WSE-2,打破在單個設備上訓練擁有 200 億參數的最大 AI 模型紀錄,還推出了世界上第一個人腦規模 AI 解決方案 CS-2 AI 計算機。
這也不是 Andrew 第一次抨擊英偉達,10 月英偉達意外發布 24-26 年 GPU 新品路線圖,Andrew 就曾稱之爲 " 掠奪性預告 ",并說這是利用欺騙性做法和行業主導地位阻礙競争。這次,Andrew 更是毫不客氣地指責英偉達 " 單方面地武裝了中國 "," 這符合法律規定,但并不意味着不需承擔道德責任。"
Andrew Feldman(右一)與團隊見證 WSE-2 芯片入選加州山景城計算機博物館展出。圖片來自 Cerebras
去年和今年 10 月,美國政府兩次以維護國家安全爲由,加嚴人工智能芯片和半導體制造設備對中國等幾十個國家地區的出口管制。緻使包括英偉達、AMD、英特爾在内的許多廠商業務嚴重受挫。
英偉達本月發布第三季度财報後,雖然營收數據繼續飙升,但反映投資者信心的股價卻一路疲軟下跌,也明顯投射出外界對英偉達未來在華市場前景的隐憂。
對于這些禁令,Andrew 表示理解," 這是一項強大的新技術,我們并不完全确定它将走向何方。讓‘友敵’在遊戲初期就獲得我們最好的技術是不明智的。這一切都合理,我也支持。"
盡管可能會對 Cerebras 與中東的業務往來造成影響,他仍然認爲當規則制訂時,應該遵循精神而不僅僅是字面意義," 政府說我們不希望你向中國出貨,你就跑到它的邊緣,然後試圖通過漏洞來規避意圖,這讓你看起來很不美國。"
而對于英偉達來說,雖然在管制邊緣的 " 蛇皮走位 " 是大實話,但面對占收入總額高達 47% 的中國市場,換了誰這種調整也都不得不做。
英偉達與美國芯片出口管制的 " 博弈 "
去年 10 月,美國政府突然宣布對華半導體出口管制新規,規定高性能計算芯片出口必須低于 4800 TOPS 算力上限和 600 GB/s 的帶寬上限,直接導緻 NVIDIA A100/H100 系列和 AMD MI200/300 系列 AI 芯片無法對華出售。
當時國内許多高端場景和主流廠商都采用 NVIDIA A100,也預定了大批計劃下半年發貨的 H100,新規的出台讓人措手不及。
爲了填補市場缺口,解決中國客戶需求,英偉達一個月後就宣布推出符合美國出口規則的 " 中國特供版 "A800 和 H800。前者将 NVLink 傳輸速率由 A100 的 600GB/s 降至 400GB/s,其它參數基本保持不變,後者則把芯片間數據傳輸速度改爲 H100 的一半。據稱,阿裏巴巴、百度、騰訊這 BAT 三巨頭和互聯網大廠字節跳動都已用上了 800 系列産品。
圖片來自 Pexels
然而今年 10 月 17 日,禁令再次升級。美國商務部修訂芯片出口新規,引入 " 性能密度 " 參數并調整先進芯片劃定标準,禁止向中國出售每秒能進行 3 億次及以上運算的數據中心 GPU;要求企業申請許可後才能向 40 多個國家和地區出售芯片,同時将需要申請半導體制造設備許可證的國家數量擴大到 21 個;并把包括壁仞科技、摩爾線程在内的 13 家中國公司列入出口管制名單。這并不是結束,美國商務部長雷蒙多表示,随着技術的進步,這些規則至少每年都會更新一次。
美國此舉是爲了防止英偉達等全球領先芯片公司尋求變通方案,也切斷中國企業從其他國家和地區獲取高性能芯片的渠道。試圖在半導體市場對中國進行全面狙擊,阻止中國人工智能、精密計算等先進技術發展。
這次英偉達的産品更是倒下了一大片,包括但不限于:A100、A800、H100、H800、L40、L40S 以及 RTX 4090。爲中國市場量身定做的 A800/H800 落在了管制範圍内,更不用說 11 月推出的 " 算力怪獸 ",最新旗艦芯片 H200。
而 " 上有政策,下有對策 " 也被英偉達發揮得淋漓盡緻。面對新的管制條例,黃教主表示,一定遵守,但還是希望 " 繼續與中國客戶合作 "。
除了積極溝通美國商務部申請許可,本周三英偉達 CEO 黃仁勳向外界證實,公司又爲中國市場開發(" 閹割 ")出幾枚符合最新規定的特供芯片。
根據早些時候外媒報道,這三枚芯片分别是H20、L20 和 L2。半導體研究公司 SemiAnalysis 也将它們的各項性能參數列了出來:
圖片來自 SemiAnalysis
從圖表中可以看出,用于 AI 模型訓練的 H20 在 H100/H800 基礎上再次降規,與 H100 芯片的最大算力值 1979 TFLOPs 相比,H20 這一數值僅有 296 TFLOPs。總處理性能爲 2368,性能密度 2.9,小于 3.2 的管制許可值。
但值得玩味的是,H20 有比 H100 更高的緩存和帶寬,在實際多卡互聯環境中組合性能接近 H100 的 50%。雖然從傳統計算角度來看比 H100 降級不少,但在執行大模型推理運算任務上,它比 H100 還要快 20%,這表明雖然 H20 不能滿足千億級别參數的 LLM 訓練需求,但在稍小的垂直模型推理方面,或許有事半功倍的效果。
而 L20 和 L2 分别替代此前遭到管制的 L40 和 L4,采用 PCle 外形規格,配置更精簡,在 LLM 推理訓練中不常用,更适合工作站和服務器。其中 L20 的總處理性能爲 1912,性能密度 3.1,小于許可值 3.2;L2 的性能密度爲 5.2,但總處理性能僅爲 1544,也小于 1600 的管制許可值。三枚芯片都巧妙地越過了新規管制中精心設計的封鎖條件。
英偉達的迅速反應再次體現出它對中國市場的重視和對重新提振投資者信心的迫切。在這場與規則的博弈中,也一直是 " 逢山開路、遇水架橋 ",絲毫沒有示弱的勢頭。
黃仁勳的 " 警告 "
對于同行的指責,黃仁勳似乎也并不爲之所動。他這周出席年度 DealBook 峰會時重申,英偉達對于中國市場的承諾将保持堅定。
" 我們必須開發出符合出口管制規定的新芯片,一旦滿足要求,我們就會回到中國銷售。" 他表示認同國家安全和競争力的重要性,但作爲 " 一家爲了做生意而建立的公司 ",英偉達 " 盡可能與所有人做生意 "。
黃仁勳在 DealBook Summit,圖片來自 Slaven Vlasic | Getty Images
黃仁勳也對這些出口禁令可能帶來的意外後果發出了警告。他說,目前有多達 50 家中國公司正在開發能與英偉達競争的技術。如果美國企業在市場上失去份額,其競争力也可能随之降低。盡管英偉達不會向中國提供其制造芯片的 " 最關鍵和最前沿技術 ",中國仍然可能找到獲取這些技術的途徑,或者激勵國内芯片制造商發展,他還特别提了一嘴受制裁的華爲。
這些警告不無道理,或者說正在變爲現實。
被美國列入實體管制清單的科大訊飛就在今年的三季度業績說明會上宣布,用于訊飛星火大模型訓練的華爲昇騰 910B 芯片在性能上已經基本可對标英偉達 A100。百度也已向華爲訂購 1600 顆昇騰 910B 用于開發文心大模型。
盡管這筆訂單與中國高科技公司們向英偉達訂購的成千上萬顆芯片相比顯得微不足道,但它仍然意義重大,顯示出中國公司有能力減少對美國尖端技術巨頭的依賴。
美國加碼對華芯片封鎖,雖然一段時間内内給中國半導體行業帶來不小沖擊,但中國市場面臨的算力缺口同時也會爲本土芯片發展帶來新的機遇。2023 年上半年,中國加速芯片的市場規模超過 50 萬張,除華爲外,阿裏、百度、騰訊都已經有 AI 自研芯片,中國芯片市場也正在 " 自産自銷 " 的路徑上發展。
雖然黃仁勳認爲 " 英偉達已在行業上領先十年 ",但他同時也表示," 如果我們被剝奪了中國市場,我們是沒有應急措施的,世界上沒有另一個中國。"
" 美國想脫離中國芯片供應鏈可能還得 20 年 "
在 DealBook 峰會上,黃仁勳也指出,美國若想完全打破對中國制造的依賴,實現完全獨立的芯片供應鏈體系,需要比想象中更長的時間:"在 10 年到 20 年以内,這并不是一件實際的事情。"
他說,公司的成功依賴于 " 來自世界不同地區的衆多組件,不僅僅是台灣 ",雖然最重要的技術來自台積電生産線。
而英偉達在中國大陸的合作商則爲其提供包括上遊半導體材料和設備、服務器整機、光模塊、光纖光纜等多個環節的供應鏈支持。
如今的芯片制造業高度全球化,重建這些供應鏈需要在基建、制造技術和工藝上重大升級,在沒有中國參與的情況下,是一個幾乎不可能完成的任務。
根據最新消息, H20 将推遲至明年一季度發布,最快可能于 2 月或 3 月接受預定,具體細節仍處于保密狀态。
英偉達再次越過管制門檻的中國特供芯片們真實性能參數幾何,上市後産能和業績表現怎樣,能不能彌補 A800/H800 禁售帶來的中國市場收入缺口,來年美國半導體管制政策是會松動還是繼續緊縮,這些都是未知數。唯一可以肯定的是,放棄與中國市場做朋友,絕對不在英偉達的選項上。