留給鐵娘子的時間不多了
早在 2015 年,全球 GPU 芯片龍頭英偉達的創始人黃仁勳就曾犀利地評價競争對手 AMD:" 我們已經好多年不看 AMD 的動作了,當(英偉達和 AMD)差距是 9 跟 0 的時候,已經不是差距的問題了。" 在圖形顯示等 GPU 傳統應用市場,英偉達長期占據了 80% 以上的市場份額,将 AMD 遠遠甩在後頭。但随着 AI 大模型時代到來,AMD 正試圖憑借空前強大的芯片新品和難得的産業機遇,攻入英偉達的腹地。
" 我在不停打仗 ",在芯片界鐵娘子蘇姿豐(Lisa Su)的職業生涯裏,有兩場至關重要的戰役。
第一場,是在 2014 年接手 AMD(美國超威半導體),以力挽狂瀾之勢讓 AMD 從深陷财務危機到一舉成爲英特爾最強勁對手,股價上漲了 40 倍。另一場則是在當下,今年 6 月,AMD 發布了針對 AI 需求的最新款芯片 Instinct MI300,這是其狙擊英偉達最強勁的一個武器。
在 GPU 芯片領域,AMD 與英偉達的緣分妙不可言。英偉達與 AMD 長期以 " 八二開 " 的比例瓜分着全球市場份額,在圖形顯示等市場并稱雙雄。而媒體則樂于炒作二者更私人的關系——比如,英偉達 CEO 黃仁勳與蘇姿豐可能存在的 " 表親關系 ",當然,雙方從未在任何場合正式回應過這些話題。
無論關系如何,黃仁勳一點都不手軟,他對鐵娘子蘇姿豐的第二場戰役迅速展開了雷霆反擊。
北京時間 11 月 13 日晚間,英偉達發布了全球最強 AI 芯片 H200,其性能較 H100 直接翻倍。打了搶先發布 MI300 的 AMD 一個措手不及。此前,AMD 表示,公司正在今年第三季度向客戶提供樣品,産量将在第四季增加。原本 MI300 将有望成爲 AMD 最快銷售額破 10 億美元的産品。
英偉達稱 H200 将在 2024 年第二季度開始交付,留給 AMD 搶跑的時間不多。
AMD 開打第二場 " 翻身仗 "
AMD 還是樂觀了。
今年 Q3 财報發布之際,AMD 曾大膽給出業績預期:四季度營收将達到 58 億美元至 64 億美元之間,預計爲 61 億美元,同比增長 9% ——這也将是 AMD 自 2022 年第三季度以來,最高的季度收入。
這種預期也可以理解,2023 年第三季度,AMD 營收 58 億美元,淨利潤 2.99 億美元——是連續 7 個季度的淨利潤同比下滑之後,首次實現季度淨利潤的同比正增長。
而 AMD 幾乎将自己未來業績強勁增長的底牌,全部押注在了一款産品上:
今年 6 月份,AMD 專門針對 AI 大模型訓練需求發布的 Instinct MI300 系列芯片。這幾乎是全球範圍内,第一款能夠直接對标英偉達大模型訓練芯片 H100 的産品。
根據 AMD 官方信息,MI300 在部分技術指标上相比英偉達的 H100 更具優勢,比如 MI300 提供的 HBM(高帶寬内存)密度是 H100 的 2.4 倍,HBM 帶寬是 H100 的 1.6 倍。這意味着 AMD 可以運行比英偉達 H100 更大的模型。
驚豔四座的 ChatGPT 大模型大部分基于英偉達 2020 年發布的 A100 芯片進行訓練。而在 2022 年 3 月份,英偉達面向 AI 大模型訓練需求專門發布了 H100 芯片。
從亮相開始,H100 就迎頭趕上了 " 百模大戰 " 的風口,成爲了被各方力量争奪的寶貴算力資源。據坊間傳聞,早在今年第三季度時,英偉達 H100 的訂單就已排到了 2024 年,至今産品稀缺程度有增無減。
盡管如此,在發布會上蘇姿豐還是表現得十分有信心:" 我們認爲,數據中心人工智能加速器 ( 市場 ) 将以超過 50% 的複合年增長率,從今年的 300 億美元左右增長到 2027 年的 1500 億美元以上。"
AMD 計劃在第四季度量産 MI300。在此基礎上,公司預計在第四季度,包含 MI300 在内的數據中心 GPU 業務營收将達到 4 億美元;而在整個 2024 年,公司數據中心 GPU 産品有望實現 20 億美元的銷售額。
AMD 數據中心 GPU 産品的下遊市場既包括科學計算等高性能計算領域,也包括 AI 領域,但蘇姿豐認爲後者才是業績的主要增長動力:" 随着 2024 年的到來,我們預計收入将繼續按季度增長,而且,這将主要來自人工智能。"
而其中 MI300 被寄予厚望,将成爲該公司 " 有史以來最快達成 10 億美元銷售額的産品 "。
此前,AMD 雖然在 GPU 市場名列第二,但主要應用于圖形處理、消費級産品等傳統 GPU 應用場景,在 AI 和高性能計算領域始終存在感較低。
從 MI300 的性能指标而言,AMD 本來已經幾乎具備了與英偉達叫闆的能力,直到 H200 橫空出世。在 H200 發布會結束結束後,AMD 收盤股價下跌 1.52%。
在未來,AMD 想要在如火如荼的 AI 技術市場中搶得一席之地,面前的壓力仍毋庸多言。
至今 AMD 尚未公布 MI300 的官方定價,但市場預計,爲了增加與英偉達的競争籌碼,AMD MI300 或許不得不延續其在傳統 GPU 市場的性價比路線。
不僅如此,爲了完成預期業績,AMD 還于 10 月份在上海啓動了一輪裁員 " 瘦身 "。
據一位 AMD 前員工對「市界」透露,本次 AMD 給出的賠償條件是 "N+3" 倍的月工資,主要涉及的部門爲 SoC(系統級芯片技術部門)和 RTG(Radeon 系列顯卡技術部門)。
一步慢,步步慢
大模型時代,AMD 等來了一個翻身機遇,隻是對這份機遇 AMD 做出的反應還是晚了。
一位在國内高校任職的 AI 研究人員告訴「市界」:" 除了媒體報道的韓國(指該國電信運營商’ KT ’)使用 AMD Instinct 平台運行了 AI 大模型的新聞,在日常研究裏,我還沒有接觸或了解到使用 AMD 芯片訓練的項目。"
這種情況也反映在了市場數據上,據 IDC 調研,2022 年中國 AI 加速卡(即 AI 訓練芯片)出貨量約爲 109 萬張,其中英偉達在中國 AI 加速卡市場份額爲 85%,華爲市占率爲 10%,百度市占率爲 2%,寒武紀和燧原科技均爲 1%。根據這組數據,AMD 的 AI 訓練芯片在國内市場甚至 " 沒有姓名 ",淪爲其他。
不僅如此,亞馬遜 AWS、谷歌、騰訊雲等全球主要雲廠商的 AI 芯片也大多來自英偉達及自研,采用 AMD 産品的占比較小。
追溯形成顯著市場差距的原因,可以将目光轉向多年之前。
英偉達創始人黃仁勳曾這樣總結:" 我們很早地,大約在 10 年前就發現,(AI)這種制作軟件的方式可以改變一切。我們從底層一直到頂層,從各個角度改變了公司。"
在一家美國 GPU 獨角獸企業擔任市場總監的 Lee 告訴「市界」:" 早在 2012 年,英偉達就開始投入在深度學習的計算了,而且是在全公司範圍内貫徹執行。" 而這相較業内普遍意識到 AI 芯片的重要性,至少早了四五年的時間,領先一個身位。
從 2016 年開始,英偉達旗下的加速計算 GPU 産品線(代号 "Tesla")開始專門針對 AI 訓練任務進行設計。這一年推出的芯片型号爲 P100,同時配備有英偉達新研發的高速互聯技術 "NVLink"。而 NVLink 能夠允許 CPU、GPU 芯片間進行高速交互,進一步提升了運算效率,至今仍是英偉達 AI 芯片中的核心技術之一。
還是在這一年,英偉達向後來推出了 ChatGPT 的 OpenAI 捐出了一台搭載了 8 塊 P100 芯片、價值百萬的超級計算機 "DGX-1"。在這台超算的機箱上,黃仁勳親手寫道:" 爲了計算和人類的未來,我捐出世界第一台 DGX-1。"
後來的種種迹象都表示,這段時間正是人工智能的黃金發展期。正是在 2016 年,谷歌 Alpha go 擊敗了圍棋大師李世石,被視爲 AI 技術邁上新台階的重要标志。不僅如此,AI 相關産品、硬件、軟件等的市場規模已經超過 80 億美元。
反觀同一時期的 AMD,雖然同樣試圖在 AI 方面有所布局,但彼時其重心更多放在 CPU 業務線上,并未像英偉達一樣全面押注。
2016 年,AMD 正式推出 Radeon Instinct 系列産品線,旨在加速深度學習、神經網絡和高性能計算等方面應用。
然而從産品更新情況而言,AMD 對旗下 AI 芯片的設計顯然不夠 " 上心 "。在之後的 4 年間時間裏,Radeon Instinct 系列雖然不斷更新,但始終與 AMD 的消費級顯卡 Radeon 公用基礎架構,在計算方面缺乏針對性和高效率,難以滿足 AI 訓練的需求。
直到 2020 年,這種情況才有所轉變。這一年,AMD 将 AI 芯片産品線更名爲 "Instinct",并首次抛棄了以往的消費級顯卡架構,爲其采用了專門設計的 CNDA 計算架構。
在此之後,AMD 連續更新了三代産品 MI100、MI200,以及最新發布的 MI300。憑借全新的技術路線,以及采取高性價比的市場策略,AMD 才開始在 AI 訓練市場中有人問津。
隻是,在 AMD" 缺席 "AI 市場的幾年裏,英偉達已經建立起了極強的生态壁壘。
英偉達建築的高牆
Lee 這樣向「市界」描述英偉達在 AI 領域樹立的優勢:" 真正難的并不是說比别人跑的多快,而是圍繞着這一個主題,進行全方位點點滴滴的下注,從語言設計到開發者工具這些周邊的東西才是最難得的。"
而周邊工具一旦被用戶所接受," 客戶技術遷移的成本将會是難以想象的高 "。
資深 AI 從業者路雲的說法也從側面印證了這一點,據其回憶:" 早在大約 10 年前,我們學校就給高性能計算相關專業的學生開設了基于 CUDA 的課程。"
CUDA 是英偉達在 2006 年推出的通用并行計算架構,借助 CUDA 提供的編程接口和工具集等,開發者可以基于 GPU 芯片編程、運行複雜的 AI 算法等等。
全球頂尖 AI 學者、前百度首席科學家吳恩達曾這樣評價 CUDA:"CUDA 出現之前,全球能用 GPU 編程的可能不超過 100 人,有了 CUDA 之後使用 GPU 就變成了一件非常輕松的事情。"
這樣一代代的開發者和研究者,用汗水澆灌出了英偉達的強大生态。換句話說,即使 AMD MI300 的官方性能指标相比英偉達 H100 體現出優勢,後者的生态壁壘仍舊難以逾越,更别提 H200 展現出了更強的性能指标。
這樣的背景下,AMD 想要逆風翻盤,除了着力補上生态差距,還不得不在市場策略上别出心裁。
生态方面,2016 年,AMD 推出了對标英偉達 CUDA 的 ROCm 架構。據東吳證券研報,由于 ROCm 平台起步晚,其對于 GPU 加速庫的支持沒有英偉達 CUDA 全面。CUDA 的應用場景基本能夠覆蓋全場景,但 ROCm 更多用于高性能計算領域,對 AI 的覆蓋稍顯不足。
至今,AMD ROCm 平台的工具鏈已經相對完善,并且能夠兼容英偉達的 CUDA 平台。此外,爲了進一步優化軟件生态,AMD 還在 2023 年 10 月份官宣收購了 AI 軟件企業 Nod.ai。
對此東吳證券研報評論道:AMD 的軟件生态在公司大力投入和其它廠商積極扶持下,有望徹底改善。
(英偉達與 AMD 軟件生态工具鏈完善程度對比。圖源 / 東吳證券)
另一方面,AMD 高性價比的市場策略将是其在 AI 領域的另一大優勢。聯博資産管理公司的分析師 Stacy Rasgon 認爲,提供’平替版的英偉達’,将是 AMD 争取市場支持的關鍵。
AI 研究公司 Cambrian AI Research 則分析稱,大公司需要 " 第二供應商 " 的戰略将爲 AMD 提供機遇:" 像 OpenAI 和微軟這樣的公司需要有一個能替代英偉達産品的選擇,AMD 可能會給他們一個無法拒絕的提議,但不要指望能從英偉達那裏搶走很多份額。"
無論如何,大模型産業疾速發展帶來了巨大的算力缺口:根據 OpenAI 數據, 模型計算量增長速度遠超人工智能硬件算力增長速度,兩者之間存在萬倍差距。
對于長期在 AI 領域缺乏存在感的 AMD 而言,它正迎來了最好時機。