作者丨邱曉芬
編輯丨蘇建勳
10 月 10 日,一年一度的 Advancing AI 大會上,美國芯片巨頭 AMD 發布了一系列重磅的芯片産品更新,覆蓋 AI PC 的處理器、EPYC 處理器、DPU 等等。
在英偉達最新的 Blackwell 芯片面臨交付困境的當下,AMD 最新的 GPU 産品系列(AMD Instinct MI325X)将如何出牌,直接關系到 AMD 的未來,自然成爲各界的關注焦點。
在參數上猛追英偉達,是 AMD MI 系列一以貫之的打法,此次的 AMD Instinct MI325X 芯片也不例外,選擇緊密對标英偉達上一代芯片産品 H200。
不過,好消息是,從産品信息來看,AMD 如今逐漸找到了差異化競争的策略—— AMD 這款産品逐漸把精力都放在了提升内存、推理能力上。
AMD 創始人蘇姿豐發布 AMD Instinct MI325X 系列芯片
首先,AMD Instinct MI325X 上配備了 256GB 的 HBM3E 高帶寬内存,提供了 6TB/s 的内存帶寬——參數上比英偉達 H200 大許多(H200 分别是 141G、4.8TB/s)。
其次,盡管 AMD 這款産品在 FP16(16 位浮點數)上的算力沒有英偉達那麽強,但推理能力卻比英偉達 H200 整體高出 20%-40%。
重倉推理,不失爲一項明智之舉。一位行業人士向 36 氪表示,今年算力中心的一大趨勢是,随着部分大模型廠商逐漸放下預訓練,推理和模型微調的訴求增加。
" 某算力中心客戶,去年預訓練和推理的比例是 7:3,今年完全反過來了 "。下遊大模型、應用廠商的需求變化,上遊芯片廠商更需要及時做好策略轉向。
不過,隻有單芯片的差異化競争是遠遠不夠的。AMD 此次也從體系化入手,彌補在連接、軟件生态上的短闆。而這也正是英偉達的壁壘最高處。
英偉達産品的一大優勢是,依靠 NV-Link,使得多個單芯片連接起來之後依舊強大,不因芯片互聯傳遞而折損算力。而此次,AMD 則依靠他們的 Infinity Fabric 互連技術,使得多卡的效果比單兵作戰更強。
據介紹,當 8 張 AMD Instinct MI325X 搭配在一起時,相比于同樣數量級的英偉達(即 H200 HGX),内存是其 1.8 倍、内存帶寬是其 1.3 倍、算力更是其 1.3 倍。
在軟件生态方面,AMD 也持續補短闆。AMD 的軟件平台 ROCm 通過持續調教、以及與多個 AI 開發平台深度合作,不僅不會拖後腿,反而提升了整體效率。
經過 AMD 方面的實測,當跑 Meta Llama-2 模型時,AMD MI325X 單卡在 ROCm 的加持下,訓練效率超過了英偉達 H200。而若用 AMD 的 8 卡集群跑,訓練效率仍也與 H200 HGX 相當。
在此前的台北電腦展上,AMD 創始人蘇姿豐已經明确,GPU 産品節奏向英偉達看齊,要" 一年一更新"。AMD 除了發布 Instinct MI325X 系列之外,也順便透露了未來産品的情況——
據其介紹,AMD 下一代芯片 Instinct MI350 系列将在明年下半年推出,同樣延續了這一代的産品邏輯,推理性能将有 35 倍提升、提供 288GB 的 HBM3E 内存,峰值算力提升 1.8 倍,與英偉達 B200 的算力持平。
在逐漸明确了産品打法、發布節奏後,AMD 2024 年在數據中心領域大有高歌猛進趨勢。
蘇姿豐此前透露,AMD 已經拿下了上百家 AI 客戶和 OEM 廠商的訂單。其在數據中心服務器的份額,也從早前可憐的個位數,上升到如今的 30% 左右。
财報數據正是最好的說明。7 月份,AMD 方面公布的信息顯示,今年第二季度的數據中心業務收入達到了 28 億美元,雖然相比于英偉達,數據還有很大差距(226 億美元),但同比大增 115%,也是 AMD 所有業務中增速最快的一項。
AMD 在數據中心領域的突圍,其實是多項因素的綜合作用——除了 AMD 上一代産品(MI300 系列)找對了打法,成爲 AMD 有史以來的爆款産品之外,還要疊加智算中心市場整體的大爆發,以及一絲對手失誤的因素。
在去年一整年,英偉達的 GPU 産品受困于産能,交貨周期達到驚人的 8-11 個月。供應問題,直到 2024 年第一季度才有所緩解,但客戶依舊需要等待漫長的 3 個月。
而好景不長,當英偉達的 H 系列今年終于順利進入出貨高峰後,其最新的 Blackwell 系列芯片産品又陷入新一輪交付難題。
綜合多方信息顯示,英偉達原定于今年三季度排産的全新 Blackwell 系列芯片,因爲芯片設計缺陷,導緻穩定性不足,又遇到供應鏈封裝良率不高等原因,整體往後又推遲了一個季度。
當對手持續受困于生産、設計難題,AMD 的産品自然成爲彌補算力缺口的一項最佳選擇。
不過,英偉達也擔心錯失市場機遇,把蛋糕拱手讓人,也在努力擺脫延期的陰霾。
在 AMD 大會的同期,摩根士丹利爲英偉達辦了一場爲期三天的非交易路演。路演上着重向投資人傳遞的信息是—— Blackwell 的難題已經解決, 需求大熱,英偉達 "已經把未來一年内的芯片全部賣光"。
黃仁勳此前也多次在公開場合暗示這一點,提示 " 這顆芯片正是每個客戶都想擁有最多的産品,大家都想當第一個收到貨的人 "。
對于 AMD 來說,這可能算不上是好消息。随着對手産能的陰霾散去,幸運的是,AMD 也逐漸找到适合自己的競争節奏。2025 年,兩家芯片巨頭,在 GPU 領域又再一次回歸正面戰場,這才是考驗雙方真正綜合實力的關鍵一年。
延伸閱讀:
《AMD 發布銳龍 AI PRO 300 系列移動商用處理器,爲 AI PC" 再添把火 " | 最前線》
end