文 | 科技旋渦
當地時間 10 月 10 日,AMD 召開 Advancing AI 2024 大會,在會上,AMD 發布了全新一代 Ryzen CPU、Instinct AI 計算卡、EPYC AI 芯片等一系列産品,交出了在 AI 時代的又一份答卷。
AMD CEO 蘇姿豐表示:" 我們相信高性能計算是現代世界的基本組成部分,我們在使用技術解決世界上最重要的挑戰,無論是雲、醫療保健、工業、汽車、PC 還是遊戲。"
在 AMD 多個系列新品發布的背景下,讓我們對未來的芯片市場競争更加有興趣,那麽,AMD 距離英偉達還有多遠的距離呢 ? 他們在 AI 時代又有怎樣的願景呢 ?
新品頻發,AMD 布局全平台
在今年 6 月,AMD 正式帶來了銳龍 AI 300 系列處理器,除了采用全新的命名之外,首次引入 Zen 5 CPU 架構、RDNA 3.5 GPU 架構和 XDNA 2 NPU 架構,并搭載于筆記本新品上,其卓越性能和出色能效表現令人印象深刻。
而在 10 日的大會上,AMD 再次推出了面向商用産品的銳龍 AI PRO 300 系列處理器,包含一款銳龍 7 和兩款銳龍 9 新品,總計 3 個型号。3 款處理器均搭載 Ryzen AI 技術,包括 AMD Zen 5 CPU 架構、RDNA 3.5 架構的 GPU,以及 XDNA 2 架構的 NPU。同時,新一代 AMD PRO 技術的加持,讓它們的性能表現、AI 算力以及安全性均得到顯著升級。
從規格上來看,銳龍 AI PRO 300 系列處理器相比上代銳龍 PRO 8040 系列處理器除了上面提到的架構升級外,還提升了以下幾點,如 CPU 核心由 8 核提升到最高 12 核,GPU 計算單元由 12CUs 提升到 16CUs,NPU 算力由 16TOPs 提升到 50-55TOPs,高速緩存數量由 24MB 提升到 36MB。
與英特爾 Core Ultra 7 165U 相比,最高版本的 Ryzen AI 9 HX PRO 375 可提供高達 40% 的性能提升和高達 14% 的生産力提升。與往常一樣,HX 版本的 TDP 高達 55W,面向高性能筆記本電腦,而常規處理器的 TDP 可以固定爲低至 15W。
與上代 AMD Ryzen Pro 7040 系列處理器相比,Ryzen AI Pro 300 不僅具有顯著更高的通用和圖形性能,而且還支持微軟的 Copilot+ 功能,其将在 11 月的下一次 Windows 更新中推出。
在此次發布會上,AMD 現場展示了與微軟合作的 AI PC 産品的 "Recall" 功能,可以通過輸入 " 尋找朋友與花朵的合照 ""XX 産品的價格是多少 ?"" 去除 XX 照片的陰影 " 等提示詞,迅速在 PC 中完成相應的操作。
科技旋渦認爲,将這樣一款 AI PC 處理器帶到企業級市場,AMD 補全了在企業端 AI 市場的最後一塊拼圖。對于 AMD 來講,這也讓他們擴展出更大的市場,同時也是他們在 AI 時代又一次嘗試。
數據中心芯片超越英特爾
在服務器端,Zen 架構已經讓 AMD 的市場份額從 2017 年的零上升到 2024 年第二季度的 34%。
按照第三方市調機構的統計,第一代 Naples EPYC 7001 系列誕生之時,也就是 2017 年的時候,AMD 在服務器市場上的份額幾乎爲零。
加上第二代 Rome EPYC 7002 系列的連續積累,2020 年時 AMD 已經收獲了 8% 的市場,初步站穩了腳跟。
之後,随着第三代 Milan EPYC 7003 系列的到來,AMD 迎來爆發階段,市場份額在 2022 年達到了驚人的 27%。
第四代 EPYC 更是達到了新的高度,市場份額也穩步增加,截至 2024 年上半年已經占到 34%,也就拿下了三分之一的天下,并且已經有了超過 350 個 OEM 平台、950 個雲實例。
在會上,AMD 揭開了其全新 Zen 5 架構服務器 CPU 系列的詳細細節。第五代 EPYC Turin 處理器 CPU 适用于企業、AI 和雲服務用例。
AMD 已将其具有全功能 Zen 5 内核的标準擴展優化模型和具有密集 Zen 5c 内核的擴展優化模型統一爲一個堆棧,該堆棧以 EPYC 9005 Turin 爲名,與英特爾的競争對手 Xeon 處理器相比,性能表現令人印象深刻。
AMD 表示,192 核 EPYC 9965 比英特爾競争對手的旗艦産品 Platinum 8952+ 快 2.7 倍,速度提升顯著。在具體應用方向上,還包括視頻轉碼速度提高 4 倍、HPC 應用程序性能提高 3.9 倍、虛拟化環境中每核性能提高 1.6 倍。AMD 還宣布推出其新的高頻 5GHz EPYC 9575F,據稱在用于加速 AI GPU 工作負載時,它比 Zen 4 EPYC 型号要快 28%。
另外,I/O 平台連接方面,PCIe 5.0 通道最多還是 160 條,新增了 PCIe 連接加密功能,并且從 CXL 1.1+ 升級到 CXL 2.0。
安全性方面,新增可信賴 I/O ( Trusted I/O ) ,以及美國國家标準與技術研究院 ( NIST ) 制定的美國聯邦密碼模塊安全标準 FIPS 140-3。
科技旋渦看到,AMD EPYC 芯片從第一代開始就被人們視爲他們重新崛起的标志,目前發展到第五代,從性能、銷量等數據來看,AMD 沒有辜負人們對于他的期待,而且,在市場占有率方面,他們也在無限逼近英特爾,也許超越隻是時間問題了。
AI 芯片能力接近英偉達
作爲最受市場關注的産品,MI325X 與此前上市的 MI300X 一樣,都是基于 CDNA 3 架構,基本設計也類似。
所以,MI325X 更多可以被視爲一次中期升級,采用 256GB 的 HBM3e 内存,内存帶寬最高可達 6TB/ 秒。公司預期這款芯片将從四季度開始生産,并将在明年一季度通過合作的服務器生産商供貨。
在 AMD 的定位中,公司的 AI 加速器在 AI 模型創建内容或進行推理的用例中更具有競争力,而不是通過處理海量數據訓練模型。部分原因在于 AMD 在芯片上堆砌了更多的高帶寬内存,使其能夠比一些英偉達芯片表現更好。
橫向比較,英偉達給最新款 B200 芯片配置了 192GB 的 HBM3e 内存,也就是兩顆 B100 各連接 4 個 24GB 内存芯片,不過内存帶寬倒是能達到 8TB/ 秒。
AMD 掌門蘇姿豐在發布會上強調:" 你們能看到的是,MI325 在運行 Llama 3.1 時,能提供比英偉達 H200 高出多達 40% 的性能。"
數據中心人工智能加速器的市場将在 2028 年增長至 5000 億美元,而這個數字在 2023 年時爲 450 億美元。在此前的表态中,她曾預期這個市場能夠在 2027 年達到 4000 億美元。
目前在 AI 芯片市場,英偉達仍然保持領先優勢,AMD 與英特爾都在試圖追趕。按照 2022、2023 連續兩年的數據統計,英偉達在數據中心 GPU 市場占據了 90% 以上的份額,幾乎壟斷了這一市場。
今年年初,英偉達又發布了其最強性能産品 B200,運算速度比上一代 H200 芯片提升将近 30 倍,按計劃将在今年第四季度量産上市,屆時又将與競争對手拉開差距。
而 AMD 則在與英偉達的競争中長期将自身看作 " 市場多一種的選擇 "。
面對與英偉達的競争,蘇姿豐接受采訪時曾經表示,AI 芯片市場足夠大,容得下多家企業,"AMD 不是必須打敗英偉達才能成功 "。
寫在最後
AMD 在會上還強調了與甲骨文、谷歌、微軟、Meta 等廠商的合作關系。蘇姿豐表示,微軟、OpenAI、Meta、cohere 等多個廠商的生成式 AI 平台已使用 MI300 系列驅動。Meta 則透露,公司已經部署超過 150 萬個 EPYC CPU。更多的客戶已經讓 AMD 在 AI 時代有了更強硬的依靠,同時也讓他們有更多資本開拓新的市場。
AMD 在發布會上展示了其在技術創新和市場戰略上的堅定決心。随着新産品的推出和市場環境的變化,AMD 能否繼續保持這一發展勢頭,成爲更加強大的挑戰者,甚至在未來超越英偉達和英特爾,或許 AMD 的野心還不止于此,他們或許也想成爲那家 " 偉大 " 的公司。