IT 之家 12 月 24 日消息,科技媒體 SemiAnalysis 于 12 月 22 日發布博文,表示經過長達 5 個月的深入調研後,發現 AMD 的新款 MI300X AI 芯片雖硬件強大,但軟件問題嚴重,難以撼動英偉達的市場主導地位。

IT 之家注:單從規格上來看,AMD 的 MI300X 芯片更有優勢,擁有 1307 TFLOPS(FP16)的算力和 192GB HBM3 内存,而作爲對比,英偉達的 H100 爲 989 TFLOPS 和 80GB 内存,即使是 H200 也隻有 141GB 内存,AMD 系統憑借更低的價格和更經濟的以太網絡,總體擁有成本更低。

但該媒體在深入調研後發現,AMD 的軟件漏洞百出,實際運行過程中需要大量的調試工作,幾乎無法展開 AI 模型訓練工作。而英偉達持續推出新功能、庫和性能更新,不斷擴大其領先優勢。
該媒體分析師通過 GEMM 基準測試和單節點訓練等大量測試,發現 AMD 難以逾越英偉達的 "CUDA 護城河 "。


AMD 的開箱即用體驗非常糟糕,需要投入大量時間和精力才能達到可用狀态,甚至連 AMD 最大的 GPU 雲提供商 Tensorwave 都不得不向 AMD 團隊提供免費的 GPU 訪問權限,以便修複軟件問題。
SemiAnalysis 建議 AMD CEO 蘇姿豐加大軟件開發和測試的投入,學習 Nvidia 的做法,分配數千個 MI300X 芯片用于自動化測試,簡化複雜的環境變量,并優化默認設置,提升開箱即用體驗。