欲與英偉達決高下？英特爾推雲端AI芯片拟聯手國内廠商開發AI服務器

《科創闆日報》7 月 12 日訊（記者黃心怡） 7 月 11 日，英特爾在中國市場推出雲端 AI 訓練芯片—— Habana ® Gaudi ® 2。該芯片可滿足大規模語言模型、多模态模型及生成式 AI 模型的需求。據現場介紹，該芯片性能在一些關鍵指标上勝過英偉達 A100。

據了解，該 Gaudi2 處理器及 Gaudi2 夾層卡 HL-225B，以第一代 Gaudi 高性能架構爲基礎，具有 24 個可編程 Tensor 處理器核心（TPCs）。

每顆芯片集成了 21 個專用于内部互聯的 100Gbps（RoCEv2 RDMA）以太網接口，配備配置 96GB HBM 高速内存及 2.4TB/ 秒的總内存帶寬，滿足大規模語言模型、多模态模型及生成式 AI 模型的需求。

據現場介紹，英特爾 Gaudi2 運行 ResNet-50 的每瓦性能約是英偉達 A100 的 2 倍，運行 1760 億參數 BLOOMZ 模型的每瓦性能約達 A100 的 1.6 倍。

在發布會上，浪潮信息高級副總裁、AI 和 HPC 總經理劉軍現場發布搭載 Gaudi2 的新一代 AI 服務器 NF5698G7。

目前，英特爾已與浪潮信息合作，打造基于 Gaudi2 深度學習加速器的 AI 服務器 NF5698G7。該服務器集成了 8 顆 Gaudi2 加速卡 HL-225B，還包含雙路第四代英特爾至強可擴展處理器，支持 AMX/DSA 等 AI 加速引擎。當日，該款 AI 服務器也正式發布。

浪潮信息高級産品經理王磊強調，NF5698G7 是專爲面向生成式 AI 市場開發的新一代 AI 服務器，支持 8 顆 OAM 高速互聯的 Gaudi2 加速器，将爲 AI 客戶提供大模型訓練和推理能力。

新華三集團計算存儲産品線副總裁劉宏程表示，基于英特爾 Gaudi2 AI 加速器，新華三正與英特爾合作，開發适合大模型訓練和推理的高性能 AI 服務器。

同時，超聚變數字技術有限公司算力基礎設施領域總裁唐啓明指出，超聚變将與英特爾，共同推出基于 Gaudi2 的全新産品與解決方案。

此前，英特爾中國區董事長王銳在接受《科創闆日報》記者采訪時指出，ChatGPT 浪潮帶來計算需求的大幅度提升，目前正與包括百度、阿裏等在内的中國的客戶開展共同研究。王銳透露，不管是高性能的計算還是分布式的計算，都已經進行了布局。

一位英特爾技術專家《科創闆日報》記者分享了英特爾在大模型領域的布局情況。在訓練層面，針對 CPU、GPU、IPU、Habana 等異構計算，英特爾用 oneAPI 以及 XPU 平台來提供更多的選擇。在推理方面，第四代 Sapphire Rapids 發布後，基于 AMX 加速器，可在行業中解決 80% 以上的客戶推理需求。同時，也充分利用 CPU，包括用于訓練的 Ponte Vecchio，和用于推理的 Arctic Sound 等。

伴随着大模型的熱潮，雲計算的商業模式正朝着 MaaS（模型即服務）的方向演進，其所帶來的算力需求也值得關注。

" 它的理念是利用預訓練模型，對行業數據進行訓練，從而形成針對特定場景的、面向各行業的細分模型。我們知道通用模型的參數量非常大，例如 GPT-3 可達到 1750 億，部署這些模型會比較麻煩，因此，可能需要對大模型進行蒸餾和壓縮，形成行業可部署的模型。" 上述技術專家稱。

此外，把大模型進行私有化部署是不少行業的潛在需求。" 很多細分行業不接受 SaaS 服務，尤其金融等行業。因此，英特爾正在探讨如何把這個模型小型化之後，在本土落地做私有化部署，使其真正在行業落地。"

欲與英偉達決高下？英特爾推雲端AI芯片 拟聯手國内廠商開發AI服務器

欲與英偉達決高下？英特爾推雲端AI芯片拟聯手國内廠商開發AI服務器