瞄準大模型推理市場，英特爾一天更新兩款CPU

作者丨邱曉芬

編輯丨蘇建勳

12 月 15 日，英特爾舉辦了名爲 "AI 無處不在 " 的發布會。英特爾顯然把中國和美國市場當做是 AI 的兩大重要市場，在矽谷和北京前後腳各辦了一次發布會。

盡管在北京場的發布會上，英特爾并沒有公布萬衆期待的 GPU Gaudi 3 的最新進展，但英特爾在中國的 AI 探索重心，慢慢放在了如何引導用戶采用 CPU 的産品來做大模型推理——從這兩款産品的升級點也可以明顯看出，英特爾在 CPU 上補充起 GPU、NPU 的短闆。

在發布會上，英特爾此次更新了兩款 CPU：一款是面向企業端的雲服務器 CPU 第五代至強處理器、另一款是面向普通消費者的酷睿 Ultra 處理器。這也是英特爾過去這麽多年來，罕見在同一天同時更新雲側、端側的産品。

在 AI 芯片三足鼎立格局即将形成之時，英特爾打算先兩把抓，占住 AI 在雲端和端側的市場。

酷睿處理器：補上 CPU 以外的短闆

肉眼可見的是，英特爾越來越重視 CPU 之外的能力。

本質上，這次發布的酷睿 Ultra 處理器其實是一顆複合芯片：在 CPU 的模塊外，英特爾還塞入了一個用于圖形處理的銳炫 GPU、以及集成了用于人工智能推理的 NPU 模塊。

這恰恰也是這顆處理器最大的看點。這顆酷睿 Ultra 處理器上，英特爾貢獻了曆史上最大的一次 GPU 升級。具體而言，這一模塊支持硬件光追，還集成了多媒體引擎和顯示引擎等等，整體性能相比上一代提升了兩倍。

英特爾顯然希望這款産品能夠爲 AI 大模型的落地增色，也首次加入了 NPU 的模塊，用于大模型推理。

大模型可以分爲推理和訓練兩個環節，訓練可以簡單理解爲制造大模型的過程，推理則是用大模型的過程。而随着大模型廠商格局的逐漸穩定，大模型未來逐漸走進千行百業，訓練的需求未來有望快速增長——這正是多數芯片廠商虎視眈眈的蛋糕。

目前對于企業來說，挑戰更大、對速度要求也更高的大模型訓練，首選的還是英偉達 A100，這也是英特爾在内的廠商都難以動搖的江山。而在場景更細碎、豐富大模型推理環節，廠商們一般會基于實際情況，有更加多元的芯片架構選擇。

比如，并行度最高的 GPU，往往适合更高吞吐的應用，比如文生圖和大參數的大語言模型；NPU 屬于高算力、低能耗的芯片，更适合運行需要持續在後台運作的任務，比如視頻會議裏持續不斷的視頻聲音處理等等；而 CPU 的特點是算力更高，且編程最簡單最熟悉，可以進行更多普适性的任務。

有行業人士告訴 36 氪，盡管大模型推理場景下主流的選擇是 GPU 或 NPU，但目前行業内基于成本和産能考慮，已經在考慮是否可以用 CPU 來跑大模型推理的。

此次，英特爾把更強的 GPU 和 NPU 也封裝到一顆 CPU 裏面，顯然希望從大模型推理側開始突圍，吃下更多的 AI 市場，也同時避開與英偉達的正面競争。

第五代至強：狙擊雲端大模型

英特爾這代至強處理器主要圍繞 AI 加速性能，進行升級，在算力、内存、AI 推理性能上做了大幅度升級。

值得注意的是，第五代至強處理器，相比上一代的平均性能卻提升了 21%。不過，英特爾并不是通過卷芯片制程的方式來實現——兩代芯片一樣采用了 Intel 7 制程，卻另辟蹊徑，通過調整芯片底層架構來提升性能。

具體而言，英特爾第五代至強處理器采用的是 64 核（上一代是 60 核），但每一個核還可以再分爲 2 個模塊，而上一代是 4 個——這意味着每一個 CPU 模塊中，被塞進了 2 倍于上一代的内核數。此外，第五代至強處理器的緩存也有了大幅提升，内存帶寬高達 5600MT/s。

從綜合效果來看，第五代至強處理器的雲計算自然語言性能提升了 23%、邊緣計算的性能提升了 24%，AI 推理性能提升 42%。

此外，針對雲端跑大模型時可能存在的數據安全和隐私問題，英特爾還升級了 TDX 功能。在傳統雲計算中，大部分應用是在虛拟機上運行，下層是操作系統，上面承載用戶數據。而在英特爾的 TDX 模式中，虛拟機是被隔離的狀态，也給用戶提供了更大的可信空間。

英特爾也在加緊商務推進，已與多數大模型廠商适配，第五代至強處理器已經能跑 20B 參數大模型，還實現了軟件和平台兼容。

在發布會上，英特爾還特意邀請了京東雲、百度來爲他們站台。英特爾方面稱，在 Llama2 的 70B 大模型上測試時，4 台第五代至強處理器在 100G 高速網絡下，總體性能提升相比上一代提升 2.8 倍、時延降低到 87ms。

總體而言，英特爾至強處理器此次在架構、内存、算力、安全隐私上的提升，都是爲了雲服務廠商的需求考慮，提升了雲端大模型的效率和性能。英特爾方面稱，目前已經有超過 20 家 OEM/ODM 廠商、超過 7 家雲廠商使用至強處理器。

在北京場的發布會上，英特爾沒有提到 Gaudi 3 的任何消息。但在美國場發布會，英特爾 CEO 基辛格表示，其 GPU 芯片 Gaudi 3 即将在 2024 年上市，性能可能比英偉達 H100 更強，将用于深度學習和生成式 AI。

在 GPU 領域，慢慢形成三足鼎立的局面——英偉達上個月發布的 H200，在内存容量、計算性能等方面瘋狂升級；AMD 也在不久前升級了 MI300 系列。AMD 首席執行官蘇姿豐稱，MI300 系列在訓練端與英偉達的 H100 相當，但推理方面表現得更好。

不過，英特爾和 AMD 的 GPU 産品線還沒真正動搖英偉達江山，戰火還不算真正燒起來。但在此之前，英特爾想要先構築自己穩固的 CPU 江山，先占住 AI 在雲端和 PC 端的機會，蠶食更廣闊的大模型推理市場。

【end】

瞄準大模型推理市場， 英特爾一天更新兩款CPU