作者丨邱曉芬
編輯丨蘇建勳
12 月 15 日,英特爾舉辦了名爲 "AI 無處不在 " 的發布會。英特爾顯然把中國和美國市場當做是 AI 的兩大重要市場,在矽谷和北京前後腳各辦了一次發布會。
盡管在北京場的發布會上,英特爾并沒有公布萬衆期待的 GPU Gaudi 3 的最新進展, 但英特爾在中國的 AI 探索重心,慢慢放在了如何引導用戶采用 CPU 的産品來做大模型推理——從這兩款産品的升級點也可以明顯看出,英特爾在 CPU 上補充起 GPU、NPU 的短闆。
在發布會上,英特爾此次更新了兩款 CPU:一款是面向企業端的雲服務器 CPU 第五代至強處理器、另一款是面向普通消費者的酷睿 Ultra 處理器。這也是英特爾過去這麽多年來,罕見在同一天同時更新雲側、端側的産品。
在 AI 芯片三足鼎立格局即将形成之時,英特爾打算先兩把抓,占住 AI 在雲端和端側的市場。
酷睿處理器:補上 CPU 以外的短闆
肉眼可見的是,英特爾越來越重視 CPU 之外的能力。
本質上,這次發布的酷睿 Ultra 處理器其實是一顆複合芯片:在 CPU 的模塊外,英特爾還塞入了一個用于圖形處理的銳炫 GPU、以及集成了用于人工智能推理的 NPU 模塊。
這恰恰也是這顆處理器最大的看點。這顆酷睿 Ultra 處理器上,英特爾貢獻了曆史上最大的一次 GPU 升級。具體而言,這一模塊支持硬件光追,還集成了多媒體引擎和顯示引擎等等,整體性能相比上一代提升了兩倍。
英特爾顯然希望這款産品能夠爲 AI 大模型的落地增色,也首次加入了 NPU 的模塊,用于大模型推理。
大模型可以分爲推理和訓練兩個環節,訓練可以簡單理解爲制造大模型的過程,推理則是用大模型的過程。而随着大模型廠商格局的逐漸穩定,大模型未來逐漸走進千行百業,訓練的需求未來有望快速增長——這正是多數芯片廠商虎視眈眈的蛋糕。
目前對于企業來說,挑戰更大、對速度要求也更高的大模型訓練,首選的還是英偉達 A100,這也是英特爾在内的廠商都難以動搖的江山。而在場景更細碎、豐富大模型推理環節,廠商們一般會基于實際情況,有更加多元的芯片架構選擇。
比如,并行度最高的 GPU,往往适合更高吞吐的應用,比如文生圖和大參數的大語言模型;NPU 屬于高算力、低能耗的芯片,更适合運行需要持續在後台運作的任務,比如視頻會議裏持續不斷的視頻聲音處理等等;而 CPU 的特點是算力更高,且編程最簡單最熟悉,可以進行更多普适性的任務。
有行業人士告訴 36 氪,盡管大模型推理場景下主流的選擇是 GPU 或 NPU,但目前行業内基于成本和産能考慮,已經在考慮是否可以用 CPU 來跑大模型推理的。
此次,英特爾把更強的 GPU 和 NPU 也封裝到一顆 CPU 裏面,顯然希望從大模型推理側開始突圍,吃下更多的 AI 市場,也同時避開與英偉達的正面競争。
第五代至強:狙擊雲端大模型
英特爾這代至強處理器主要圍繞 AI 加速性能,進行升級,在算力、内存、AI 推理性能上做了大幅度升級。
值得注意的是,第五代至強處理器,相比上一代的平均性能卻提升了 21%。不過,英特爾并不是通過卷芯片制程的方式來實現——兩代芯片一樣采用了 Intel 7 制程,卻另辟蹊徑,通過調整芯片底層架構來提升性能。
具體而言,英特爾第五代至強處理器采用的是 64 核(上一代是 60 核),但每一個核還可以再分爲 2 個模塊,而上一代是 4 個——這意味着每一個 CPU 模塊中,被塞進了 2 倍于上一代的内核數。此外,第五代至強處理器的緩存也有了大幅提升,内存帶寬高達 5600MT/s。
從綜合效果來看,第五代至強處理器的雲計算自然語言性能提升了 23%、邊緣計算的性能提升了 24%,AI 推理性能提升 42%。
此外,針對雲端跑大模型時可能存在的數據安全和隐私問題,英特爾還升級了 TDX 功能。在傳統雲計算中,大部分應用是在虛拟機上運行,下層是操作系統,上面承載用戶數據。而在英特爾的 TDX 模式中,虛拟機是被隔離的狀态,也給用戶提供了更大的可信空間。
英特爾也在加緊商務推進,已與多數大模型廠商适配,第五代至強處理器已經能跑 20B 參數大模型,還實現了軟件和平台兼容。
在發布會上,英特爾還特意邀請了京東雲、百度來爲他們站台。英特爾方面稱,在 Llama2 的 70B 大模型上測試時,4 台第五代至強處理器在 100G 高速網絡下,總體性能提升相比上一代提升 2.8 倍、時延降低到 87ms。
總體而言,英特爾至強處理器此次在架構、内存、算力、安全隐私上的提升,都是爲了雲服務廠商的需求考慮,提升了雲端大模型的效率和性能。英特爾方面稱,目前已經有超過 20 家 OEM/ODM 廠商、超過 7 家雲廠商使用至強處理器。
在北京場的發布會上,英特爾沒有提到 Gaudi 3 的任何消息。但在美國場發布會,英特爾 CEO 基辛格表示,其 GPU 芯片 Gaudi 3 即将在 2024 年上市,性能可能比英偉達 H100 更強,将用于深度學習和生成式 AI。
在 GPU 領域,慢慢形成三足鼎立的局面——英偉達上個月發布的 H200,在内存容量、計算性能等方面瘋狂升級;AMD 也在不久前升級了 MI300 系列。AMD 首席執行官蘇姿豐稱,MI300 系列在訓練端與英偉達的 H100 相當,但推理方面表現得更好。
不過,英特爾和 AMD 的 GPU 産品線還沒真正動搖英偉達江山,戰火還不算真正燒起來。但在此之前,英特爾想要先構築自己穩固的 CPU 江山,先占住 AI 在雲端和 PC 端的機會,蠶食更廣闊的大模型推理市場。
【end】