前言:酷睿 Ultra 來了,但目前的解析着實有些無聊
最近幾天,關于英特爾第一代酷睿 Ultra(并非 14 代酷睿)的架構解析内容開始多了起來。
一方面,這是因爲英特爾在 9 月 19 剛剛召開了他們今年的 " 架構日 " 活動,并公布了了 Intel 4 制程、Foveros 封裝、Meteor Lake 架構的很多信息。
另一方面,此前在今年 8 月份,英特爾方面曾邀請了一些媒體去參觀了他們的封測工廠、實驗室,并分享了部分新品的信息,而這些信息近日也正式解禁。
正因如此,現在可以看到有許多内容都在讨論英特爾新款處理器的種種細節,并分析它的制程、半導體材料、封裝技術的原理,以及所謂 " 一分四 " 的設計等等。
但縱觀這些内容大家可能會發現一個現象,它們雖然看似講了很多很細節的東西,但多半都隻是 " 看圖說話 ",照着官方 PPT 做解說,并沒有太多自己的看法或對比分析。因此也就導緻這些關于 " 酷睿 Ultra" 的解析内容,有些過于相似。
爲什麽會這樣?一方面,當然是因爲目前英特爾的新架構從嚴格意義上來說,還沒有真正地發布、上市,所以哪怕有些已經拿到了産品、知道了更詳細的參數,也不能說出來。另一方面,英特爾此次 " 架構日 " 上公布的産品資料,本質還是過于偏技術向。如果隻是照着這些 PPT 去寫,确實很難讓普通消費者感興趣。
不過以上這些對于我們三易生活來說其實都不是問題,因爲我們通過相關渠道,得知了一些更詳細的産品資料。而且大家隻要看過以往的相關内容就會知道,我們對于英特爾下代架構的關注、分析準備,也不是一天兩天的事情了。所以在看到這一輪的 " 分析内容 " 後我們意識到,是時候來寫一些其他人所不知道、或是不能寫的東西了。
首先,我們來詳細聊聊所謂的 " 一分四 "
其實早在幾年前,我們就曾在相關内容中指出,英特爾是整個消費電子行業裏對 " 制程數字 " 态度最誠懇、最不 " 吹牛 " 的廠商。
但這種 " 誠懇 " 卻帶來了兩個問題,其一是英特爾從來不會宣傳制程上的 " 小改款 ",比如大家都知道,從第 5 代到第 11 代酷睿的桌面版,英特爾方面一直聲稱他們用的是 14nm 制程。但實際上,這個 "14nm" 本身的工藝細節是一直有在改進的,其晶體管密度、處理器所能達到的頻率等等實上也都在提升,而且提升幅度并不小。但英特爾自己不宣傳,就反而造成了部分消費者的誤解,以爲他們的制程一直都沒有進步。
其次,就是按照英特爾以往的做法,他們的處理器指的是整個核心 " 統一 " 制程的思路。也就是本身需要高頻、需要高密度的計算部分,與其實并不需要高頻、高密度的 IO、核顯、緩存等部分,都是從一塊晶圓上切出來的。
很顯然這就帶來了很大的浪費,也提高了制造成本,還不利于宣傳。看看隔壁的 AMD,早在初代銳龍上就已經實現了計算核心和 IO 核心的分制程制造,隻把計算部分用先進制程,宣傳時也不提及 IO 部分的制程。
或許是因爲明白了這一點,所以在第一代酷睿 Ultra、或者說 Meteor Lake 架構上,英特爾總算是搞出了他們的模塊化設計。其中隻有 CPU 核心(性能 P 核 + 能效 E 核)部分使用英特爾自家的 "Intel 4" 制程打造,而 ARC 核顯、SoC 核心、IO 控制器等部件,則都會采用 5nm、7nm 等更低成本的工藝、甚至包括外包(台積電)生産,以降低成本、提高良品率。
但是與競争對手僅僅将不同功能模塊單純焊接在同一個 PCB 上,靠 PCB 内部的銅電路進行通訊的做法相比,英特爾在模塊之間的互聯方式上要想得更 " 細 " 一點。是字面意思上的 " 細 ",因爲 Metor Lake 模塊之間采用了矽晶片直接堆疊的方式,來實現電氣互聯。
這樣做的好處是什麽?很簡單,模塊之間的互聯路徑短了,延遲就降低了、帶寬也大大增加了。于是,它也就解決了模塊化 CPU 設計往常可能會出現的一些 " 大問題 "。
不退步的内存控制器,這本身其實就是進步
在第一代酷睿 Ultra 之前,英特爾 CPU 内部的計算模組(CPU 核心)和内存控制器、緩存、核顯,都是基于相同的制程、在一整塊晶圓上刻出來的。而現在換了新架構之後,不同的模組現在變成了用不同的晶圓 " 粘 " 在一起了。
那麽這會造成什麽問題?沒錯,從理論上來說,這會導緻計算模塊和其他模塊之間互聯線路的電氣性能退步,從而可能反而造成 CPU 内存頻率下降、緩存延遲增大等問題。
有沒有覺得很眼熟?沒錯,這些現象前幾年我們在隔壁家的處理器上其實就已經見到過了。但是英特爾這次真正厲害的地方,就在于他們成功規避了這些原本可能發生的退步現象。
從我們三易生活拿到的獨家資料來看,移動版第一代酷睿 Ultra 處理器支持至少四種内存頻率,分别是 DDR5 1R 5600MHz、DDR5 2R 4400MHz,LPDDR5 6400MHz,以及 LPDDR5X 7467MHz。
與目前的 13 代酷睿移動版相比,移動版第一代酷睿 Ultra 的内存兼容頻率,在所有類型的内存上都沒有降低,這就證明英特爾成功解決了模塊化 CPU 可能面臨的内部通信壁壘問題。或者也可以反過來理解爲,他們選擇一直等到解決了這些問題、确保新的模塊化 CPU 設計不會導緻部分性能參數下降爲止,才切換到了這一新設計上。而這種 " 不讓用戶爲新技術短闆買單 " 的态度,顯然是值得點贊的。
頻率低了、緩存大了,我們的 " 夢想 " 也得以實現
就在不久前我們三易生活還曾感歎,最近幾年的 CPU 設計大有重新走上 " 高頻路線 ",以發熱和功耗強行換取性能增長的危險。但是在第一代酷睿 Ultra 上,情況很可能發生了良性的轉變。
我們三易生活結合目前各方的消息源,整理出了上面這張表格。從中可以看到,與 12 代、13 代的移動版 45W 酷睿相比,新的酷睿 Ultra 似乎主頻有着比較明顯的降低,同時将 L1 緩存和 L2 緩存進行了增大,并新增了位于 SoC 模塊裏的 128MB 系統緩存。
很顯然,這 " 恰好 " 符合了我們此前對于 CPU 發展還是應該追求 IPC、大緩存、高并發,而非高主頻方向的期望。不過值得注意的是,目前的頻率相關數據還不能代表最終上市的狀态,但基本可以确定的是,最終上市的版本主頻依然要低于 13 代酷睿。也就是說,新架構這一次至少在 " 破除頻率迷信 " 這個維度,走出了正确的一步路。
當然,熟悉英特爾以往産品線發展規律的朋友可能馬上就會想到,既然這一代的酷睿 Ultra 頻率降低了,那麽有沒有一種可能,英特爾在下代産品上 " 吃透 " 新制程和新架構後,會推出大幅提升頻率的 " 半代升級 " 型号呢?
别說,确實有這種可能。但從目前已知的信息來看,英特爾似乎還是更急于在短期内完成制程和架構的多代跨越。所以即便 Meteor Lake 将來也有 "Refresh",我們推測其産品規模可能也并不大,或許隻會限定在少數細分産品線上。
最後關于新的内置 NPU 設計,我們有點想法
想必大家都已經知道了,英特爾這一次爲 Meteor Lake 架構集成了 NPU 單元,使得其具備了獨立的低功耗 AI 加速能力。
請注意,這裏面有兩點是需要特别強調的。第一是這并非英特爾的第一款 NPU 設計,因爲他們早在多年前就已經有 NPU 産品了,隻不過是第一次集成到消費級 CPU 裏而已。
Meteor Lake 的集成 NPU,和這玩意或多或少有些聯系
其次,實際上從 10 代酷睿 -X 開始,英特爾就已經爲旗下 CPU 本身添加了 AI、深度學習相關的加速指令集,而且在 Xe、ARC 架構的 GPU 裏,也都具備 AI 加速的相關單元。
從目前的官方資料來看,Meteor Lake 支持異構 AI 計算、并不隻依賴 NPU
所以這就讓我們産生了一些大膽的想法,一是 Meteor Lake、或者說 " 第一代酷睿 Ultra" 的 AI 加速功能,到底是隻依賴于新集成的 NPU,還是可以實現 CPU、GPU、NPU,甚至外置獨立顯卡的 " 異構加速計算 "?
我們的測試平台,早已準備多時
第二就是從此前洩露的一些信息來看,Meteor Lake 的 NPU 會得到微軟 Windows 系統的原生支持,甚至可以直接在任務管理器裏看到 NPU 的占用率。這就不禁令我們感到好奇,如果使用一塊内置 DLBoost 指令集的英特爾老款 CPU、搭配 ARC 獨顯,再插上英特爾的外置 NPU 計算棒,這套組合是否也能在屆時的新版 Windows 系統、新版驅動下,享受到 "AI 加速 " 的好處呢?
說實在的,針對這個問題,我們三易生活已經準備了很久,或許不久後就能得到一些有趣的答案。我們相信,如果英特爾允許帶有 DLBoost 的老款 CPU+ARC 獨顯 +NPU 計算棒的組合也能受益于新驅動的加成,那麽對于現有的用戶來說,或許将會有助于鞏固他們的用戶粘性。
【本文部分圖片來自網絡】