終于,最後一張 RTX 40 SUPER 系顯卡它來了,主打 4K 高刷遊戲體驗,并且首發價相比 RTX 4080 直降 1499 元,也就是 8099 元。如果你最近正好有升級或裝機需求,預算充裕且希望各方面表現均衡,一步到位。那麽今天這期 NVIDIA GeForce RTX 4080 SUPER 顯卡的評測内容一定能幫到你。
評測之前,按照慣例先來介紹一下本次的測試平台,具體配置如下:
外觀設計
這次公版卡所有型号都改成了黑色塗裝,可以說是外觀上最大的變化。也正因爲這個細節的區别,使得新版 NVIDIA GeForce RTX 4080 SUPER 的外觀更加帥氣。
開箱公版卡本身也是一件令人興奮的事,包裝做的非常精緻,把它如上圖這樣放在桌面時,說是一個金屬科技感滿滿的 " 擺件 " 也不爲過。
NVIDIA GeForce RTX 4080 SUPER 的正面依舊采用 X 型設計,還有占據幾乎一半面積的超大風扇,左側的 RTX 4080 SUPER 型号文字分别采用陰刻和陽刻處理,實際觀感頗爲精緻。不過尺寸上變成了一張 3.5 槽卡,因此體積比較大,重量也增加了不少,即使裝機時還是建議大家上顯卡支架。
右側的散熱鳍片和風扇均采用全黑化處理,拿在手裏很有分量,也有利于更高效地散熱。
同樣的,背部左側也有一個一模一樣的風扇,彼此能夠形成垂直風道,更好帶走顯卡内部的熱量。
NVIDIA GeForce RTX 4080 SUPER 顯卡的側面也同樣做了黑化處理,視覺上非常統一,中間還微微做了一點凹陷弧度處理,增強質感。供電接口采用 12+4pin 設計,供電更加穩定。
I / O 接口擋闆采用深灰配色,接口方面配備了 3*DP1.4a 接口和 1*HDMI2.1 接口,最高支持 8K60Hz 輸出。
配件方面,NVIDIA GeForce RTX 4080 SUPER 配備了一條 16pin 轉 3*8pin 的轉接線,對電源的兼容性更好。
核心解析
GeForce RTX 4080 SUPER 雖然也基于 AD103 核心所打造,但是核心規格方面相當恐怖。比如配備了 10240 個 CUDA 核心,相比 RTX 4080 的 9728 個 CUDA 核心,核心數提升了 5.2%。它還擁有 52 個 Shader Core TFLOPS 單元和 121 個 RT Core TFLOPS,圖形 / 遊戲性能再次升級。此外,它的 320 個 Tensor Cores 核心和 836 個 AI TOPS 将提供強大的 AI 算力和 DLSS 性能。
顯存規格上 GeForce RTX 4080 SUPER 還是 16GB GDDR6X,與 RTX 4080 保持一緻。不過,64MB 的 L2 緩存,能夠讓 GeForce RTX 4080 SUPER 充分發揮 4K 分辨率下的遊戲性能。GPU 頻率方面,基礎頻率爲 2295MHz,加速頻率爲 2550MHz,分别比 RTX 4080 提升了 40MHz 和 80MHz。從顯卡規格和官方的定位上看,GeForce RTX 4080 SUPER 是一張定位 4K 遊戲和擁有強大 AI 算力的高端顯卡。
當然,GeForce RTX 4080 SUPER 依舊采用了最新的 NVIDIA Ada 架構,基于 TSMC 4N NVIDIA 定制工藝打造,因此實現了高達 2 倍的性能功耗比飛躍。流式多處理器的吞吐量超過上一代産品 2 倍。第三代 RT Cores 的 DLSS 3 可讓光追性能提升 2 倍,第四代 Tensor Cores 新增 FP8 引擎,具有高達 1.32 petaflops 的 Tensor 處理性能,DLSS 至多提升 4 倍性能。
理論性能
測試性能之前,我們不妨通過甜甜圈烤機測試,來看看它的功耗表現如何。烤機 20 分鍾,GPU 功耗保持在 320W 左右,核心溫度 69 ℃左右,顯存溫度 70 ℃,這個溫度表現還是比較均衡的,而此時的 GPU 頻率可以來到 2325MHz-2450MHz 之間,性能釋放還是有保障的。
烤機之後,我們又對 GeForce RTX 4080 SUPER 進行了 3D Mark 的 Time Spy 壓力測試,來看看在連續高負載下的顯卡性能釋放是否平穩和持久,最終 GeForce RTX 4080 SUPER 得到了 99.6% 的成績,持續的性能輸出表現非常出色。
接下來是 GPU 理論性能測試環節,在 3DMark TimeSpy Extreme DX12 測試中,GeForce RTX 4080 SUPER 的顯卡分數爲 14401 分,相比 RTX 3080 的 8602 分提升了 67.4% 左右,也超越了上一代 RTX 3090。
在 3DMark Fire Strike Extreme DX11 測試中,GeForce RTX 4080 SUPER 的顯卡分數爲 34894 分,對比 RTX 3080 的 20382 分提升了約 71.2%,而相比上代 RTX 3090 Ti 的 27074 分,也有 28.8% 的提升。
在 3DMark Fire Strike Ultra DX11 測試中,GeForce RTX 4080 SUPER 的顯卡分數達到了 17395 分,對比 RTX 3080 的 10365 分提升了約 67.8%,也領先于上代 RTX 3090 Ti 的 13855 分。
在 3DMark Portal Royal 光追測試中,GeForce RTX 4080 SUPER 獲得了 18439 分,相比 RTX 3080 的 11231 分提升了 64.1%,光追遊戲性能提升明顯。
遊戲實測
既然說到遊戲,就不得不提一下目前 NVIDIA 平台已經擁有超 500 款支持 RTX 技術的遊戲和應用,而且随着 DLSS 3 技術的日趨成熟和普及,支持 DLSS 3 的遊戲數量也在源源不斷的上升。
比如今年 14 款支持 DLSS 3 技術的全新遊戲加入,包括《龍之信條 2》《地平線 : 西之絕境》《人中之龍 8》《半條命 2 RTX》等知名遊戲。另外,已經發布的《心靈殺手 2》《賽博朋克 2077:往日之影》《使命召喚:現代戰争 3》等,也在第一時間就支持了 DLSS 3 或 DLSS 3.5 的技術。與此同時,目前主流的熱門在線競技類遊戲,都支持了 NVIDIA Reflex 技術,不管是對于低配玩家還是電競玩家,這兩項技術都能極大提升遊戲體驗。
接下來的遊戲測試環節,我們将給大家測試 6 款遊戲,包括 2 款在線競技類遊戲,2 款傳統光栅遊戲以及 2 款支持 DLSS 3/3.5 的光追遊戲,所有遊戲均采用 4K 分辨率測試,以此驗證它的 4K / 4K 光追遊戲表現。
首先是兩款在線競技類遊戲,在《CS2》中我們采用默認高畫質選項,在 4K 分辨率下進行一局對戰,并通過 Frame View 記錄平均幀數,GeForce RTX 4080 SUPER 在 4K 分辨率的平均幀數能夠達到 305 幀。
另外,通過開啓遊戲設置中的 NVIDIA Reflex 選項至開啓 + 增強,即使來到 4K 分辨率下,遊戲的平均延遲也隻有 9ms,對玩家的影響可以說非常小。
第二款在線競技類遊戲我們選擇了人氣頗高的《彩虹六号:圍攻》,GeForce RTX 4080 SUPER 在 4K 分辨率,最高畫質下的平均幀數達到了 350 幀,也是完全能夠滿足高分高刷電競需求的。
至于延遲方面,《彩虹六号:圍攻》同樣支持 NVIDIA Reflex 技術,在遊戲運行時選擇帶有 Vukan 的選項,就能在遊戲中找到 Reflex on + 增強的選項,開啓之後通過 Frame 進行抓取,4K 分辨率下的平均延遲也才 10.2ms,延遲表現相當可以。
接着是 2 款傳統光栅遊戲,在經典叙事冒險遊戲《荒野大镖客:救贖 2》中,選擇最高畫質,4K 分辨率下的平均幀數可以達到平均 99 幀,RTX 4080 爲 95 幀,提升了 4.2%。
我們也測了育碧家的最新作《刺客信條:幻景》,在 4K 分辨率最高畫質下,運行遊戲自帶的性能基準測試,GeForce RTX 4080 SUPER 的平均幀數來到 100 幀,RTX 4080 的平均幀數爲 92 幀,提升了約 8.6%。從測試結果不難看出,在傳統光栅遊戲中,RTX 4080 SUPER 相比 RTX 4080 的提升比較有限。
那麽在光追遊戲中,GeForce RTX 4080 SUPER 的表現又如何呢?IT 之家選擇了兩款支持 DLSS 3/3.5 的光追遊戲,其中一款是優化非常出色的《極限競速:地平線 5》,在遊戲中選擇極端畫質預設,并開啓 DLSS 3 + DLSS 2 質量檔,NVIDIA Reflex 選項也會默認打開,我們照例選擇 Reflex ON+BOOST,運行遊戲自帶的性能基準測試。
進入遊戲選擇 4K 分辨率極端畫質,平均幀數可以達到 149 幀,遊戲的平均延遲僅爲 16.4ms。RTX 4080 的平均幀數是 132 幀,提升約 12.8%。
那如果我們隻開光追,不開 DLSS 選項,且關閉 Reflex 低延遲選項時,GeForce RTX 4080 SUPER 的表現又如何呢?可以看到在優化出色的地平線 5 中,即使不開 DLSS,4K 光追下平均幀數依舊來到了 125 幀,不過沒有 Reflex 低延遲技術的加持,遊戲平均延遲飙升到了 24.1ms。
最後是對顯卡性能要求非常高的《賽博朋克:2077》,這次我們測試 3 次,第一次選擇超級光追畫質,開啓 DLSS 2 質量檔 + DLSS 3 幀生成,在 4K 分辨率下運行自帶基準性能測試,此時平均幀率能到 83 幀,還不錯的表現。
第二次我們選擇超速光追畫質,開啓 DLSS 2 質量檔 + DLSS 3 幀生成 + DLSS 3.5 光線重構,此時 4K 分辨率下,GeForce RTX 4080 SUPER 的平均幀數正好 60 幀,算是守住了 4K / 60 幀的底線。
當然,如果完全關閉 DLSS,隻開光追,4K 下的遊戲平均幀數就隻有 29 幀了,畢竟不是所有遊戲都能有地平線 5 的優化水平,畫質對性能的負載也不同。通過對比不難發現,DLSS 技術對于遊戲玩家來說絕對是最實用的技術。
關閉光線重建
開啓光線重建
那麽開不開 DLSS 3.5 對于遊戲畫質到底有何影響呢?大家看這兩張圖,遊戲中同一個場景下雨後濕滑路面的倒影給了我們答案,在開啓光線重建後倒影的清晰度提升明顯,以往畫面中常有的僞影也少了很多,顯而易見 DLSS 3.5 可以說是高等級光追的潤滑劑,在保留最高畫面效果的同時,也能發揮最好的幀數表現。
創意生産
前面我們曾提到,GeForce RTX 4080 SUPER 的 L2 緩存也達到了 64MB,顯存帶寬高達 23Gbps,還有多達 836 個 AI TOPS 核心,這爲 GeForce RTX 4080 SUPER 的創意生産和 AI 性能提供了有力保障。用戶還可通過安裝 NVIDIA Studio 驅動,以加速 110 多款最受歡迎的創意應用,如 Optix、DLSS 和 Maxine,還有 NVIDIA Studio 全套創意應用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。
在建模和渲染類軟件中,GeForce RTX 4080 SUPER 的 10240 個 CUDA 核心可以提供硬件加速,使得工作效率得以提高。幾乎所有的建模軟件都會對 NVIDIA 的 GPU 進行優化,因此在效率、穩定性和兼容性方面都能夠兼顧。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光線追蹤功能,實現高性能的最終幀渲染。此外,搭載了 AI 降噪功能的 GPU 還可以進一步加速交互式渲染,提供更加流暢的工作體驗。
實際看一下 GeForce RTX 4080 SUPER 的專業生産力表現。首先是 V-Ray Benchmark 這款建模軟件的基準測試部分,GPU CUDA 測試項目得分爲 3103 分。
在 GPU RTX 的測試項目中,GeForce RTX 4080 SUPER 顯卡的最終成績爲 4292 分。
在另一款建模軟件 blender 的 Benchmark 測試中,GeForce RTX 4080 SUPER 顯卡的三場景得分如圖所示,三場景得分則是 4574,2162,2264,同樣有明顯提升。
接着咱們看看它在視頻渲染和編解碼方面的性能表現,GeForce RTX 4080 SUPER 配備了 2 個 NVENC 編碼器,且支持新一代 AV1 視頻編碼技術,相同視頻大小下能夠提供更加快速的視頻編碼和更高質量的流媒體傳輸性能。國内的剪映專業版已經實現了對 NVIDIA AV1 視頻編碼器的加速支持,我們也對此進行了測試,在剪映專業版中導入一段時長爲 2 分 30 秒的 4K 視頻素材,然後分别采用 H.264 編碼和 AV1 編碼進行導出。
可以看到同樣導出 4K / 60 幀規格的情況下,AV1 編碼導出的視頻大小爲 609MB,H.264 編碼導出的視頻大小爲 800MB,文件體積上采用 AV1 編碼的視頻相比 H.264 編碼的視頻小了近三分之一。
而且在畫質方面,通過截取兩個視頻的畫面細節進行觀察,兩種編碼方式也基本看不出任何區别,又小又高清,AV1 勢必會成爲編碼格式中的新寵。
還有就是 RTX 視頻超分辨率技術,它可以通過 GPU 的 AI 計算,至多将在線 1080P 視頻提升到 4K 分辨率,實現以算法提高清晰度的效果。我們隻需在 NVIDIA 控制面闆中找到視頻 —— 調整視頻圖像設置,便可以自定義調節,超分等級有 4 檔。
↑ 從左至右依次爲 480P、VSR1、VSR2、VSR3、VSR4
我們通過播放在 IT 之家 B 站賬号發布的一條視頻,并将分辨率調整爲 480P,然後依次提升超分等級進行截圖測試,能看出 1-4 檔下人物變得更加清晰了。
最後我們還通過 Stable Diffusion 簡單測試了一下這張卡在 AIGC 方面的表現,模型我們采用了基于 SDXL 開源模型的 sd_xl_base_1.0_0.9vae.safetensors,以文生圖的方式繪制 21 張雪山上的女孩圖像,圖像分辨率爲 1024*1024,采樣方法爲 Euler a,叠代步數 50,總批次數爲 10,最終花費 1 分 55 秒完成。
第二次我們在其它設置不變的情況下,打開 TensorRT Engines 優化引擎後再跑一遍,這次時間僅僅花費了 1 分 01 秒,節省了近一半。
另外,在 Stable Diffusion 跑圖時查看顯存的占用情況,即使是目前評測中較爲簡單的繪圖參數設置情況下,8GB 顯存占用也是常态,瞬時顯存占用還會飙到 10GB12GB 以上,更别提分辨率更高,參數設置更複雜的繪圖條件了。如果這張卡的顯存隻有 8GB,那麽對于專業 AI 創作者來說,爆顯存很可能經常發生,一旦顯存不夠出圖時間便會大大延長,非常耽誤事情。所以 GeForce RTX 4080 SUPER 的 16GB 大顯存在 AI 方面起到了非常重要的作用,它和 AI 内容生成的效率直接挂鈎,相同架構和近似性能下,顯存越大越有優勢。
總結
和之前我們評測的 GeForce RTX 4070 SUPER 相比,這張 GeForce RTX 4080 SUPER 顯然是瞄準了追求 4K 極緻遊戲體驗的用戶,也就是主流遊戲全畫質特效也能達到 4K 100FPS 的遊戲性能,玩家無需在遊戲畫質和特效中取舍糾結,盡情享受遊戲就好。還在用 RTX 40 系以前老卡的用戶,想要一步到位的遊戲體驗可以閉眼買。不過,如果你手上已經有任何一張 RTX 40 顯卡,那麽升級顯卡的周期都可以往後延。除此之外,有 AIGC 創作或者其它 AI 需求的用戶,也可以考慮這張卡,目前來說,它也是最适合做 AI 相關工作的。
另一方面,公版 GeForce RTX 4080 SUPER 出色的做工和質感,獨特的外形設計,也是很多玩家追捧的原因之一。更别說這次首發價格比原版 RTX 4080 整整便宜了 1400 元。有趣的是,如果我們對比上一代 RTX 3080Ti,那麽你會發現兩者的 CUDA 核心,Tensors Cores,RT Cores 的數量都是一樣的,但是因爲采用了 Ada Lovelace 架構,各方面表現都強很多,功耗甚至也要低上 30W。