從年前到現在,新一代 RTX 50 系顯卡陸續發布,PC 遊戲黨終于等到了面向主流玩家群體的 NVIDIA GeForce RTX 5070 顯卡。全新支持的 DLSS 4 技術和 12GB GDDR7 規格顯存能否讓更多玩家暢玩 4K 分辨率下的主流 3A 大作,今天我們就通過 NVIDIA GeForce RTX 5070 公版顯卡一探究竟。

爲了發揮顯卡的全部性能,本次我們搭建了如上圖所示的硬件測試平台。
一、外觀設計
不得不說 NVIDIA 每年推出的公版顯卡在包裝和設計上都頗具創意,今年也不例外。

NVIDIA GeForce RTX 5070 顯卡采用了較爲環保的原色紙箱包裝,通過側邊抽拉式固定紙片進行密封,抽取方便且有儀式感。紙箱上印有 GeForce RTX 5070 的顯卡型号,整體造型也暗示了顯卡的對稱美學設計風格。

NVIDIA GeForce RTX 5070 顯卡在外觀設計上與此前我們測過的 NVIDIA GeForce RTX 5080 公版卡基本保持一緻,全黑化的金屬裝甲、搭配經典 X 造型的銀色風扇外框裝飾,凸顯質感的同時,也保持了公版卡一貫的美學格調。
風扇部分也采用了黑化塗裝,由于主闆兩側的散熱鳍片的前後均沒有遮擋,兩個 110mm 直徑的大尺寸風扇可吹透鳍片,提升散熱效率。




顯卡尺寸方面經過IT之家實測,三圍分别是 244*98*40mm(不含擋片),上秤重量爲 1.1kg。NVIDIA GeForce RTX 4070 公版卡(1.008kg)重量基本保持一緻,尺寸則更小巧一些。

顯卡另一面對應着雙風扇的位置,布滿了非常密集的豎向散熱鳍片,便于散熱。X 造型"沙漏"包邊的中間三角形邊緣部分做了圓潤的弧形過渡,讓握持的手感更加柔和。其中一個三角區域印着小小的 RTX 5070 标志。


顯卡的兩側均采用 2 組散熱開口,其餘部分均被厚實的"沙漏"裝甲包裹起來。一側的散熱開口旁邊就是斜向 45℃設計的 16pin(12+4)供電接口,更右側的 GeForce RTX 字母标志并無燈效,盡顯簡約與克制。

金手指部分依舊采用全新 PCIe5.0 規格。

最左側 I/O 接口的金屬擋闆上,配備了 3 個 DP2.1b 接口和 1 個 HDMI2.1b 接口,最高支持 8K / 165Hz 視頻輸出。接口下方對應四個方形散熱開孔,排列非常規整。

配件方面,包裝内附有 1 根黑色尼龍材質 16pin 轉雙 8pin 的電源轉接線以及 1 本快速入門指南。
二、架構分析
Blackwell 架構
RTX 50 系列顯卡這次采用的 Blackwell 加入了神經網絡渲染的特性,其多單元流處理器 (SM) 具有更高的處理吞吐量,并且支持了 Flip Metering 來代替 CPU Pacing,讓 GPU 更精準管理顯示時間,盡可能達到每幀的畫面生成時間保持一緻,從而滿足 DLSS 多幀生成的穩定性需求。

第五代 Tensor 核心
第五代 Tensor 核心能夠加速重新排序,并新增了對 FP4 精度模型的支持,相較于第四代 Tensor 核心上所支持的 FP8 精度模型,吞吐量提升 2 倍;相比 FP16 精度模型,FP4 的顯存使用不到一半,GPU 性能的提升卻高達 2 倍。正是由于第五代 Tensor 核心的加入,才讓 DLSS 4 技術能夠順利支持多幀生成功能。
第四代 RT 核心
在 RT 核心方面,提升了檢測光線、路徑與三角形相交的效能,可以對大量幾何圖形細節進行光線追蹤。在新一代 Blackwell 架構下光線、路徑與三角形相交的檢測效率爲上一代的 2 倍,初代使用 RT 核心的 Turing 架構的 8 倍,并增強了壓縮以減少内存占用,相比上代的顯存使用率節省了 25%,光線追蹤效果也得到了前所未有的細節提升。
配備 GDDR7 顯存
除了技術上的提升,Blackwell 架構的 GPU 還搭載了 GDDR7 顯存。GDDR7 采用的是 PAM3 信号編碼機制,與 GDDR6 和 GDDR6X 有所區别。PAM3 每兩周期的數據傳輸爲 3 位,相比 GDDR6 和 GDDR6X 更省電,帶寬也進一步提升,速度高達 30 Gbps。
RTX 5070 規格
具體到産品規格上,NVIDIA GeForce RTX 5070 顯卡基于最新一代 GB205-300 核心和 TSMC 4N 工藝打造,包含 6144 個 CUDA 核心、988 個 Tensor 核心、94 個光追核心。
NVIDIA GeForce RTX 5070 顯卡的核心工作範圍是 2330MHz~2510MHz,顯存方面升級爲 192-bit 顯存位寬的 16GB GDDR7 規格,總帶寬來到了 672GB/s。TDP 爲 250W,相比上代 NVIDIA GeForce RTX 4070 顯卡增加了 50W。
三、理論跑分


首先是烤機環節,NVIDIA GeForce RTX 5070 顯卡在甜甜圈單烤 20 分鍾後,GPU 功耗穩定在了 250W,GPU 主頻比較保守隻有 2385MHz,而 GPU 溫度則是 76.7℃。對比 NVIDIA GeForce RTX 4070 的烤機表現來看,功耗和溫度均有一定程度增加。不過考慮到 NVIDIA GeForce RTX 5070 顯卡的整體尺寸縮小了不少,更加輕薄,溫度略高一些,問題不大。


在 3DMark Time Spy DX12 測試中,NVIDIA GeForce RTX 5070 顯卡分達到了 22300 分,對比 NVIDIA GeForce RTX 4070 顯卡的 17392 分,提升幅度約 28.2%。


在 3D Mark Time Spy Extreme DX12 測試中,NVIDIA GeForce RTX 5070 顯卡分達到了 10643 分,對比 NVIDIA GeForce RTX 4070 顯卡的 8261 分,提升幅度約 28.8%。


在 3DMark Portal Royal 實時光追測試中,NVIDIA GeForce RTX 5070 顯卡的綜合分爲 14052 分,對比 NVIDIA GeForce RTX 4070 顯卡的 11006 分,提升幅度達到了 27.6%。
從理論測試的表現上看,NVIDIA GeForce RTX 5070 顯卡相比上代的理論圖形性能平均提升了 28%,這個成績比較不錯,加上支持 DLSS 4 技術,我對這張卡的 4K 遊戲表現更爲期待。
四、遊戲實測
上一代 NVIDIA GeForce RTX 4070 顯卡在 4K 遊戲的表現上,不少玩家都覺得還差點意思,因爲有些遊戲并不能做到 4K 分辨率 + 畫質拉滿穩定 60 幀以上的平均幀數,所以它依舊被定義爲 2K 遊戲顯卡,那麽這次的 NVIDIA GeForce RTX 5070 的性能表現能夠駕馭 4K 遊戲嗎?
1、《CS2》

在競技遊戲《CS2》中:
RTX 5070 在 4K 分辨率 + 高畫質下,遊戲平均幀數爲 214 幀,1% Low 幀 92 幀,平均延遲 12ms;
RTX 4070 在 4K 分辨率 + 高畫質下,遊戲平均幀數爲 162 幀,1% Low 幀 85 幀,平均延遲 16ms;
NVIDIA GeForce RTX 5070 顯卡相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 32%,1% Low 幀提升 8.2%,平均延遲降低 25%。

RTX 5070 在 2K 分辨率 + 高畫質下,遊戲平均幀數爲 373 幀,1% Low 幀 135 幀,平均延遲 8ms;
RTX 4070 在 2K 分辨率 + 高畫質下,遊戲平均幀數爲 269 幀,1% Low 幀 124 幀,平均延遲 11ms;
NVIDIA GeForce RTX 5070 顯卡相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 38.6%,1% Low 幀提升 8.8%,平均延遲降低 28%。
2、《永劫無間》

《永劫無間》作爲在線競技遊戲中支持 DLSS 技術的代表遊戲,對顯卡性能的考驗更爲綜合,經過實測:
RTX 5070 在 4K 分辨率 + 最高畫質 + DLSS 質量模式下,遊戲平均幀數爲 103 幀,1% Low 幀 77 幀,平均延遲 41ms;
RTX 4070 在 4K 分辨率 + 最高畫質 + DLSS 質量模式下,遊戲平均幀數爲 76 幀,1% Low 幀 45 幀,平均延遲 56ms;
NVIDIA GeForce RTX 5070 相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 35.5%,1% Low 幀提升 71.1%,平均延遲降低 27%。

RTX 5070 在 2K 分辨率 + 最高畫質 + DLSS 質量模式下,遊戲平均幀數爲 168 幀,1% Low 幀 118 幀,平均延遲 27ms;
RTX 4070 在 2K 分辨率 + 最高畫質 + DLSS 質量模式下,遊戲平均幀數爲 119 幀,1% Low 幀 51 幀,平均延遲 39ms;
NVIDIA GeForce RTX 5070 顯卡相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 41.1%,1% Low 幀提升 131%,平均延遲降低 31%。
可以看到,《永劫無間》這款遊戲中 NVIDIA GeForce RTX 5070 的 1% Low 幀提升巨大,遊戲平均幀數的提升也很恐怖。
3、《無限暖暖》

《無限暖暖》作爲一款上市不到半年的端遊,目前在遊戲性能上可優化的空間還很大,這款遊戲目前也支持了光線追蹤和 DLSS,經過實測:
RTX 5070 在 4K 分辨率 + 極緻畫質 + 開啓光追 + DLSS 抗鋸齒下,遊戲平均幀數爲 81 幀,1% Low 幀 66 幀;
RTX 4070 在 4K 分辨率 + 極緻畫質 + 開啓光追 + DLSS 抗鋸齒下,遊戲平均幀數爲 66 幀,1% Low 幀 57 幀;
NVIDIA GeForce RTX 5070 顯卡相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 22.7%,1% Low 幀提升 15.7%。

RTX 5070 在 2K 分辨率 + 極緻畫質 + 開啓光追 + DLSS 抗鋸齒下,遊戲平均幀數爲 121 幀,1% Low 幀 102 幀;
RTX 4070 在 2K 分辨率 + 極緻畫質 + 開啓光追 + DLSS 抗鋸齒下,遊戲平均幀數爲 102 幀,1% Low 幀 81 幀;
NVIDIA GeForce RTX 5070 顯卡相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 18.6%,1% Low 幀提升 25.9%。
4、《古墓麗影:暗影》

《古墓麗影:暗影》隻支持初版 DLSS,可以看作是傳統光栅遊戲的代表,經過實測:
RTX 5070 在 4K 分辨率 + 最高畫質下,遊戲平均幀數爲 99 幀,1% Low 幀 85 幀;
RTX 4070 在 4K 分辨率 + 最高畫質下,遊戲平均幀數爲 78 幀,1% Low 幀 66 幀;
NVIDIA GeForce RTX 5070 顯卡相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 26.9%,1% Low 幀提升 28.7%。

RTX 5070 在 2K 分辨率 + 最高畫質下,遊戲平均幀數爲 191 幀,1% Low 幀 143 幀;
RTX 4070 在 2K 分辨率 + 最高畫質下,遊戲平均幀數爲 148 幀,1% Low 幀 119 幀;
NVIDIA GeForce RTX 5070 顯卡相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 29%,1% Low 幀提升 20.1%。
5、《極限競速:地平線 5》

《極限競速:地平線 5》遊戲優化出色,但對顯存的要求并不低,經過實測:
RTX 5070 在 4K 分辨率 + 極端畫質下,遊戲平均幀數爲 116 幀,1% Low 幀 100 幀;
RTX 4070 在 4K 分辨率 + 極端畫質下,遊戲平均幀數爲 91 幀,1% Low 幀 77 幀;
NVIDIA GeForce RTX 5070 顯卡相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 27.4%,1% Low 幀提升 29.8%。

RTX 5070 在 2K 分辨率 + 極端畫質下,遊戲平均幀數爲 168 幀,1% Low 幀 140 幀;
RTX 4070 在 2K 分辨率 + 極端畫質下,遊戲平均幀數爲 127 幀,1% Low 幀 83 幀;
NVIDIA GeForce RTX 5070 顯卡相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 32.2%,1% Low 幀提升 68.6%。
6、《黑神話:悟空》

在"衆生平等"代表之作《黑神話:悟空》中,開啓全景光追後的顯卡壓力非常大。經過實測:
RTX 5070 在 4K 分辨率 + 超高畫質 + 50% 超采樣分辨率 + 高全景光追 + 幀生成下,遊戲平均幀數爲 64 幀,1% Low 幀 51 幀;
RTX 4070 在 4K 分辨率 + 超高畫質 + 50% 超采樣分辨率 + 高全景光追 + 幀生成下,遊戲平均幀數爲 52 幀,1% Low 幀 45 幀;
NVIDIA GeForce RTX 5070 顯卡相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 23%,1% Low 幀提升 13.3%。

RTX 5070 在 2K 分辨率 + 超高畫質 + 50% 超采樣分辨率 + 高全景光追 + 幀生成下,遊戲平均幀數爲 99 幀,1% Low 幀 60 幀;
RTX 4070 在 4K 分辨率 + 超高畫質 + 50% 超采樣分辨率 + 高全景光追 + 幀生成下,遊戲平均幀數爲 79 幀,1% Low 幀 52 幀;
NVIDIA GeForce RTX 5070 顯卡相比 NVIDIA GeForce RTX 4070 顯卡的平均幀數提升約 25.3%,1% Low 幀提升 15.3%。
可以看到,NVIDIA GeForce RTX 5070 顯卡的 4K 遊戲表現确實更加均衡,主流遊戲都能在最高或極高畫質下跑到 60 幀以上的水平,并且部分遊戲的 1% Low 幀也有顯著提升,遊戲體驗更加流暢。而上一代 NVIDIA GeForce RTX 4070 顯卡在《黑神話:悟空》這樣應用全景光線追蹤技術的新遊戲中就顯得有些力不從心了。
五、DLSS 4 遊戲體驗
RTX 50 系顯卡新增的 DLSS 4 技術在 DLSS 3 的基礎上,新增了全新的多幀生成技術,結合第五代 Tensor 核心的強大性能,利用 AI 爲每個渲染幀生成至多 3 個額外幀,從而大幅提升遊戲的 FPS 水平。
DLSS 4 配合全套 DLSS 技術,包括光線重建、超分辨率以及 DLAA 等功能,最多可實現傳統圖像渲染的 8 倍幀率。

多幀生成技術還可配合 NVIDIA Reflex 低延遲技術保持較低的遊戲延遲,讓遊戲的操作和響應影響很小。Blackwell 顯示引擎也在 DLSS 4 技術中發揮了重要作用,通過提升其像素處理能力,讓遊戲在更高分辨率和刷新率下滿足 DLSS 4 技術的要求,最高可提升 1 倍的像素處理能力。

DLSS 4 技術還帶來了模型架構的重大升級,DLSS 光線重建、DLSS 超分辨率和 DLAA 特性均由首個實時 Transformer 模型驅動,并用來提升生成像素的質量,它支持通過自注意力操作評估整個幀幾多個幀中每個像素的重要程度,更好理解場景關系,讓生成的像素具有更好穩定性、更少的僞影、更豐富的運動細節和平滑邊緣。

官方表示,目前已有超過 75 款支持 DLSS 幀生成技術的遊戲和應用可在 GeForce RTX 50 系列 GPU 上升級至 DLSS 多幀生成技術,不少主流 3A 大作也已于 50 系顯卡正式發售後更新了 DLSS 4 多幀生成功能的支持,包括《心靈殺手 2》、《奪寶奇兵:古老之圈》、《黑神話:悟空》、《星球大戰:亡命之徒》《寂靜嶺 2:重制版》等熱門作品。


《賽博朋克:2077》作爲首批支持 DLSS 4 技術最完善的遊戲之一,如果在 4K 分辨率下開啓光追,但不開啓 DLSS 和幀生成選項,那麽:
在 4K 分辨率超級光追畫質下,遊戲平均幀數爲 21 幀;
在 4K 分辨率超速光追畫質下,遊戲平均幀數爲 5 幀;

即使不開啓光追,4K 分辨率下遊戲平均幀數也隻有 48 幀,在沒有 DLSS 和幀生成技術的加持下,基本告别 4K 體驗了。



幸好顯卡支持 DLSS 4 技術,在遊戲中開啓 DLSS Multi Frame Generation(DLSS 多幀生成)選項後,遊戲幀數的表現瞬間就不一樣了。我們依次在 4K 分辨率 + 超級光追畫質 + DLSS 質量檔設置下,選擇 2x、3x 和 4x 多幀生成,運行遊戲基準測試,分别得到了 67 幀、94 幀和 119 幀的遊戲平均幀數,相比不開 DLSS 時的 21 幀,提升幅度分别達到了 3.19 倍,4.47 倍和 5.66 倍,原本完全無法在 4K 分辨率下暢玩,現在直接可以跑到 4K / 120Hz 了,不得不說 DLSS 4 給了 NVIDIA GeForce RTX 5070 這張顯卡在光追遊戲上脫胎換骨的體驗。

那麽多幀生成會影響畫質嗎?通俗點說就是會不會令畫面變得更糊?爲此我們也在《心靈殺手 2》中同一個場景截取了 3 種不同畫質設置的遊戲畫面,分别是:
4K 原生畫質 + 路徑光追;
4K 最高畫質 + DLSS 性能檔(1080P 渲染)+4x 幀生成
4K 最高畫質 + DLAA(4K 渲染)+4x 幀生成
然後通過 NVIDIA ICAT 工具進行比較,在不放大的情況下 3 者根本看不出區别,所以我們挑選了 3 處細節進行放大對比。

首先是警員手臂衣服上的 FBI 标志,左側和右側分别是 DLAA(4K 渲染)和原生 4K 畫質,中間是 DLSS 性能(1080P 渲染),經過放大可以看到中間圖片的 FB 文字更糊一點,但左右基本看不出清晰度上的區别。


同樣在警員的波浪卷發以及身旁右側的樹葉上也能看出中間的畫面更糊一點,左右兩邊的圖片卻難以發現差距。
也就是說對于物理渲染分辨率上的天然鴻溝,DLSS 技術肯定是無法完全彌補畫質差距的,但隻要保持和原生畫質相同的分辨率(即開啓 DLAA),畫面清晰度和細節幾乎沒有區别,更别說我們這種"盯幀式"比較有點吹毛求疵,正常遊戲無論是 DLSS 性能檔(1080P 渲染)還是 DLAA(4K 渲染)都不會有糊成一片,鋸齒滿滿這種明顯問題,所以最主要的還是看遊戲适配,在乎畫質的小夥伴直接開啓 DLAA 就好了。
六、創意生産
生産力方面,IT之家實測了 UL Procyon 的圖像視頻剪輯、以及 AI 文本撰寫等性能。


在 UL Procyon 的視頻剪輯性能測試項目中,GPU 加速,得益于 Blackwell 架構升級的第九代 NVENC 編碼器和 NVDEC 解碼器,其在 H.264 / H.265 4:2:2 編碼的 8 位和 10 位視頻上有着非常大的優勢,經過實測:
NVIDIA GeForce RTX 5070 顯卡得分 57038 分;
NVIDIA GeForce RTX 4070 顯卡得分 48427 分;
NVIDIA GeForce RTX 5070 顯卡的視頻編輯性能相較 NVIDIA GeForce RTX 4070 顯卡提升約 17.7%。


在 UL Procyon AI 推理性能測試項目中的 Microsoft Windows ML 版本測試中:
NVIDIA GeForce RTX 5070 顯卡得分 1091 分;
NVIDIA GeForce RTX 4070 顯卡得分 989 分;
NVIDIA GeForce RTX 5070 顯卡的 Microsoft Windows ML 版本 AI 推理性能提升相較 NVIDIA GeForce RTX 4070 顯卡提升了約 10.3%。


在側重建模和渲染性能的 blender Benchmark 4.3.0 版本基準測試中:
RTX 5070 顯卡的 3 個場景分别拿到了 2864 分、1608 分、1506 分;
RTX 4070 顯卡的 3 個場景分别拿到了 2554 分,1260 分、1325 分;
在 Blender 基準測試的 3 場景渲染中,NVIDIA GeForce RTX 5070 顯卡的渲染性能相較 NVIDIA GeForce RTX 4070 顯卡提升分别約爲 12.1%、27.6%、13.6%。
七、總結
NVIDIA GeForce RTX 5070 這張顯卡的定位更符合主流遊戲玩家人群的預算區間和需求,因此它在 4K / 2K 高分辨率 + 高刷顯示器配置下的遊戲體驗至關重要。好在相比上一代 NVIDIA GeForce RTX 4070 顯卡,它的 4K / 2K 遊戲表現更加遊刃有餘,主流在線競技遊戲和光栅遊戲都能跑到 4K / 60 幀以上的表現。
而光追遊戲也能借助 DLSS 3 / DLSS 4 技術,實現遊戲性能的飛躍,畫質的損失卻非常有限,從這點上來說它在一定程度上滿足了部分 RTX 5070 Ti 顯卡用戶的需求,但價格更實在。

另外,DLSS 4 技術的到來也奠定了未來顯卡性能的升級方向,通過 AI 來填充像素,以最佳的性能表現呈現給玩家。相信随着新遊戲不斷加入對 DLSS 4 技術的支持,玩家會成爲最大的受益者。至于外觀設計和價格方面,對首發黨來說完全是可以閉眼買的類型,獨一無二的公版設計加上實惠的價格,性價比出衆。