在整個RTX 40系顯卡中,GeForce RTX 4090被認爲是最值得買的型号。無論是基礎規格,還是實際展現出來的性能水準,GeForce RTX 4090相對家族中的其它型号而言,都實現了實質性的巨大提升。對于這樣一款巅峰級産品,老牌顯卡廠商影馳最近推出了全新的影馳20周年GeForce RTX 4090顯卡,它是影馳20周年的傾心之作,也是這家老牌顯卡廠商與巅峰性能的珠聯璧合。因此,無論是在外觀設計、做工用料,還是在性能、散熱調校方面,這款産品充分展現了影馳深厚的産品設計制造功力。
接下來就讓我們通過本篇評測,一起感受一下這款旗艦級新品的魅力吧。
成立于1993年的影馳,整個品牌曆史已長達30年之久。而本次推出的影馳20周年GeForce RTX 4090顯卡,是爲了紀念影馳品牌于2003年正式進軍中國市場的扛鼎之作。這20年彈指一揮間,但影馳爲中國用戶帶來的經典産品不勝枚舉。"名人堂"、"金屬大師"等系列誕生的經典産品,爲衆多玩家帶來了卓越體驗。
而這一次,影馳20周年GeForce RTX 4090顯卡再次以出色的外觀設計,紮實可靠的品質做工,呈現在大衆用戶面前。
·純白配色高顔值高品質旗艦卡
影馳20周年GeForce RTX 4090顯卡從PCB到卡體外部裝甲都采用了純白設計,對于當下一些追求純白配色主機的朋友可以說是最佳選擇。而且白色本身也是影馳不少經典産品的标志色,放在如此有紀念意義的一款産品上,可以說是一次完美的傳承。
顯卡前端采用100MM 11扇葉雙靜音風扇設計,左側風扇中心蝕刻出了影馳logo,右側風扇中心蝕刻出特殊的"20"字樣,彰顯20周年元素。最右側是背部風扇對應的散熱鳍片。
将顯卡翻過來之後,就可以看到背部的90mm 11扇葉風扇了。影馳将"20"元素巧妙地與風扇融合起來,構成了極爲惹眼的設計感,尤其是風扇右上角的"th"字樣,可以說是整個設計的點睛之筆。
背面左側,則設計了GEFORCE RTX和GALAX的品牌名稱。
顯卡上方同樣以GEFORCE RTX和GALAX 20的元素爲主,另外右下角可以看到三條LED燈條,點亮狀态下可以呈現炫麗的ARGB背光效果。
此外,卡體右側邊緣也印有"20"字樣。所以總體來看,影馳20周年GeForce RTX 4090顯卡的設計充分突出了20周年的設計元素,讓這款産品更具紀念價值和收藏價值。
視頻輸出接口方面,這款顯卡配置了1個HDMI 2.1和3個DP 1.4a。HDMI 2.1可支持120Hz@4K HDR、60Hz@8K HDR視頻輸出。
這款産品的供電口設計在了顯卡底部右下角的内側,并随機附贈了一根延長線,這種隐藏式的供電口設計使得整個顯卡更加美觀,而且在走線方面可以做的更加隐蔽,對于追求隐藏式走線的朋友來說非常合适。
在衆多顯卡品牌中,影馳産品的設計一直以來都備受用戶認可,尤其是對于喜歡白色系配件的朋友來說,影馳顯卡往往是首選。這次推出的20周年GeForce RTX 4090顯卡,同樣擁有出色的顔值、優質的做工,而且還擁有紀念價值和收藏價值,對于硬件發燒友來說是一個非常值得考慮的選擇。
那麽這款顯卡的實際性能如何呢?
·RTX 4090顯卡架構技術回顧
在性能測試之前,我們不妨先來回顧一下RTX 4090的技術要點。
首先,RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,采用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達到了恐怖的760億個晶體管,而在RTX 30系顯卡中爲280億個。
與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升。最高可達到90-TFLOPS的着色器數據吞吐量,而本次發布的GeForce RTX 4090則達到83-TFLOPs,相比上一代NVIDIA Ampere則隻有40-TFOPs。
完整的AD102核心共有18432個CUDA,其中包含12個圖形處理集群(GPCs), 72個紋理處理集群(TPCs), 144個流式多處理器(SMs)。144個第三代光追核心(RT Cores)、576個第四代張量核心(Tensor Cores)。
相比完整的GA102來說,RTX 4090共有16384個CUDA,其中包含11個GPC、64個TPC以及128個SM單元,第三代RT Cores爲128個,第四代Tensor Cores爲512個。
另外NVIDIA官方也特别表明了L2 Cache容量以及最終的等效帶寬,這是RTX 40在架構中變化比較大的地方。
我們以兩張圖來簡單說明L2緩存的作用。
如果把GPU内核比作網店店主,那麽L1緩存就是在日常工作的屋子中堆放的可發貨産品,但由于所有工作都要在這間屋子進行,堆放産品的空間有限;所以大部分産品就需要到L2緩存中,它就好比在工作室隔壁的倉庫,雖然需要走出去,但仍然是很近的路程。
如果這個倉庫還是放不下,那麽隻能到更遠的顯存中去調取産品。當然如果有爆顯存的情況,那麽這位"店主"可能還要打車去更遠的系統内存區調取數據。
這中間的路程和耗費時間就好比GPU額外的工作量,如果絕大部分數據隻存放在L2緩存就可以拿到,那麽将極大節省功耗。并且由于不再需要頻繁調取顯存中的數據,所以顯存位寬适當降低,對于運行效率也是沒有影響的。
在真正的GPU中,内核是所有計算發生的地方,而這就是L1數據緩存的作用所在。每個SM都有一個超低延遲的L1數據緩存,緊挨其處理内核,使L1成爲GPU尋找信息的首選。
然而,由于L1緩存需要離内核非常近,不可能非常大。
如果在L1緩存中找不到内核計算所需的數據,GPU将在L2數據緩存中尋找。這個顯存系統位于GPU芯片上,并通過一個非常高速的橫梁系統連接到所有的GPC(圖形處理集群),每個GPC包括多個SM。如果在L2緩存中找到了信息,那麽GPU就挑出這些數據并将其放入内核。
如果在L2緩存中找不到信息(被稱爲緩存缺失),那麽GPU将通過顯存接口在VRAM中尋找。這在整個GPU存儲子系統中産生了很多額外的工作量,并降低了性能和功耗效率。
這張RTX 4090相比上一代RTX 3090 Ti而言,擁有更大的L2緩存。而增加L2緩存的大小可以提高性能,降低延遲,并提高續航時長,數據訪問在GPU上即可完成(否則GPU就要頻繁從顯存讀取數據,過分依賴顯存帶寬)。所以,這也是爲什麽在RTX 40系顯卡中,位寬帶寬普遍偏小的原因。
·測試平台配置信息
基礎技術特性回顧之後,來看看本次測試所使用的硬件平台配置。爲了确保其性能充分釋放,我們采用了目前的旗艦級處理器i9-14900K,同時搭配1600W電源提供充足的電力支持,另外在主闆、内存、硬盤方面也都采用了高規格配置。
通過GPU-Z檢索我們可以看到影馳20周年GeForce RTX 4090顯卡的基本規格,它采用AD102核心打造,TSMC 4N NVIDIA定制工藝,擁有16384個CUDA,相比RTX3090 Ti 的10752多52%,Boost頻率達到了2595MHz,相比公版的2520MHz有一定幅度提升。支持24GB GDDR6X顯存,位寬爲384bit,顯存帶寬1008.4GB/s,光栅單元和紋理單元爲176和512。
·3DMark理論性能測試
基本規格了解之後,下面我們看看這款顯卡的3DMark理論性能表現。
首先是3DMark Fire Strike的DX11性能測試。三檔跑分如下:
影馳20周年GeForce RTX 4090顯卡在性能調校方面還是相當不錯的,全面超過了公版RTX 4090的表現。FireStrike模式評分76528,FireStrike E模式評分44078,FireStrike U模式評分24814分, 相對公版RTX 4090而言,DX11整體性能都要更好一些。
3DMark Time Spy DX12測試項,普通模式評分36365分,E模式評分19139分,相對DX11模式較小的優勢來說,影馳20周年GeForce RTX 4090顯卡在DX12性能方面比公版要強很多,所以玩DX12遊戲的話,會獲得更好的性能加持。
PortRoyal光追性能方面,影馳20周年GeForce RTX 4090顯卡評分達到了25657分,相對公版RTX 4090領先14%,強悍的DX12性能爲最終的光追表現奠定了基礎。
Speed Way是DirectX12 Ultimate的專業測試項,因此要求顯卡必須支持DirectX12 Ultimate特性,而且顯存要達到6GB及以上。在4K分辨率下,影馳20周年GeForce RTX 4090顯卡評分高達9858分,表現還是比較不錯的。
最後一項理論測試,我們來看看DLSS的表現。4K分辨率關閉DLSS時,平均幀率僅爲57.98fps,但是開啓DLSS之後,可以達到175.01fps,提升幅度達到了202%,效果顯著。不過其實對于RTX 4090這個等級的顯卡來說,目前市面上的遊戲裏,大多數在開啓光追的情況下是無需開DLSS的,幀數足以滿足流暢遊戲需求。從這個角度來說,DLSS在現階段還是更适合入門和中端級别的顯卡。
·常規遊戲性能測試
RTX 4090作爲目前顯卡中的天花闆,玩遊戲自然是小菜一碟。從理論測試來看,影馳20周年GeForce RTX 4090顯卡整體性能是相當可靠的,所以玩起時下各類遊戲來說,4K分辨率、最高畫質沒有任何問題,想要獲得極緻遊戲體驗就選RTX 4090。
那麽接下來咱們看看常規遊戲測試中,影馳20周年GeForce RTX 4090顯卡的表現。考慮到它的性能,我們就不在1080p分辨率下測試了,直接上2K和4K成績。
《極限競速:地平線5》作爲一款競速類遊戲,畫面制作精良,而且硬件優化水平極佳。影馳20周年GeForce RTX 4090顯卡加上酷睿i9-14900K這樣的頂級硬件組合,4K分辨率平均幀數就已經達到了136fps,2K直接飙升到177fps,流暢運行沒有任何壓力。
《無主之地3》看似是漫畫渲染的畫面,但其實對硬件要求是相當高的。不過影馳20周年GeForce RTX 4090顯卡拿下這款遊戲沒啥問題,4K分辨率平均129fps,2K分辨率平均224fps,流暢運行無壓力。
《刺客信條》系列最近幾代的引擎都一樣,所以畫質表現沒有特别大的差異。我們參考了《刺客信條:英靈殿》的性能評分,4K分辨率平均116fps,2K分辨率平均144fps,這可能是因爲2K分辨率GPU負載變低之後,遊戲本身調用GPU不夠充足,所以幀數反倒低了一些,但是4K分辨率下的成績證明在應對高負載任務時,影馳20周年GeForce RTX 4090顯卡相當可靠。
《光明記憶:無限》的光追測試軟件是獨立于遊戲的測試工具,比遊戲中用到的光線追蹤技術更多,測試條件爲"RTX最高/DLSS質量"。所以測試幀數相對實際遊戲是會低一些,這裏隻做參考就好。
實測下來,影馳20周年GeForce RTX 4090顯卡的發揮是相當穩定的,4K分辨率平均74fps,2K分辨率平均134fps,流暢運行沒有任何問題。
在另外一款國産遊戲《邊境》的跑分軟件中,情況基本與《光明記憶:無限》相同,測試條件均在"RTX最高/DLSS質量"下進行。影馳20周年GeForce RTX 4090顯卡4K分辨率平均幀數88fps,2K分辨率平均幀數151fps,表現同樣比公版RTX 4090更加出色。
此外我們還測試了一些其它遊戲,包括《永劫無間》、《古墓麗影:暗影》、《荒野大镖客2》以及《地平線:零之曙光》,均是在最高特效下運行的。所有遊戲的4K分辨率平均幀數都在80fps以上,2K分辨率平均幀數超過100fps以上,沒有任何運行壓力。
·全局光照+DLSS3.5測試
當下對于顯卡而言,最大的挑戰就是全局光照了,開啓之後一般顯卡真的是頂不住,就連RTX 4080這種等級的産品,在4K分辨率下都比較捉急。隻有RTX 4090這種旗艦級才能應對如此高負載的任務。
目前《賽博朋克2077》增加了全局光照模式,并且對DLSS3.5進行了支持。雖然相對DLSS3而言,DLSS3.5沒有在幀數提升上有大變化,但是對于光影的精準計算,DLSS3.5可謂是一枝獨秀。
以往,開啓光追之後,因爲畫面幀數不高,必須要結合DLSS來提升幀數,以便給玩家更加流暢的體驗。但是DLSS開啓之後,畫面效果又會有一定程度的下降。而DLSS3.5着重解決了這個問題。
下面我們來看看《賽博朋克2077》的全局光照測試情況,以及不同DLSS等級下畫面的幀率表現。
4K分辨率,全局光照模式下,開啓DLSS3.5,也就是光線重構,遊戲平均幀數爲74.38fps,流暢遊玩是沒啥問題的。
如果想要獲得更好的幀數體驗,大家還可以開啓"幀生成",也就是DLSS Frame Generation。開啓之後,在DLSS質量模式下,平均幀數可以達到80.84fps。
平衡模式提升到95.29fps。
性能模式提升到111.95fps。
而超級性能模式下,幀數可以達到150.1fps。
不過如果大家追求極緻畫質的同時需要流暢畫面的話,隻需要開啓全局光照和DLSS3.5即可。影馳20周年GeForce RTX 4090顯卡運行起來是沒有任何問題的。
那麽DLSS3.5開啓之後的實際效果如何呢?注意看下圖。
除了與RTX OFF對比外,可以注意上方廣告牌的字體,在RTX ON/DLSS OFF中,會有模糊和顯示不全的問題,但開啓DLSS 3.5後明顯清晰了很多。
同樣的情況在反射中也相當明顯,可以看到地上水坑中的廣告牌倒影,在未開啓DLSS 3.5時難以分辨,而開啓DLSS 3.5字體的邊緣更清晰。
下面圖片中的場景更加明顯,無論是上方的廣告牌還是店鋪中的霓虹燈,開啓DLSS 3.5後都更加清晰了。
因此,DLSS3.5的主要目的不是在于進一步提升幀數,而是改善DLSS開啓後的畫質下降問題,從而讓光追效果得到更好的保留。DLSS3.5通過引入Ray Reconstruction(光線重構)這樣的AI模型,将需要人工設計的降噪器,替換爲NVIDIA超算訓練的AI網絡,有效提升了DLSS開啓後光線追蹤的圖像質量。
·功耗與渲染性能測試
接下來我們再看看影馳20周年GeForce RTX 4090顯卡的功耗、散熱以及渲染性能的表現。
首先在功耗與散熱方面,在26℃室溫下,Furmark GPU單烤機功耗397W,溫度爲72.7℃。
這款顯卡采用了20周年專屬的∞散熱系統設計。前方配置雙100MM形20周年專屬風扇,背部90MM環形風扇進行散熱。内部采用4×Φ8mm加4×Φ6mm熱管模組,且配有大面積液冷均熱闆輔助散熱,同時顯卡的前後面闆均采用鋁合金材質,堅固耐用的同時,可以有效帶動熱量傳導至背闆,提升散熱效率。因此在滿負載狀态下,影馳20周年GeForce RTX 4090顯卡的散熱表現也是相當靠譜。
渲染性能方面,我們主要參考Blender Benchmark以及V-Ray Benchmark的測試情況,Blender和V-Ray都是行業内知名的渲染器,下面我們看看影馳20周年GeForce RTX 4090顯卡的表現究竟如何?
Blender Benchmark測試标準下,三大場景monster、junkshop以及classroom分别得分6693、3110以及2841分,毋庸置疑是目前天花闆級别的表現。如果想要獲得高效的渲染能力,那麽選擇影馳20周年GeForce RTX 4090顯卡絕對沒錯。
V-Ray Benchmark測試标準,GPU CUDA加速性能得分3930 vpaths,GPU RTX光追性能評分高達5339 vrays,可以說是最爲頂尖的渲染平台。
·AI性能評估與實際體驗
對于RTX 4090這個級别的顯卡來說,遊戲、渲染其實是比較輕度的應用了。真正重度的應用還是要看AI生成和相關模型訓練。所以評測的最後,我們看看影馳20周年GeForce RTX 4090顯卡在AI方面的表現究竟如何?
首先參考UL Procyon的AI性能理論測試,這裏我們選擇NVIDIA TensorRT下的Float 32和Float 16浮點運算,通過測試可以看到,影馳20周年GeForce RTX 4090顯卡得分分别達到了1943分和3501分,AI性能表現卓越。
此外我們還使用Stable Diffusion進行了圖片生成實測,它可以借助N卡的CUDA加速提升效率。這裏選用了一長一短兩套提示詞進行測試,每次生成10張圖片。實測短提示詞生成10張圖片時間爲9.82秒,長提示詞生成10張圖片時間爲15.64秒,整體效率可以說是相當出色。
·評測總結
通過一系列的測試可以看到,影馳20周年GeForce RTX 4090顯卡自身的性能調校相比公版RTX 4090要好不少,同時通過高效的散熱系統設計,使自身能夠在100%滿負載狀态下獲得極爲優秀的散熱表現、功耗釋放以及性能輸出,對于追求極緻體驗的遊戲玩家、追求高效體驗的生産力用戶來說,這是一款非常值得選購的産品。
此外不得不說,影馳20周年GeForce RTX 4090顯卡的外觀設計很容易吸引到用戶的關注,作爲一款頗具紀念意義的産品,它在整體設計、做工用料方面達到了頂尖水準。同時,隐藏式的供電口設計可以給側透機箱或海景房機箱帶來更好的走線方案,可以讓顯卡供電線纜完全隐藏起來。
總體來說,影馳20周年GeForce RTX 4090顯卡是一款性能強悍,設計做工出衆,且極具收藏意義的産品,喜歡白色系配件,亦或者對于硬件有極緻追求的朋友不容錯過!
此外,影馳還推出了内存與固态硬盤産品線的20周年紀念版産品,包括影馳星曜20周年紀念版内存、影馳HOF EXTREME 50s 20周年紀念版SSD、影馳星曜 20周年紀念版SSD。顔值出衆,情懷拉滿。感興趣的玩家也可以關注一下!