【八測(cè)|首發(fā)】七彩虹 RTX 4070 Ti 戰(zhàn)斧評(píng)測(cè)

瓜爺耶 2023-01-05 發(fā)布于湖北

展開全文

前言

前幾天看到一個(gè)新聞，30系顯卡終于翻頁，顯卡價(jià)格開始回升。就這樣的市場(chǎng)下，NVIDIA把曾經(jīng)的RTX 4080 12G換名重新登場(chǎng)。也就是RTX 4070 Ti 12G。這一張承載了NVIDIA 3倍優(yōu)秀功耗，在2K性能超越RTX 3090 Ti的顯卡表現(xiàn)如何呢？我只能說，真是高！

——七彩虹 Geforce RTX 4070 Ti 戰(zhàn)斧

NVIDIA AD104 構(gòu)架解析

硬件改進(jìn)：

芝士AD104核心完整規(guī)格圖。AD104共計(jì)有5個(gè)GPC（Graphics Processing Cluster，圖像計(jì)算集群），合計(jì)有60組SM。AD104僅支持192Bit的位寬，而SM內(nèi)的規(guī)格還是原來一樣的。因此對(duì)比GA104，完整的AD104會(huì)有

7680個(gè)CUDAs（上一代為6144，↑25%）
80ROPs（上一代為96，↑20%）
240TMUs（上一代為192，↑25%）
60RTCores（上一代為48，↑25%）
240TensorCores（上一代為192，↑25%）

AD104的規(guī)格說實(shí)話和GA103非常像。就是位寬砍半。如果說這大L2是強(qiáng)針劑，那小心心臟衰竭。

上圖就是RTX 4070 Ti的核心圖。和AD104基本一致，就是閹割了NVENC加速器。

剩下的內(nèi)容，和RTX 4080差不多的，因此如果看過的話可以跳到顯卡一覽了。

GPC在結(jié)構(gòu)上并沒有太大的變化，主要還是在一些小SM內(nèi)做了改進(jìn)。如第三代RTCore，第四代TensorCore，完整支持第八代NVENC AV1的雙解碼器等技術(shù)。

第三代 RT Core 的新計(jì)算特性這里就不多說了。提升主要來自算法上的優(yōu)化。他們總共提出了三個(gè)主要的提升?？偨Y(jié)下來就是三點(diǎn)：

光追單元變多，并針對(duì)不同的光追運(yùn)算指令進(jìn)行重排序，提升運(yùn)算效率
通過增加透明度的定義，減少光線與物體三角形求交的無效計(jì)算，提升運(yùn)算效率（大白話既光追看不見的地方交給傳統(tǒng)光柵單元算）
通過增加位移信息簡(jiǎn)化復(fù)雜物體的構(gòu)建成本，顯著降低光線追蹤運(yùn)算的硬件資源消耗（大白話既光追看得出來的地方少算）

第四代 TensorCore 單元的變化主要是集成了FP8計(jì)算單元，實(shí)現(xiàn)了最高1.3PFlops的計(jì)算性能。

除了構(gòu)架上的小幅改進(jìn)，Ada構(gòu)架也把制程進(jìn)一步提升到了TSMC 4NNVIDIA定制工藝。使得AD102在與GA102面積相當(dāng)，甚至更小的情況下?lián)碛?6.3B的晶體管數(shù)量，是原來2.69倍。

軟件改進(jìn)：

DLSS 3是隨著Ada構(gòu)架推出的新功能。過去大家對(duì)DLSS的評(píng)價(jià)褒貶不一，主要原因在于雖然DLSS提升性能，但是所帶來的畫面撕裂與模糊感非常強(qiáng)烈。新的DLSS 3除了保留了DLSS 2的功能外還引入了類似傳統(tǒng)幀生成的優(yōu)化方法。這種方法的好壞不做評(píng)價(jià)。但是如果能讓游戲從PPT變成電影，那也無法否認(rèn)其存在價(jià)值。

考慮到未來4K游戲的發(fā)展，高刷4K會(huì)漸漸變成主流。目前來說越來越多游戲開始支持DLSS，而支持DLSS 3游戲也會(huì)漸漸增加。希望這個(gè)技術(shù)能真成為高刷高分辨率的一個(gè)解決方法。

顯卡一覽

七彩虹 RTX 4070 Ti 戰(zhàn)斧的包裝變化不大，附贈(zèng)了一根12+4 Pin轉(zhuǎn)2個(gè)8Pin的轉(zhuǎn)接線。

今年戰(zhàn)斧的整體風(fēng)格沒有什么太大變化。這種方方正正的感覺其實(shí)挺好的。而且散熱效果也不差。

4070 Ti 戰(zhàn)斧的PCI-E擋板改成了兩個(gè)，雖然散熱器還是擴(kuò)到了三個(gè)。顯示接口方面吧和上一代沒差，3DP 1.4+1HDMI 2.1設(shè)計(jì)。

RTX的燈光不能沒有，但是有與沒有，都阻擋不了熱辣辣的空氣。

12+4Pin接口，RTX 4070 Ti的功耗為285W TGP。

嘿嘿嘿，轉(zhuǎn)兩個(gè)8Pin。

一些小細(xì)節(jié)，其實(shí)沒啥了。

分體一覽，我只能說戰(zhàn)斧真的沒啥差別。

風(fēng)扇是ID-Cooling ID9820M12B，散熱規(guī)格12V 0.36A。

4070 Ti戰(zhàn)斧的散熱規(guī)格肯定是低很多，6熱管散熱，4跟熱管延伸至散熱后部，2跟延伸至前部。鱗片的面積其實(shí)可以不做成三槽的，但是為了拉風(fēng)。

Geforce RTX 4070 Ti 戰(zhàn)斧PCB完整照片。非常的停機(jī)坪。甚至PCB的規(guī)格都原本是256Bit設(shè)計(jì)的?？赡芤彩峭蝗话l(fā)現(xiàn)對(duì)手打不過而臨時(shí)變故吧。供電規(guī)格也沒有什么稀奇，10+2相供電，uPI uP9512+萬代AOZ5311NQI 55A級(jí)一體MOS。過去用來驅(qū)動(dòng)RTX2080 Ti級(jí)別的核心，畢竟他們那個(gè)時(shí)候也就250W的TDP。

性能測(cè)試

CPU采用英特爾酷睿i9-13900K。

主板采用華碩 ROG MAXIMUS Z790 EXTREME。

散熱采用雅浚EA5 360 白色。

內(nèi)存采用芝奇幻鋒戟 RGB 16Gx2 DDR5 6000，由于華碩主板支持在Intel平臺(tái)開啟EXPO，所以內(nèi)存可以運(yùn)行在6000頻率上。

選用的電源為鑫谷KL1250G 1250W，支持ATX3.0。附帶的了兩根12+4Pin接口，能夠提供最高600W的供電輸出。

環(huán)境溫度16℃，本次測(cè)試有六張顯卡參與對(duì)比，其中RTX 3090 Ti與RTX 4070 Ti將最主要對(duì)比。以下是參與的顯卡：

七彩虹 Geforce RTX 4070 Ti 戰(zhàn)斧
七彩虹 Geforce RTX 3090 Ti 火神 OC
七彩虹 Geforce RTX 3080 Ti 火神 OC
NVIDIA RTX 3080 Founder Edition
藍(lán)寶石 Radeon RX 7900 XTX NITRO+
AMD Radeon RX 6800 XT

所有基準(zhǔn)均七彩虹 Geforce RTX 4070 Ti 戰(zhàn)斧為基準(zhǔn)，未特殊說明均是以比例顯示，數(shù)值均越高越好。

GPU-Z 2.52版可以完美識(shí)別RTX 4070 Ti。RTX 4070 Ti戰(zhàn)斧的頻率最高能Boost到2700MHz左右。

理論性能測(cè)試：

AIDA64理論性能對(duì)比，RTX 4070 Ti綜合性能與RTX 3090 Ti持平。RTX 4070 Ti內(nèi)部的超大緩存讓內(nèi)部顯存復(fù)制速度超過了1.2TB/s。浮點(diǎn)，整數(shù)的提升基本來自于頻率的提升。SHA-1是唯一落后的，這也是因?yàn)橐?guī)格和算法的問題。

3DMARK基準(zhǔn)測(cè)試，可以看到RTX 4070 Ti綜合性能是RTX 3090 Ti的98%。除了DirectX光追有領(lǐng)先以外，其他基本是持平或者小幅落后。反倒是領(lǐng)先RTX 3080 Ti 2%，領(lǐng)先RTX 3080 19%。

3DMARK DLSS性能對(duì)比，RTX 40 系列支持DLSS 3，而RTX 30 系列不支持，因此在RTX 30 系列 DLSS 3對(duì)比中，以DLSS 2的性能做對(duì)比。RTX 4070 Ti平均性能是RTX 3090 Ti的67%。在沒有DLSS的支持下，RTX 4070 Ti性能落后在10%左右，8K下更是一幀和10幀的對(duì)比。這也不奇怪，畢竟12G 192Bit的位寬。只有在DLSS 3的加持下，RTX 4070 Ti才能摸到RTX 3090 Ti。

嚴(yán)格來說性能上其實(shí)更接近RTX 3080 Ti。沒有DLSS和DLSS 2下幀數(shù)接近。只有在DLSS 3開啟下，性能提升能達(dá)到25%以上。綜合而言獲得4%的性能領(lǐng)先。

VRMARK對(duì)比，Blue Room比較吃性能，RTX 4070 Ti和RTX 3080 Ti性能接近。落后RTX 3090 Ti 10%，合理。

渲染對(duì)比，Blender是老牌渲染器，所以對(duì)多個(gè)設(shè)備都有支持，V-Ray則是常用于3DSMAX的渲染器，主要支持NVIDIA。Octanebench則是專門支持英偉達(dá)的渲染跑分軟件。渲染一直都是新顯卡會(huì)占優(yōu)勢(shì)，畢竟有優(yōu)化，所以這里RTX 4070 Ti領(lǐng)先RTX 3090 Ti 3%，領(lǐng)先RTX 3080 Ti 8.6%。

游戲性能測(cè)試（2K）：

RTX 4070 Ti的定位顯然不足以撐起4K市場(chǎng)，因此我們將測(cè)試2K與4K性能進(jìn)行對(duì)比。綜合對(duì)比中數(shù)值并不平均1% Low FPS。

游戲引擎對(duì)比，選用Superposition (UE2) 、Heaven Bench、Unreal Engine 5和Unity引擎動(dòng)畫對(duì)比，AMD顯卡不支持DLSS與部分測(cè)試，因此成績(jī)?yōu)?。綜合對(duì)比上，RTX 4070 Ti相比RTX 3090 Ti有1.01倍的性能提升。領(lǐng)先點(diǎn)主要是新的UE5，落后點(diǎn)則是老牌的Heaven Bench。相比RTX 3080 Ti也有1.10倍的性能提升。

所有游戲綜合對(duì)比，沒有標(biāo)注DLSS版本的游戲均是DLSS 2對(duì)比DLSS 3，標(biāo)注版本的則是為具體版本對(duì)比。AMD顯卡的DLSS數(shù)據(jù)實(shí)際為AMD FSR，參數(shù)上與DLSS盡量保持一致。

通過分析具體數(shù)據(jù)可以發(fā)現(xiàn)，在不開啟DLSS的情況下，RTX 4070 Ti都會(huì)稍落后于RTX 3090 Ti，實(shí)際性能更接近RTX 3080 Ti。開啟DLSS后，RTX 4070 Ti的性能會(huì)有明顯的領(lǐng)先，綜合性能領(lǐng)先1.11倍。領(lǐng)先RTX 3080 Ti 1.19倍。也領(lǐng)先RX 7900 XTX 1.13倍。

游戲性能測(cè)試（4K）：

游戲引擎對(duì)比（4K），AMD顯卡不支持DLSS與部分測(cè)試，因此成績(jī)?yōu)?。綜合對(duì)比上，RTX 4070 Ti相比RTX 3090 Ti只有81.3%的性能。相比于RTX 3080 Ti性能也只有87.8%。更接近的性能應(yīng)該是RTX 3080，有98%的性能。

所有游戲綜合對(duì)比（4K），沒有標(biāo)注DLSS版本的游戲均是DLSS 2對(duì)比DLSS 3，標(biāo)注版本的則是為具體版本對(duì)比。AMD顯卡的DLSS數(shù)據(jù)實(shí)際為AMD FSR，參數(shù)上與DLSS盡量保持一致。CS：GO正好有版本更新沒有參與綜合對(duì)比中，僅作參考。

通過分析具體數(shù)據(jù)可以發(fā)現(xiàn)，在不開啟DLSS與RT的情況下，RTX 4070 Ti會(huì)與RTX 3080比較接近，開啟RT后，RTX 4070 Ti會(huì)與RTX 3080 Ti比較接近，開啟DLSS下則會(huì)稍優(yōu)于RTX 3080 Ti。綜合性能領(lǐng)先RTX 3080 1.25倍。領(lǐng)先RTX 3080 Ti 1.02倍。落后RTX 3090 Ti 7%。

DLSS 3 畫質(zhì)對(duì)比

作為40系最大的賣點(diǎn)之一，DLSS 3的對(duì)性能提升的同時(shí)又對(duì)畫質(zhì)有多少影響呢？這里準(zhǔn)備視頻和圖文一起進(jìn)行對(duì)比。

DLSS 3 VS 原生：

DLSS OFF

DLSS 3 ON

由于人的視線首要集中在可以清晰的畫面上，而如果不清晰的畫面擁有過多細(xì)節(jié)，就會(huì)引起一種反直覺。開啟DLSS后，中遠(yuǎn)景的過分細(xì)節(jié)被“刪減”，視覺感受會(huì)有所加強(qiáng)，同時(shí)近景光影也得到了進(jìn)一步的改善。就能讓人有更好的視覺感受。

左DLSS OFF; 右DLSS 3 ON

我們把開關(guān)后的畫面放在一起，可以清晰的看到開啟DLSS后的畫面的線條顆粒有所減少。視覺感官上更接近與真實(shí)的圖像畫面。

不過DLSS系列的問題仍舊無法避免。由于通過裁剪光源附近的面數(shù)，開啟后的部分場(chǎng)景在放大后能明顯看到鋸齒。如果截圖不經(jīng)意之間放大可能就會(huì)發(fā)現(xiàn)，此時(shí)就要好好利用NVIDIA Ansel了。

DLSS 3 VS DLSS 2：

DLSS 3對(duì)比不開啟當(dāng)然非常明顯，但是對(duì)比DLSS 2呢？

DLSS 2

DLSS 3

DLSS 2與DLSS 3其實(shí)基本看不出太大的差距，如果硬要說，最多是光影之間的小部分差距。尤其是樹葉能看到更多的光影細(xì)節(jié)。

左DLSS 2; 右DLSS 3

但是如果放大對(duì)比后，DLSS 3對(duì)比DLSS 2確實(shí)能看出差別，DLSS 2的畫質(zhì)感偏向于裁剪面數(shù)以及銳化，因此畫面總有一股膠狀感，而DLSS 3則很好的解決了這個(gè)問題。

DLSS 2

DLSS 3

在有光影的瓷鉆、樹木紋理表現(xiàn)上，DLSS 3能夠明顯的看出細(xì)節(jié)，而DLSS 2優(yōu)化后的紋理就像打了一層膠一樣。非常的模糊。

左DLSS 2; 右DLSS 3

放大后這些樹木的紋理差別就非常明顯了。

總的來說，DLSS 3的優(yōu)化效果還是非常明顯的，不過考慮到目前游戲支持有限，外加DLSS 3具體的表現(xiàn)不知道在更低端的顯卡表現(xiàn)如何，我們靜靜期待其后續(xù)表現(xiàn)。

AV1與H.264畫質(zhì)對(duì)比

AV1作為NVIDIA新一代顯卡力推的視頻編碼規(guī)格，相比主流的H.264有著體積與畫質(zhì)的優(yōu)勢(shì)。尤其是在未來8K視頻下，AV1將能省下不少資源。由于國內(nèi)大部分在線視頻網(wǎng)站都是H.264，少部分支持到H.265，只有極少的實(shí)驗(yàn)性AV1/VP9，這項(xiàng)技術(shù)主要還是服務(wù)于影視行業(yè)。當(dāng)然以后你下載的高清小電影也可以受益了。

這里主要對(duì)比AV1與H.264在使用相同的配置下編碼畫質(zhì)的差距。使用OBS開啟AV1與H.264，在100000Kbps最高碼率上限下進(jìn)行視頻錄制。選取微軟模擬飛行進(jìn)行畫質(zhì)對(duì)比，左邊為AV1，右邊為H.264。嚴(yán)格以上來說，AV1的畫質(zhì)只有在強(qiáng)烈光影下能有強(qiáng)烈的差別。但考慮到在體積對(duì)比上能壓縮接近30%的空間，NVIDIA的NVENC AV1雙編碼器對(duì)于創(chuàng)作者或者高端游戲視頻錄制玩家是非常友好的升級(jí)。對(duì)于一般人，考慮到目前CPU都開始集成核顯，除非錄制4K甚至8K，不然當(dāng)前的視頻網(wǎng)絡(luò)需求下，雙編碼器與AV1的優(yōu)勢(shì)還有待挖掘。

功耗與溫度

感謝4nm的工藝吧

RTX 4070 Ti的TGP功耗是285W，上一代的RTX 3070 Ti是290W，基本接近。

戰(zhàn)斧的散熱還是不錯(cuò)的?？倦u溫度不超過70.0℃，熱點(diǎn)溫度79.5℃，風(fēng)扇轉(zhuǎn)速只有40%（1500RPM+）。此時(shí)的烤雞頻率只有~2400MHz。檢測(cè)功耗也是280W左右。

游戲過程的功耗采集自FrameView。RTX 40系列最自豪的實(shí)際游戲沒有達(dá)到TGP水平，全程在250W以下。對(duì)比RTX 30系顯卡，全程接近于頂著450W TDP來跑。但我希望兩年后再測(cè)試也可以這樣表現(xiàn)出來。

總結(jié)

首先，RTX 4070 Ti這張卡本來不該出現(xiàn)，哪怕是這樣的形式也不對(duì)?？上?duì)手不給力，你沒得選，所以他的性能嚴(yán)格來說只是在RTX 3080 Ti左右，想要摸上RTX 3090 Ti，全靠DLSS。尤其是192Bit的位寬，會(huì)讓4070與4080形成一種強(qiáng)烈的隔代。不得不否認(rèn)這張卡會(huì)是目前2K游戲較高性價(jià)比的顯卡，但這種顯卡真的會(huì)是玩家期待的嘛？

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：瓜爺耶 > 《顯卡》

舉報(bào)/認(rèn)領(lǐng)