前言 前幾天看到一個(gè)新聞,30系顯卡終于翻頁,顯卡價(jià)格開始回升。就這樣的市場(chǎng)下,NVIDIA把曾經(jīng)的RTX 4080 12G換名重新登場(chǎng)。也就是RTX 4070 Ti 12G。這一張承載了NVIDIA 3倍優(yōu)秀功耗,在2K性能超越RTX 3090 Ti的顯卡表現(xiàn)如何呢?我只能說,真是高! ——七彩虹 Geforce RTX 4070 Ti 戰(zhàn)斧 NVIDIA AD104 構(gòu)架解析 硬件改進(jìn): 芝士AD104核心完整規(guī)格圖。AD104共計(jì)有5個(gè)GPC(Graphics Processing Cluster,圖像計(jì)算集群),合計(jì)有60組SM。AD104僅支持192Bit的位寬,而SM內(nèi)的規(guī)格還是原來一樣的。因此對(duì)比GA104,完整的AD104會(huì)有
AD104的規(guī)格說實(shí)話和GA103非常像。就是位寬砍半。如果說這大L2是強(qiáng)針劑,那小心心臟衰竭。 上圖就是RTX 4070 Ti的核心圖。和AD104基本一致,就是閹割了NVENC加速器。 剩下的內(nèi)容,和RTX 4080差不多的,因此如果看過的話可以跳到顯卡一覽了。 GPC在結(jié)構(gòu)上并沒有太大的變化,主要還是在一些小SM內(nèi)做了改進(jìn)。如第三代RTCore,第四代TensorCore,完整支持第八代NVENC AV1的雙解碼器等技術(shù)。 第三代 RT Core 的新計(jì)算特性這里就不多說了。提升主要來自算法上的優(yōu)化。他們總共提出了三個(gè)主要的提升??偨Y(jié)下來就是三點(diǎn):
第四代 TensorCore 單元的變化主要是集成了FP8計(jì)算單元,實(shí)現(xiàn)了最高1.3PFlops的計(jì)算性能。 除了構(gòu)架上的小幅改進(jìn),Ada構(gòu)架也把制程進(jìn)一步提升到了TSMC 4NNVIDIA定制工藝。使得AD102在與GA102面積相當(dāng),甚至更小的情況下?lián)碛?6.3B的晶體管數(shù)量,是原來2.69倍。 軟件改進(jìn): DLSS 3是隨著Ada構(gòu)架推出的新功能。過去大家對(duì)DLSS的評(píng)價(jià)褒貶不一,主要原因在于雖然DLSS提升性能,但是所帶來的畫面撕裂與模糊感非常強(qiáng)烈。新的DLSS 3除了保留了DLSS 2的功能外還引入了類似傳統(tǒng)幀生成的優(yōu)化方法。這種方法的好壞不做評(píng)價(jià)。但是如果能讓游戲從PPT變成電影,那也無法否認(rèn)其存在價(jià)值。 考慮到未來4K游戲的發(fā)展,高刷4K會(huì)漸漸變成主流。目前來說越來越多游戲開始支持DLSS,而支持DLSS 3游戲也會(huì)漸漸增加。希望這個(gè)技術(shù)能真成為高刷高分辨率的一個(gè)解決方法。 顯卡一覽 七彩虹 RTX 4070 Ti 戰(zhàn)斧的包裝變化不大,附贈(zèng)了一根12+4 Pin轉(zhuǎn)2個(gè)8Pin的轉(zhuǎn)接線。 今年戰(zhàn)斧的整體風(fēng)格沒有什么太大變化。這種方方正正的感覺其實(shí)挺好的。而且散熱效果也不差。 4070 Ti 戰(zhàn)斧的PCI-E擋板改成了兩個(gè),雖然散熱器還是擴(kuò)到了三個(gè)。顯示接口方面吧和上一代沒差,3DP 1.4+1HDMI 2.1設(shè)計(jì)。 RTX的燈光不能沒有,但是有與沒有,都阻擋不了熱辣辣的空氣。 12+4Pin接口,RTX 4070 Ti的功耗為285W TGP。 嘿嘿嘿,轉(zhuǎn)兩個(gè)8Pin。 一些小細(xì)節(jié),其實(shí)沒啥了。 分體一覽,我只能說戰(zhàn)斧真的沒啥差別。 風(fēng)扇是ID-Cooling ID9820M12B,散熱規(guī)格12V 0.36A。 4070 Ti戰(zhàn)斧的散熱規(guī)格肯定是低很多,6熱管散熱,4跟熱管延伸至散熱后部,2跟延伸至前部。鱗片的面積其實(shí)可以不做成三槽的,但是為了拉風(fēng)。 Geforce RTX 4070 Ti 戰(zhàn)斧PCB完整照片。非常的停機(jī)坪。甚至PCB的規(guī)格都原本是256Bit設(shè)計(jì)的??赡芤彩峭蝗话l(fā)現(xiàn)對(duì)手打不過而臨時(shí)變故吧。供電規(guī)格也沒有什么稀奇,10+2相供電,uPI uP9512+萬代AOZ5311NQI 55A級(jí)一體MOS。過去用來驅(qū)動(dòng)RTX2080 Ti級(jí)別的核心,畢竟他們那個(gè)時(shí)候也就250W的TDP。 性能測(cè)試 CPU采用英特爾酷睿i9-13900K。 主板采用華碩 ROG MAXIMUS Z790 EXTREME。 散熱采用雅浚EA5 360 白色。 內(nèi)存采用芝奇幻鋒戟 RGB 16Gx2 DDR5 6000,由于華碩主板支持在Intel平臺(tái)開啟EXPO,所以內(nèi)存可以運(yùn)行在6000頻率上。 選用的電源為鑫谷KL1250G 1250W,支持ATX3.0。附帶的了兩根12+4Pin接口,能夠提供最高600W的供電輸出。 環(huán)境溫度16℃,本次測(cè)試有六張顯卡參與對(duì)比,其中RTX 3090 Ti與RTX 4070 Ti將最主要對(duì)比。以下是參與的顯卡:
所有基準(zhǔn)均七彩虹 Geforce RTX 4070 Ti 戰(zhàn)斧 為基準(zhǔn),未特殊說明均是以比例顯示,數(shù)值均越高越好。 GPU-Z 2.52版可以完美識(shí)別RTX 4070 Ti。RTX 4070 Ti戰(zhàn)斧的頻率最高能Boost到2700MHz左右。 理論性能測(cè)試: AIDA64理論性能對(duì)比,RTX 4070 Ti綜合性能與RTX 3090 Ti持平。RTX 4070 Ti內(nèi)部的超大緩存讓內(nèi)部顯存復(fù)制速度超過了1.2TB/s。浮點(diǎn),整數(shù)的提升基本來自于頻率的提升。SHA-1是唯一落后的,這也是因?yàn)橐?guī)格和算法的問題。 3DMARK基準(zhǔn)測(cè)試,可以看到RTX 4070 Ti綜合性能是RTX 3090 Ti的98%。除了DirectX光追有領(lǐng)先以外,其他基本是持平或者小幅落后。反倒是領(lǐng)先RTX 3080 Ti 2%,領(lǐng)先RTX 3080 19%。 3DMARK DLSS性能對(duì)比,RTX 40 系列支持DLSS 3,而RTX 30 系列不支持,因此在RTX 30 系列 DLSS 3對(duì)比中,以DLSS 2的性能做對(duì)比。RTX 4070 Ti平均性能是RTX 3090 Ti的67%。在沒有DLSS的支持下,RTX 4070 Ti性能落后在10%左右,8K下更是一幀和10幀的對(duì)比。這也不奇怪,畢竟12G 192Bit的位寬。只有在DLSS 3的加持下,RTX 4070 Ti才能摸到RTX 3090 Ti。 嚴(yán)格來說性能上其實(shí)更接近RTX 3080 Ti。沒有DLSS和DLSS 2下幀數(shù)接近。只有在DLSS 3開啟下,性能提升能達(dá)到25%以上。綜合而言獲得4%的性能領(lǐng)先。 VRMARK對(duì)比,Blue Room比較吃性能,RTX 4070 Ti和RTX 3080 Ti性能接近。落后RTX 3090 Ti 10%,合理。 渲染對(duì)比,Blender是老牌渲染器,所以對(duì)多個(gè)設(shè)備都有支持,V-Ray則是常用于3DSMAX的渲染器,主要支持NVIDIA。Octanebench則是專門支持英偉達(dá)的渲染跑分軟件。渲染一直都是新顯卡會(huì)占優(yōu)勢(shì),畢竟有優(yōu)化,所以這里RTX 4070 Ti領(lǐng)先RTX 3090 Ti 3%,領(lǐng)先RTX 3080 Ti 8.6%。 游戲性能測(cè)試(2K): RTX 4070 Ti的定位顯然不足以撐起4K市場(chǎng),因此我們將測(cè)試2K與4K性能進(jìn)行對(duì)比。綜合對(duì)比中數(shù)值并不平均1% Low FPS。 游戲引擎對(duì)比,選用Superposition (UE2) 、Heaven Bench、Unreal Engine 5和Unity引擎動(dòng)畫對(duì)比,AMD顯卡不支持DLSS與部分測(cè)試,因此成績(jī)?yōu)?。綜合對(duì)比上,RTX 4070 Ti相比RTX 3090 Ti有1.01倍的性能提升。領(lǐng)先點(diǎn)主要是新的UE5,落后點(diǎn)則是老牌的Heaven Bench。相比RTX 3080 Ti也有1.10倍的性能提升。 所有游戲綜合對(duì)比,沒有標(biāo)注DLSS版本的游戲均是DLSS 2對(duì)比DLSS 3,標(biāo)注版本的則是為具體版本對(duì)比。AMD顯卡的DLSS數(shù)據(jù)實(shí)際為AMD FSR,參數(shù)上與DLSS盡量保持一致。 通過分析具體數(shù)據(jù)可以發(fā)現(xiàn),在不開啟DLSS的情況下,RTX 4070 Ti都會(huì)稍落后于RTX 3090 Ti,實(shí)際性能更接近RTX 3080 Ti。開啟DLSS后,RTX 4070 Ti的性能會(huì)有明顯的領(lǐng)先,綜合性能領(lǐng)先1.11倍。領(lǐng)先RTX 3080 Ti 1.19倍。也領(lǐng)先RX 7900 XTX 1.13倍。 游戲性能測(cè)試(4K): 游戲引擎對(duì)比(4K),AMD顯卡不支持DLSS與部分測(cè)試,因此成績(jī)?yōu)?。綜合對(duì)比上,RTX 4070 Ti相比RTX 3090 Ti只有81.3%的性能。相比于RTX 3080 Ti性能也只有87.8%。更接近的性能應(yīng)該是RTX 3080,有98%的性能。 所有游戲綜合對(duì)比(4K),沒有標(biāo)注DLSS版本的游戲均是DLSS 2對(duì)比DLSS 3,標(biāo)注版本的則是為具體版本對(duì)比。AMD顯卡的DLSS數(shù)據(jù)實(shí)際為AMD FSR,參數(shù)上與DLSS盡量保持一致。CS:GO正好有版本更新沒有參與綜合對(duì)比中,僅作參考。 通過分析具體數(shù)據(jù)可以發(fā)現(xiàn),在不開啟DLSS與RT的情況下,RTX 4070 Ti會(huì)與RTX 3080比較接近,開啟RT后,RTX 4070 Ti會(huì)與RTX 3080 Ti比較接近,開啟DLSS下則會(huì)稍優(yōu)于RTX 3080 Ti。綜合性能領(lǐng)先RTX 3080 1.25倍。領(lǐng)先RTX 3080 Ti 1.02倍。落后RTX 3090 Ti 7%。 DLSS 3 畫質(zhì)對(duì)比 作為40系最大的賣點(diǎn)之一,DLSS 3的對(duì)性能提升的同時(shí)又對(duì)畫質(zhì)有多少影響呢?這里準(zhǔn)備視頻和圖文一起進(jìn)行對(duì)比。 DLSS 3 VS 原生: DLSS OFF DLSS 3 ON 由于人的視線首要集中在可以清晰的畫面上,而如果不清晰的畫面擁有過多細(xì)節(jié),就會(huì)引起一種反直覺。開啟DLSS后,中遠(yuǎn)景的過分細(xì)節(jié)被“刪減”,視覺感受會(huì)有所加強(qiáng),同時(shí)近景光影也得到了進(jìn)一步的改善。就能讓人有更好的視覺感受。 左DLSS OFF; 右DLSS 3 ON 我們把開關(guān)后的畫面放在一起,可以清晰的看到開啟DLSS后的畫面的線條顆粒有所減少。視覺感官上更接近與真實(shí)的圖像畫面。 不過DLSS系列的問題仍舊無法避免。由于通過裁剪光源附近的面數(shù),開啟后的部分場(chǎng)景在放大后能明顯看到鋸齒。如果截圖不經(jīng)意之間放大可能就會(huì)發(fā)現(xiàn),此時(shí)就要好好利用NVIDIA Ansel了。 DLSS 3 VS DLSS 2: DLSS 3對(duì)比不開啟當(dāng)然非常明顯,但是對(duì)比DLSS 2呢? DLSS 2 DLSS 3 DLSS 2與DLSS 3其實(shí)基本看不出太大的差距,如果硬要說,最多是光影之間的小部分差距。尤其是樹葉能看到更多的光影細(xì)節(jié)。 左DLSS 2; 右DLSS 3 但是如果放大對(duì)比后,DLSS 3對(duì)比DLSS 2確實(shí)能看出差別,DLSS 2的畫質(zhì)感偏向于裁剪面數(shù)以及銳化,因此畫面總有一股膠狀感,而DLSS 3則很好的解決了這個(gè)問題。 DLSS 2 DLSS 3 在有光影的瓷鉆、樹木紋理表現(xiàn)上,DLSS 3能夠明顯的看出細(xì)節(jié),而DLSS 2優(yōu)化后的紋理就像打了一層膠一樣。非常的模糊。 左DLSS 2; 右DLSS 3 放大后這些樹木的紋理差別就非常明顯了。 總的來說,DLSS 3的優(yōu)化效果還是非常明顯的,不過考慮到目前游戲支持有限,外加DLSS 3具體的表現(xiàn)不知道在更低端的顯卡表現(xiàn)如何,我們靜靜期待其后續(xù)表現(xiàn)。 AV1與H.264畫質(zhì)對(duì)比 AV1作為NVIDIA新一代顯卡力推的視頻編碼規(guī)格,相比主流的H.264有著體積與畫質(zhì)的優(yōu)勢(shì)。尤其是在未來8K視頻下,AV1將能省下不少資源。由于國內(nèi)大部分在線視頻網(wǎng)站都是H.264,少部分支持到H.265,只有極少的實(shí)驗(yàn)性AV1/VP9,這項(xiàng)技術(shù)主要還是服務(wù)于影視行業(yè)。當(dāng)然以后你下載的高清小電影也可以受益了。 這里主要對(duì)比AV1與H.264在使用相同的配置下編碼畫質(zhì)的差距。使用OBS開啟AV1與H.264,在100000Kbps最高碼率上限下進(jìn)行視頻錄制。選取微軟模擬飛行進(jìn)行畫質(zhì)對(duì)比,左邊為AV1,右邊為H.264。嚴(yán)格以上來說,AV1的畫質(zhì)只有在強(qiáng)烈光影下能有強(qiáng)烈的差別。但考慮到在體積對(duì)比上能壓縮接近30%的空間,NVIDIA的NVENC AV1雙編碼器對(duì)于創(chuàng)作者或者高端游戲視頻錄制玩家是非常友好的升級(jí)。對(duì)于一般人,考慮到目前CPU都開始集成核顯,除非錄制4K甚至8K,不然當(dāng)前的視頻網(wǎng)絡(luò)需求下,雙編碼器與AV1的優(yōu)勢(shì)還有待挖掘。 功耗與溫度 感謝4nm的工藝吧 RTX 4070 Ti的TGP功耗是285W,上一代的RTX 3070 Ti是290W,基本接近。 戰(zhàn)斧的散熱還是不錯(cuò)的??倦u溫度不超過70.0℃,熱點(diǎn)溫度79.5℃,風(fēng)扇轉(zhuǎn)速只有40%(1500RPM+)。此時(shí)的烤雞頻率只有~2400MHz。檢測(cè)功耗也是280W左右。 游戲過程的功耗采集自FrameView。RTX 40系列最自豪的實(shí)際游戲沒有達(dá)到TGP水平,全程在250W以下。對(duì)比RTX 30系顯卡,全程接近于頂著450W TDP來跑。但我希望兩年后再測(cè)試也可以這樣表現(xiàn)出來。 總結(jié) 首先,RTX 4070 Ti這張卡本來不該出現(xiàn),哪怕是這樣的形式也不對(duì)??上?duì)手不給力,你沒得選,所以他的性能嚴(yán)格來說只是在RTX 3080 Ti左右,想要摸上RTX 3090 Ti,全靠DLSS。尤其是192Bit的位寬,會(huì)讓4070與4080形成一種強(qiáng)烈的隔代。不得不否認(rèn)這張卡會(huì)是目前2K游戲較高性價(jià)比的顯卡,但這種顯卡真的會(huì)是玩家期待的嘛? |
|