科技行者 《圣歌(Anthem)》是由BioWare制作,EA發(fā)行的一款融合RPG敘事風格+大型多人在線的網(wǎng)絡游戲。在游戲中,玩家可穿著機甲上天下海,在海陸空自由的冒險探索。玩家執(zhí)行關卡任務,之后與其他玩家在巨大的的開放世界中打怪。游戲中有一個單人區(qū)域的主城,在這里,玩家領取并完成主線任務,并且可以在主城的熔爐處定制自己的酷炫機甲。 3月26日,圣歌1.4更新了對NVIDIA DLSS技術的支持,官網(wǎng)建議系統(tǒng)配置如下 我用手頭的 RTX 2080Ti、 RTX 2060、 GTX 1080Ti 和 GTX 1080 四塊公版顯卡測試了圣歌1.4在不同軟硬件配置下幀率性能。實測結果顯示,4K分辨率極高畫質下,只有RTX 2080Ti在DLSS技術加速下才能達到60幀以上的流暢運行水平。10系顯卡的兩款旗艦型號1080和1080Ti的游戲分別達到30幀和40幀。而RTX 2060的4K游戲性能表現(xiàn)出色,常規(guī)渲染配置下幀率接近30,而開啟DLSS后幀率驟升到接近40,從1080提升到了1080Ti的流暢度。且開啟DLSS后,普通人眼很難辨識出畫面缺陷。 根據(jù)英偉達官方網(wǎng)站公布的測試數(shù)據(jù),在默頻i9-9900K的測試平臺上,開啟DLSS后,RTX2080Ti和RTX2060的幀率分別提升了34.9%和39.4%。經(jīng)過近期的驅動和軟件版本優(yōu)化升級,測試中的幀率數(shù)值在這個基礎上已經(jīng)又有提升。 >>>DLSS技術介紹DLSS是什么深度學習超級采樣Deep Learning Super Sampling(DLSS)是一種NVIDIA RTX技術,它利用人工智能的強大功能,在圖形密集型負載(比如開啟光線追蹤)的游戲中提高幀率。使用DLSS,玩家可以使用更高的分辨率和設置,同時仍然保持穩(wěn)定的幀率。 在沒有DLSS支持的情況下,顯卡需要用數(shù)學家發(fā)明的公式進行大量計算才能得到讓人滿意的反鋸齒結果,等算完這些結果游戲可能已經(jīng)卡成U·ェ·*U了。DLSS技術就是讓顯卡,拿著不完美的圖像輸入,輸入到DLSS處理單元,根據(jù)顯卡驅動中提供的神經(jīng)網(wǎng)絡參數(shù)進行少量的簡單運算,就可以高速“腦補”出完美的圖像并輸出到顯示器,讓用戶享受到如絲般順滑的高畫質高分辨率游戲體驗。 所以DLSS加速技術工作得好不好,就要取決于顯卡上DLSS單元的處理能力和顯卡驅動里神經(jīng)網(wǎng)絡參數(shù)的腦補能力。其中,關于DLSS硬件單元的處理能力,在本文的測試中會看到它帶來的限制;關于DLSS神經(jīng)網(wǎng)絡參數(shù)的腦補能力,也有細節(jié)對比。 神奇的神經(jīng)網(wǎng)絡參數(shù)是怎么得到的DLSS神經(jīng)網(wǎng)絡參數(shù)通過訓練得到,訓練過程分為兩部分:反鋸齒和插值修正。 第一步,NVIDIA的DLSS團隊首先從目標游戲或者目標游戲類型中提取許多鋸齒走樣幀(aliased frame),然后對每個走樣幀使用超級采樣(super-sampling)或累積渲染(accumulation rendering)生成對應的“完美幀”,之后把這些完美幀輸入到NVIDIA的超級計算機用于訓練。超級計算機訓練DLSS模型識別這些鋸齒走樣的輸入幀,并盡可能生成和“完美幀”接近的的高質量反鋸齒圖像。到這里,神經(jīng)網(wǎng)絡參數(shù)就已經(jīng)掌握AA級別的反鋸齒能力了。 第二步,繼續(xù)重復訓練DLSS模型,使模型生成額外的像素,用于提高輸入圖像的分辨率。這兩步技術的結合使GPU能夠以更高的幀速率顯示畫面。到這里,訓練出的神經(jīng)網(wǎng)絡參數(shù)就可以放在NVIDIA驅動里發(fā)布給玩家用來暢玩圣歌了。 NVIDIA在超級計算機上,給神經(jīng)網(wǎng)絡模型看大量通過反鋸齒技術渲染到完美的圖片,讓它有快速生成完美反鋸齒圖片的能力。但是完美的反鋸齒結果可能并不能讓人滿意,可能看著就不像正常圖片。因為AA這技術本身就會導致高動態(tài)重影和閃爍這類問題。于是NVIDIA再給神經(jīng)網(wǎng)絡模型看大量高分辨率的圖片,讓它學會快速生成正常高分辨率圖片的能力。 DLSS總能提高幀率么,為什么游戲里1080p分辨率下不能開DLSSDLSS的設計是為了在高GPU工作負載(也就是幀率很低,GPU累冒煙了也還是有點卡的時候)下提高幀率。。如果游戲已經(jīng)運行在高幀率,那GPU的幀渲染時間可能比DLSS執(zhí)行時間還短。在這種情況下,NVIDIA就不建議用DLSS了,因為這時候開DLSS也提高不了幀率,反而還降。通常來說,幀率小于60的時候,DLSS帶來的性能提升最明顯。 當前能DLSS的游戲,用低端RTX運行在1080p分辨率下都已經(jīng)很流暢了,開了DLSS以后又降幀率又降畫質,所以軟硬件廠商禁止開啟。 >>>測試平臺介紹>>>3D Mark基準測試DirectX測試3DMark基準測試是一個驗明正身的環(huán)節(jié),同時也可以了解一下NVIDIA的軟件優(yōu)化方向。 從顯卡測試分數(shù)結果看,RTX 2080Ti > GTX 1080Ti > GTX 1080 ≈ RTX 2060,在各個子項目中也體現(xiàn)了相同的趨勢。 在測試DirectX 11性能的FireStrike中,1080憑借更高的硬件規(guī)格,在高分辨率測試中分數(shù)超出RTX 2060 10%以上;在測試DirectX 12性能的TimeSpy中,經(jīng)過軟件優(yōu)化,RTX2060可以打平GTX1080甚至小勝。 光追和DLSS測試在不開啟DLSS的光追測試項目2K分辨率PortRoyal中,清晰呈現(xiàn)RTX 2080Ti >> GTX 1080Ti > GTX 1080 > RTX 2060的趨勢。GTX旗艦1080Ti也只能達到10幀。1080Ti、1080和2060的Shader數(shù)比率為3584 : 2560 : 1920,這一比率也基本對應地體現(xiàn)在了RayTrace的計算性能上。PortRoyal測試中比較奇怪的現(xiàn)象是,在2K測試中,RTX 2060的30個光線追蹤RT core好像并沒有發(fā)揮作用,導致幀率只有4幀多一點。 在開啟DLSS的對比測試中,兩塊RTX顯卡在開啟DLSS后都有35%以上的提升。尤其是對于2K分辨率下的RTX 2060,DLSS直接化腐朽為神奇,把PPT效果的PortRoyal提升到了26.06這種“不卡”的及格幀率。 >>>圣歌游戲幀率測試測試介紹本次測試采用了兩個測試場景: 第一幕 狂怒之心,從主角出場開始,到跑到廣場進入下一關。期間經(jīng)歷巖漿河,爆炸場景,開槍射擊,野怪攻擊,Boss特效攻擊等場景,測試時長兩分半左右。 第二幕 激活繼電器,從主角在基地飛行出發(fā)開始,接連激活四個繼電器,之后下水飛進山洞結束。期間經(jīng)歷多個場景加載和快速轉換,山谷飛行,野怪攻擊,開槍射擊,水下飛行等場景,測試時長四分半左右。 另外還測試了一次4K分辨率下RTX 2080Ti運行第三幕情節(jié),時長20分鐘,主要為了驗證長時間玩耍的幀率是否和第一幕第二幕的短時測試一致。結果證明上述兩個測試場景可以代表長時間運行游戲時的幀率性能。 兩個測試場景下各分辨率平均幀率(DLSS OFF)在不開啟DLSS的情況下RTX 2080Ti > GTX 1080Ti > GTX 1080 > RTX 2060。 對于1080P分辨率,每秒105幀左右的幀率是當前版本游戲的上限,也就是滿分。GTX 1080Ti和RTX 2080Ti都能達到這一幀率。從各分辨率幀率增長的相對比率來看,1080Ti達到105幀已經(jīng)比較盡力了,2080Ti達到105幀是因為滿分就是105幀。 兩個測試場景雖然色調和情節(jié)不同,但是各分辨率下,這兩個場景的幀率基本相同。 對于1080P這種筆記本平臺的分辨率,顯卡性能達到GTX 1080性能,可以90幀流暢運行圣歌1.4,而這一幀率已經(jīng)比較接近滿分105幀每秒了。 DLSS助力RTX提升圣歌幀率2K分辨率性能測試如前面的分析,在2K分辨率下,RTX 2080Ti游戲運行過于流暢,以至于開啟DLSS反倒性能下降,不建議開啟DLSS。 對于RTX 2060,開啟DLSS提升不多,開不開都可以。注意這里因為2K分辨率計算量相對較小,RTX 2060幀率從57幀只能提升到65幀。 2K分辨率下,被測的幾塊公版顯卡都可以流暢運行。 4K分辨率性能測試在4K分辨率下,兩塊RTX顯卡開啟DLSS后都能得到30%-35%左右的性能提升。且經(jīng)過一個月的優(yōu)化,游戲幀率相比3月26日剛發(fā)布DLSS時候都已經(jīng)有不小的提升。 在不開啟DLSS的時候,RTX 2060的圣歌游戲性能和GTX1080比差距已經(jīng)很小了。 開啟DLSS后,RTX 2060已經(jīng)可以和GTX 1080Ti相比,估計再等兩版驅動以后就可以趕上或者超過GTX 1080Ti了。 在4K這種負載較重的高分辨率下,在已經(jīng)達到每秒57幀幀率的基礎上,開啟DLSS仍然可以大幅提升RTX 2080Ti的幀率。對于4K分辨率,建議開啟RTX顯卡的DLSS。 1% low framerate對比1% low framerate這個代表了游戲過程中可能出現(xiàn)的卡頓情況,它的值越接近平均幀率越好。簡單理解這個指標的含義就是:“玩游戲的過程中1%的可能會卡那么一下,當卡頓發(fā)生的時候就卡到這個U·ェ·*U幀率以下”。 把開啟DLSS的RTX 2060單獨列成一組結果和GTX進行對比,可以看到DLSS技術在提升平均幀率的同時,對應地也提升了1% low framerate。整體地提升了游戲流暢度。 >>>DLSS畫質對比▲六倍放大下的人物模型,上圖DLSS on 在一些反光面的處理上,DLSS on后少了一些細節(jié)。 ▲七倍放大下的水壺,左圖DLSS on 除了反光面的差別外,繼續(xù)放大觀察主角背的水壺,注意右側的那個壺,看上去蹭到哪里給碰臟了。在右圖中,它臟得比較有細節(jié);在左圖中,開了DLSS之后,這個水壺看上去像是拿抹布沾點水擦了擦之后的感覺。 ▲五倍放大下的山崖石雕,左側DLSS on 右側圖中還是細節(jié)更多一些,在石雕下巴頦這里的陰影處,還能看到要表達的紋理,山崖上的樹也更清晰;左側圖中,開了DLSS后,下巴頦和胳臂上的細節(jié)都給平滑掉了,山崖上的樹也快看不到了。 ▲狂怒之心 測試截圖,上圖DLSS on 在整個場景中,上面對比的三個細節(jié)完全不影響游戲的感受。圖中山上的下巴頦紋理和小樹杈,對情節(jié)發(fā)展和游戲體驗都沒什么影響。 ▲六倍放大下的葉子,上圖DLSS on 在六倍放大下,下面的葉子更水靈,如果這是蔬菜的話,這樣的葉??粗杏X更新鮮。上面的葉子在開了DLSS之后細節(jié)沒了,看葉梗感覺菜已經(jīng)有點蔫了,而且看反光好像還變油膩了。是不是有些塑料感? ▲六倍放大下的枯葉,上圖DLSS on 下面的葉子能看到枯黃的紋理,更像真葉子,上面的DLSS后把紋理平滑掉了。 ▲十倍放大下的葉子 從這個十倍對比圖中,可以看到DLSS神經(jīng)網(wǎng)絡的“腦補反鋸齒”能力很強。在下圖的普通AA反鋸齒中,即使是極高畫質也能看到鋸齒走樣;而上圖中開了DLSS之后,Tensor Core腦補出了照片級別的葉子邊緣。然而注意左數(shù)第三片葉子,DLSS在反邊緣鋸齒的時候,把葉子中間的脈絡也給模糊掉了。 ▲六倍放大下的葉子 同樣,下面的葉子看上去像素更高,塑料感更少。 ▲激活繼電器 測試截圖 不看截圖中的幀率的話,在4K顯示器上都很難辨認出來這兩幅圖中哪一個開了DLSS。如果沒有八倍鏡的幫助,哥表示根本嗶嗶不出前面提到的四處細節(jié)差別。 >>>結論通過測試可以看到: 在4K分辨率下,RTX 2060的基礎渲染性能可以摸到GTX 1080的屁股;經(jīng)DLSS加持,幀率已經(jīng)逐漸接近GTX 1080Ti,經(jīng)未來驅動優(yōu)化極有可能趕上1080Ti; 在2K分辨率下,被測的各卡都可以達到55幀以上的流暢幀率。在這種流暢度下,DLSS提升很少。 在最新425.31版本驅動中,DLSS對4K圣歌畫面的優(yōu)化已經(jīng)八分優(yōu)秀,對于類似葉片邊緣這種反鋸齒的細節(jié)處理,已經(jīng)接近理想水平。還差兩分的原因是對邊緣的識別還不太好,經(jīng)常把畫面里的細節(jié)當成邊緣鋸齒給平滑掉了。 在十倍放大的局部畫面中,DLSS對細節(jié)的損傷也不是很明顯,所以如果玩家沒有開十倍鏡逛地圖的習慣的話,對于普通眼睛,DLSS相當于幾乎無損地提升了幀率。至于對吃雞類射擊游戲玩家在十倍鏡中水平的發(fā)揮,廠家應該會專門做出對應的DLSS優(yōu)化。根據(jù)之前測試戰(zhàn)地V中八倍鏡98K的經(jīng)驗,感覺打偏的情況多數(shù)是因為我手殘,和DLSS關系不大。 |
|