在NVIDIA與AMD摩拳擦掌即將發(fā)布新GPU之際,第三家可以在GPU領(lǐng)域能夠一戰(zhàn)的英特爾,選擇提前CES 2025一個(gè)月的時(shí)間,發(fā)布全新的英特爾銳炫ARC B系列GPU,代號(hào)Battlemage戰(zhàn)斗法師。 一向主打性價(jià)比的Intel ARC沒有讓人失望,首發(fā)兩款產(chǎn)品Intel ARC B580和Intel ARC B570全部直奔2000元人民幣的檔位去的。有足夠的勇氣和實(shí)力,以高性價(jià)比的姿態(tài),挑戰(zhàn)GeForce RTX 4060建立起來的光線追蹤游戲門檻,足以讓人敬佩。 筆者在第一時(shí)間收到了非常具有紀(jì)念價(jià)值的官方限定的英特爾銳炫ARC B580 Limited Edition版本,借著開箱,也讓我們抽點(diǎn)時(shí)間了解將性價(jià)比反擊戰(zhàn)拉響的Battlemage戰(zhàn)斗法師,厲害在什么地方。 開箱搶先看 讓我們直奔主題。目前為止已經(jīng)有宏碁Acer、華擎ASRock、藍(lán)戟GUNNIR、銘瑄MAXSUN、ONIX、SPARKLE等顯卡制造商確認(rèn)將會(huì)推出Intel ARC B系列顯卡,其中Intel ARC B580系列會(huì)在12月13日之后陸續(xù)開賣,定價(jià)249美元起步,約1814元人民幣。 定位低一些的Intel ARC B570系列則會(huì)在2025年1月16日以后陸續(xù)開賣,定價(jià)219美元,約1595元人民幣。當(dāng)然所有人民幣折算定價(jià)都是稅前參考價(jià)格,實(shí)際定價(jià)應(yīng)該還會(huì)再高一些,即便如此,兩款顯卡的定價(jià)已經(jīng)展現(xiàn)出了很好的親和力。 Intel ARC B580 Limited Edition則作為官方限定款發(fā)售,并且只計(jì)劃推出ARC B580版本,ARC B570則僅有第三方版本,足以見得英特爾對(duì)ARC B580的重視程度。 因此在包裝上Intel ARC B580 Limited Edition已經(jīng)盡顯格調(diào)。正面和背面的簡(jiǎn)約設(shè)計(jì)和數(shù)字旋渦圖騰讓外包裝儀式感拉滿。 內(nèi)部包裝盒也使用了同樣的深色調(diào)設(shè)計(jì)。 包裝盒本身帶有類似于托盤的設(shè)計(jì)。在打開盒子后,下方的顯卡會(huì)隨著盒子內(nèi)部的結(jié)構(gòu)被向上托舉30度左右,讓Intel ARC B580 Limited Edition以最帥的一面呈現(xiàn)給玩家。盒子上方的Let's Play則藏了產(chǎn)品快速指導(dǎo)書,以及附贈(zèng)品。 Intel ARC B580 Limited Edition本身則是被一塊絨布所覆蓋的,掀開之后就能看到ARC B580本體了。 Intel ARC B580 Limited Edition設(shè)計(jì)非常簡(jiǎn)約,并使用了雙卡槽小板設(shè)計(jì)。也就是所有PCB和芯片都集中在顯卡的前半部分,后半部分使用了鏤空的設(shè)計(jì)。英特爾表示,這樣的設(shè)計(jì)可以獲得更好的散熱性能,并且在氣流上也得到了優(yōu)化,風(fēng)扇噪音也可以更安靜。 顯卡另一面則使用雙風(fēng)扇設(shè)計(jì),顯卡本體很輕,外殼使用了細(xì)膩的磨砂質(zhì)感,手感非常好。 在接口上,Intel ARC B580 Limited Edition提供了3個(gè)DisplayPort 2.1接口,最高可實(shí)現(xiàn)UHBR 13.5,即每一個(gè)通道可以做到13.5Gbps傳輸速率,4個(gè)通道最終實(shí)現(xiàn)54Gbps的最大吞吐量。最下方一個(gè)接口則是HDMI 2.1。 供電接口則選擇了傳統(tǒng)的8pin電源接口,Intel ARC B580的供電需求為190W,ARC B570則只需要150W。另外PCIe接口使用了PCIe 4.0 x8的規(guī)格,這個(gè)設(shè)計(jì)思路與GeForce RTX 4060相似,PCIe 4.0 x8已經(jīng)足夠GPU的數(shù)據(jù)傳輸,并且也可以很好的控制成本。 顯卡的另一邊使用了棱角內(nèi)凹設(shè)計(jì),凸顯了Intel ARC B580 Limited Edition的設(shè)計(jì)感。 附送的配件似乎還可以組裝出一張紙模的ARC B580顯卡,筆者會(huì)努力一下,正式評(píng)測(cè)解禁的時(shí)候?qū)⑵浣M裝完成。 雖然現(xiàn)在評(píng)測(cè)性能還不能公布,但是Intel ARC B580和ARC B570的大致參數(shù)可以先看一下。比如Intel ARC B580 Limited Edition具備20個(gè)Xe Core,20個(gè)光線追蹤單元,160個(gè)XMX AI引擎,GPU頻率來到2670MHz,并具備12GB GDDR6 192bit顯存,顯存帶寬達(dá)到456 GB/s,TDP 233W。 Intel ARC B570則具備18個(gè)Xe Core,18個(gè)光線追蹤單元,144個(gè)XMX AI引擎,GPU頻率來到2500MHz,并具備10GB GDDR6 160bit顯存,顯存帶寬達(dá)到380 GB/s,TDP 203W。 BMG-G21敬上 Intel ARC B580和ARC B570都使用了BGM-G21核心,架構(gòu)版本12.7,使用的是臺(tái)積電6N制造工藝,晶體管數(shù)量為217億個(gè),且支持DirectX 12 Ultimate,意味著DX12 Ultimate中要求的光線追蹤、可變速率著色都可以很好的實(shí)現(xiàn)。 從整體上來看,滿配的BGM-G21核心包括5個(gè)渲染切片(Render Slice),20個(gè)Xe Core,160個(gè)XMX引擎,20個(gè)光線追蹤單元,20個(gè)紋理單元,10個(gè)像素后端,并且共享18MB的L2緩存,以及2個(gè)Multi-Format X-coders用于處理多種數(shù)據(jù)格式轉(zhuǎn)碼。 其中渲染切片(Render Slice)仍然是構(gòu)成ARC GPU的基礎(chǔ)。與Lunar Lake的iGPU一樣,ARC B580和B570的BGM-G21核心使用的是Xe2渲染切片,新的渲染切片引入了對(duì)于Excute Indirect的支持,原來3D任務(wù)需要CPU把指令給到GPU,然后由GPU去運(yùn)算執(zhí)行,而在Excute Indirect功能支持下,部分命令可以直接在GPU本地執(zhí)行,不需要CPU一條條告訴GPU做什么,而是GPU本身就具備Draw、Dispatch的能力,這些命令可以直接在GPU里直接完成。此外,幾何單元改進(jìn)達(dá)成頂點(diǎn)獲?。╒ertex Fetch)吞吐提升3倍,mesh shading性能提升3倍。 此外,緩存部分的壓縮率和吞吐量也有了明顯提升,包括提升了L1 Cache的利用率,Sampling吞吐提升2倍,Pixel Color Cache提升1.33倍等等。 在Xe2架構(gòu)也讓Battlemage加入了XVE矢量引擎、更高效的XMX引擎等。XMX矩陣單元同樣作為MAC乘法累加計(jì)算使用,這個(gè)功能類似于NVIDIA Tensor Core的AI推理性能,利用專屬的硬件提升游戲中XeSS分辨率超采樣的效率。在此之前的Xe-LPG利用的是DP4a指令實(shí)現(xiàn),效率自然是跟不上硬件的XMX矩陣的。 Xe2中的Xe核心包含8個(gè)512bit矢量引擎,相比上一代Xe的16個(gè)矢量引擎減少了一半,另一半用來放前面提到的2048bit XMX矩陣引擎來實(shí)現(xiàn)更好的運(yùn)算支持。XMX矩陣引擎包含INT2、INT4、INT8以及FP16、BF16在內(nèi)精度計(jì)算,并對(duì)FP64提供支持,從而實(shí)現(xiàn)對(duì)更豐富的推理模型的兼容。 由于XMX引擎支持Int8 4096 OPS/clock和FP16 2048 OPS/clock算力,遠(yuǎn)高于XVE矢量引擎,在重負(fù)荷AI加速中,可以扮演重要角色。同時(shí)Xe2在SIMD16的基礎(chǔ)上,增加了對(duì)SIMD32的支持,即一次處理32個(gè)數(shù)據(jù)元素。雖然這個(gè)設(shè)計(jì)是基于SIMD16上獲得而不是原生,但可以確保Intel ARC B580運(yùn)行更大規(guī)模的矩陣乘法,或者處理圖形渲染中更復(fù)雜的計(jì)算效率。 光線追蹤單元部分,Xe RTU光線追蹤單元也進(jìn)行了拓寬,提供三條遍歷通道,18 x Box intersections和2 x Triangle intersections計(jì)算,能夠更快速地進(jìn)行盒子和三角形之間的交叉檢測(cè)。其中Box intersections是指單元在光線與盒子或者說包圍體積相交時(shí)所能處理的數(shù)量,Triangle intersection指代光線與三角形相交時(shí)所能處理的數(shù)量。 另外得益于架構(gòu)和工藝的優(yōu)化,BGM-G21核心的能耗比也顯著提升了50%,效能是上一代ARC GPU無法比擬的。例如Draw XI執(zhí)行的圖形渲染處理,效能可以做到第一代ARC GPU的12.5倍。 同時(shí)英特爾還使用了《堡壘之夜》來舉例,每一個(gè)階段的處理,Xe2都做了更好的優(yōu)化,整體延遲也更低了。 XeSS 2與XMX AI一個(gè)不落 傳統(tǒng)GPU依靠的渲染能力來展現(xiàn)性能。而在近幾年的GPU性能展現(xiàn)中,AI加速游戲的性能也早已成為重要一環(huán),具備通用架構(gòu)的XeSS應(yīng)運(yùn)而生,而Battlemage開始也正式引入了XeSS 2。 XeSS 2有了明顯的進(jìn)步,它由三個(gè)部分組成,包含XeSS超分辨率(XeSS Super Resolution,XeSS-SR),XeSS幀生成(XeSS Frame Generation,XeSS-FG),Xe低延遲(Xe Low Latency,XeLL),這也是新顯卡和新游戲都逐漸展開支持的技術(shù)。 不同于NVIDIA使用獨(dú)立的光流加速器硬件來實(shí)現(xiàn)幀生成技術(shù),XeSS FG依賴的是自己的XMX AI引擎來實(shí)現(xiàn),具體做法是渲染出第一幀和第二幀,然后通過插幀技術(shù)和AI算法生成這兩幀之間的中間幀。第一幀和第二幀是游戲引擎原生渲染的結(jié)果,而中間幀則是利用AI生成的。在AI生成幀中,英特爾表示一共使用了兩種技術(shù),一種是光流重投影技術(shù),另一種是運(yùn)動(dòng)矢量重投影技術(shù)。這兩種技術(shù)共同作用,以確保插幀的準(zhǔn)確性和畫面的流暢性。 因此在工作模式中,會(huì)先由XeSS-SR實(shí)現(xiàn)游戲超分,以降低GPU負(fù)荷和提升游戲幀率,然后再通過XeSS-FG實(shí)現(xiàn)幀生成。在具體表現(xiàn)上,英特爾用《F1 24》舉例,在1440p最高畫質(zhì)下,XeSS 2最高可以提升3.9倍的幀率。 AI幀生成也意味著要解決延遲問題,XeLL由此誕生,具體做法是消除CPU隊(duì)列等待過程,對(duì)于英特爾而言,在硬件和驅(qū)動(dòng)層面控制CPU配合顯然要比NVIDIA嫻熟許多。 這里展示F1 2024作為展示,在原生狀態(tài)下跑了48FPS,57ms延遲,開了XeSS 2之后,提升到152FPS,28ms延遲,進(jìn)步是非常明顯的。 另外,英特爾也提供了僅在驅(qū)動(dòng)層面實(shí)現(xiàn)的模式,原理與XeLL類似,但不需要游戲本身支持,只要驅(qū)動(dòng)更新即可。效率沒有游戲原生支持那么高,但提升也已經(jīng)很明顯。 英特爾強(qiáng)調(diào)XeSS 2 API加入非常方便,不會(huì)讓游戲制作組增加太多的工作量,目前已經(jīng)有十款游戲表示會(huì)加入對(duì)XeSS 2的支持。 無論XeSS 2還是XeSS-FG,本質(zhì)上都是依賴于XMX AI引擎。除了前面提到XMX AI引擎可實(shí)現(xiàn)INT2、INT4、INT8以及FP16、BF16在內(nèi)精度計(jì)算,并對(duì)FP64提供支持,從而實(shí)現(xiàn)對(duì)更豐富的推理模型的兼容,在生成式AI上,也會(huì)讓Intel ARC 580成為GeForce RTX 4060的有力競(jìng)爭(zhēng)者,幫助創(chuàng)作者在不聯(lián)網(wǎng)的前提下,就能完成復(fù)雜的AI創(chuàng)作。 在顯卡的軟件層面,英特爾在過去一段時(shí)間中發(fā)布了超過50次的驅(qū)動(dòng)更新,,其中包括對(duì)120款以上的游戲提供Day-0支持,游戲覆蓋范圍提升了2.5倍,也包括DX11、DX9等老游戲的支持,Intel ARC驅(qū)動(dòng)正在肉眼可見的進(jìn)步。 在發(fā)布新顯卡的同時(shí),英特爾也將重新調(diào)整顯卡軟件UI,并增加更好用的顯卡超頻功能。幫助用戶更進(jìn)一步提升顯卡性能。 性價(jià)比凸顯 在性能對(duì)比上,英特爾使用Intel ARC B580 Limited Edition與Intel ARC A750 Limited Edition作為對(duì)比,在游戲性能提升幅度上,平均可以獲得24%的性能提升。 如果是與競(jìng)爭(zhēng)對(duì)手對(duì)比,Intel ARC B580 Limited Edition可以優(yōu)于GeForce RTX 4060平均10%,一方面得益于更高的GPU性能,另一方面是Intel ARC B580擁有12GB的顯存。 而具體的性能表現(xiàn),我們會(huì)在評(píng)測(cè)正式解禁的時(shí)候放出更多細(xì)節(jié),鑒于不到2000元人民幣的定位,以及優(yōu)于RTX 4060的表現(xiàn),對(duì)于追求性價(jià)比的同學(xué)而言,似乎沒有多少拒絕Intel ARC B580的理由。 更重要的是,如果Intel ARC B580和ARC B570實(shí)際表現(xiàn)足夠給力,競(jìng)爭(zhēng)對(duì)手們高昂的定價(jià),也應(yīng)該考慮降一降了。顯然這一次英特爾帶來的Battlemage戰(zhàn)斗法師,在CES 2025之前就把性價(jià)比反擊戰(zhàn)拉響了。
|
|