1引言&規(guī)格對比&外觀賞析
(資料圖)
引言
老黃在2022秋季GTC大會上發(fā)布了萬眾矚目的RTX4090與RTX4080顯卡,全新的AdaLovelace架構(gòu)和TSMC4N工藝的升級讓這兩張顯卡在性能層面有了質(zhì)的飛躍,價(jià)格方面也是水漲船高,相信不少玩家也跟筆者一樣,期待NV趕緊推出適合玩家的中端顯卡?,F(xiàn)在GeForceRTX4070Ti它來了!
我們也在第一時(shí)間體驗(yàn)到了耕升的RTX4070Ti顯卡,在上手了使用了耕升GeForceRTX4070Ti星極幻姬OC一段時(shí)間后,筆者發(fā)現(xiàn)這張RTX4070Ti不僅顏值在線,性能也是超乎預(yù)期的強(qiáng),經(jīng)過重新定價(jià)的RTX4070Ti確確實(shí)實(shí)可以稱得上是目前最具性價(jià)比的RTX40系顯卡,下面給大家講講這張顯卡究竟強(qiáng)在哪里。
*下文“耕升 GeForceRTX4070Ti星極幻姬OC”簡稱為“耕升RTX4070Ti星極幻姬OC”
規(guī)格對比
規(guī)格對比
開始測試前,先讓我們了解一下耕升RTX4070Ti星極幻姬OC,其采用的是AD104-400核心,TSMC4N工藝制造,芯片面積為295平方毫米,別看它面積比上代的GA104-400核心小,但它的晶體管密度達(dá)到了358億,晶體管數(shù)量相比較于上一代產(chǎn)品提升非常明顯,近乎翻倍,而這一代的核心還進(jìn)一步提升了頻率,因此能帶來更好的性能表現(xiàn)。
其他參數(shù)方面,耕升RTX4070Ti星極幻姬OC上的AD104核心標(biāo)配7680個(gè)CUDA,60個(gè)第三代RTCores,240個(gè)第四代TensorCores,并且用上了12GB的GDDR6X顯存,相比上代的提升還是很明顯的,畢竟大顯存配合性能上的提升更可以為游戲以及創(chuàng)作者帶來更好的使用體驗(yàn)。
目前耕升RTX4070Ti星極幻姬OC顯卡上配備的這顆AD104-400核心可以算是完整的AD104核心了。完整的AD104核心應(yīng)該包括5個(gè)GPC(圖形處理集群)、30個(gè)TPC(紋理處理集群)、60個(gè)SM(流式多處理器)以及一個(gè)帶有6個(gè)32Bit顯存控制器的192Bit顯存帶寬。
不過以老黃精準(zhǔn)的刀法來看,RTX4070Ti之下應(yīng)該還有一張RTX4070,筆者猜測,RTX4070顯卡應(yīng)該還會延用AD104核心,不過會在RTX4070Ti的基礎(chǔ)上進(jìn)行閹割,衍生出AD104-300核心,性能會稍遜一籌,不過價(jià)格也會有一定優(yōu)勢。
外觀賞析: 耕升 GeForce RTX 4070 Ti 星極幻姬 OC
耕升RTX4070Ti星極幻姬OC的外包裝還是相當(dāng)有特點(diǎn)的,正面滿滿當(dāng)當(dāng)?shù)馁惒┡罂孙L(fēng)。在包裝的右下角標(biāo)明了自己的身份GeForceRTX4070Ti,而在左下角是型號星極皓月OC12GBGDDR6X。
包裝盒的背面就顯得有些樸素了,主要介紹了耕升的品牌理念與星極系列顯卡的獨(dú)特設(shè)計(jì)。
耕升在包裝盒的正面還特地標(biāo)注了耕升RTX4070Ti星極幻姬OC支持三年質(zhì)保以及個(gè)人送保,玩家可以放心購買。
拆看包裝就能看到耕升RTX4070Ti星極幻姬OC的真容了,這款顯卡的設(shè)計(jì)相當(dāng)大膽,正面是冰川藍(lán)與少女粉的漸變組合,極致的色彩碰撞,讓顯卡冷艷而又不失高貴。把它與其他顯卡放在一起,它絕對是最迷人的存在。
正面的三把散熱風(fēng)扇格外引人注目,每把風(fēng)扇都達(dá)到了92mm的直徑,配合第二代耕升“炫風(fēng)之刃”造形扇葉,特殊分葉型設(shè)計(jì)讓風(fēng)扇在相同的轉(zhuǎn)速底下比傳統(tǒng)扇葉擁有更大的風(fēng)流量,進(jìn)一步舒緩顯卡溫度,加強(qiáng)核心動態(tài)頻率的提升幅度。
放大看細(xì)節(jié),中間的散熱風(fēng)扇被銀色風(fēng)扇框所包圍,造型酷似一只眼睛,四周的鏤空其實(shí)是由耕升的“G”Logo所組成,出色的設(shè)計(jì)中也藏有不少細(xì)節(jié)。
耕升RTX4070Ti星極幻姬OC的背板由金屬材質(zhì)打造,可以給PCB提供充足的保護(hù)。正面的漸變色一直延申至背部,原本不起眼的背板也多了一分韻味。
背面還用上了穿透式散熱設(shè)計(jì),在金屬背板的右方進(jìn)一步加大積鏤空間,配合散熱器上第三組風(fēng)扇的風(fēng)流直接穿透散熱鰭片以及鏤空的PCB設(shè)計(jì),令顯卡溫度進(jìn)一步下降。
顯卡頂部是巨大的“耕升GAINWARD”Logo,不點(diǎn)亮?xí)r有著銀色的反光,在藍(lán)粉漸變雙色的映襯下格外顯眼。
點(diǎn)亮后即可看到RGB燈效,同時(shí)包裝盒內(nèi)還附送了ARGB的顯卡支架,跟顯卡配合使用能夠見到不一樣的RGB效果。如果你的其他硬件支持燈效同步,那整套平臺將還你一個(gè)酷炫的視覺盛宴。
供電接口使用的是在PCI-E5.0規(guī)范中引入的12VHPWR供電接口,理論上可以提供最高600W的持續(xù)供電,供電僅需一根12VHPWR供電線即可,如果使用的是ATX2.0標(biāo)準(zhǔn)的電源,也可使用贈送的2*8pin轉(zhuǎn)12VHPWR轉(zhuǎn)接。
顯卡的底部則還是一如既往的簡約,一大排鰭片出風(fēng)口貫穿始終,并且緊貼金屬背板,多重散熱加持,相信耕升RTX4070Ti星極幻姬OC在后續(xù)的測試中有不錯(cuò)的表現(xiàn)。
顯卡底部的PCIe金手指為標(biāo)準(zhǔn)的PCIe4.0x16速率,擁有更快的傳輸速度,有利于顯卡釋放更強(qiáng)的性能。
顯卡提供4個(gè)視頻輸出接口,包括三個(gè)DisplayPort1.4a和一個(gè)HDMI2.1接口,均可實(shí)現(xiàn)最高8K60Hz的視頻輸出,如果你是多屏黨,這款顯卡最大支持4屏輸出,絕對能夠滿足你的需求。
不得不說的是這款顯卡的厚度足足有64mm,也就是3槽的厚度,這對小體積的機(jī)箱會是不小的挑戰(zhàn),選購機(jī)箱時(shí)要注意長度跟厚度相匹配。
2耕升 GeForce RTX 4070 Ti 星極幻姬 OC 顯卡拆解
顯卡拆解:耕升 GeForce RTX 4070 Ti 星極幻姬 OC
耕升RTX4070Ti星極幻姬OC不僅有著吸睛的外觀設(shè)計(jì),內(nèi)部構(gòu)造也是極致豪華。拆解這款顯卡僅需卸下背板螺絲即可。
最讓人震驚的是短PCB設(shè)計(jì),比RTX3090Ti還要短不少。并且還是8層PCB設(shè)計(jì),既加強(qiáng)了散熱,也保證了電路系統(tǒng)的穩(wěn)定。
由于PCB正面的集成度較高,所以背部反而顯得較為簡潔一些,主要是一些供電的PWM控制芯片和濾波用的MLCC。
AD104-400-A1核心占據(jù)著PCB的C位,SMC4N工藝打造,295mm2的芯片面積內(nèi)塞下了7680個(gè)CUDA核心,這也是它能夠戰(zhàn)勝RTX3090Ti的資本。
核心四周是6顆GDDR6X顯存顆粒,來自美光科技,型號是2GU47D8BZC,單顆顯存容量為2GB,6顆顯存共組成12GB。不過顯存速率僅有21Gbps,相比大哥RTX4080略低。
耕升為這款顯卡配備了13相供電,其中11相為核心供電,位置安排在PCB的左側(cè),每相供電都配上固態(tài)電容、封閉電感,以及DrMos芯片。
剩下兩相為顯存供電,位置就在GDDR6X顯存旁邊,配置與核心供電保持一致。
DrMos芯片來自萬國半導(dǎo)體,封裝型號為BLN3,實(shí)際應(yīng)為AOS的AOZ5311NQI-03,持續(xù)輸出電流為55A。
PWM主控芯片是UPI的uP9512R,能夠同時(shí)管理核心供電及顯存供電,這個(gè)配置與絕大多數(shù)RTX4070Ti顯卡一致。
供電配置都堆料了,供電接口也進(jìn)行了換代升級,全新的12VHPWR接口單口就能夠提供600W供電能力,用來帶這張300W出頭的耕升RTX4070Ti星極幻姬OC可以說是綽綽有余了。
耕升RTX4070Ti星極幻姬OC為了壓制這顆滿血的AD104核心,用上了全新的“幻姬22”散熱器,獨(dú)特的金屬外殼配搭迷人色彩,冷艷而不失高貴。
從側(cè)面看,“幻姬22”散熱器相當(dāng)?shù)挠蟹至?,幾乎與RTX4080的散熱器同等厚度了,這也讓筆者對這款顯卡的散熱表現(xiàn)充滿好奇。
散熱器的一端是大面積的均熱板,耕升在均熱板上為顯存、電感、MOS管接觸的地方用上了高系數(shù)的導(dǎo)熱墊輔助散熱,就連AD104核心處也是厚厚的一層硅脂,基本上把能堆料的地方都拉滿了。
散熱器另一邊是大面積緊密的散熱鰭片,能夠更快的將顯卡內(nèi)部的熱量導(dǎo)出,讓顯卡保持“冷靜”,全力輸出。
厚重的散熱器內(nèi)還藏了8根6mm的復(fù)合式熱導(dǎo)管,貫穿整個(gè)散熱器,還用上了抗氧化能力極強(qiáng)的鍍鎳工藝,延長使用壽命。
“幻姬22”散熱器上還有三把散熱風(fēng)扇作為主動散熱,三把風(fēng)扇的直徑達(dá)到了92mm,散熱能力一定是足夠的。
風(fēng)扇扇葉用的是經(jīng)優(yōu)化的耕升專用“炫風(fēng)之刃”扇葉,改良后可以提升風(fēng)流量,并減低聲噪,有效加強(qiáng)散熱,內(nèi)外兼?zhèn)洹?
3測試平臺介紹&理論/游戲性能測試
測試平臺介紹
下面介紹一下這次的測試平臺,還是我們評測室的最強(qiáng)平臺,CPU使用的是目前的旗艦——Inteli9-13900K處理器,主板為華碩Z790HERO,搭配金士頓的64GBDDR5-6000高規(guī)格內(nèi)存,只有最強(qiáng)的硬件才能真正展示這張顯卡的性能。
CPU、內(nèi)存等硬件都是旗艦級了,那顯示器也要襯得上才行,此次測試我們用的是愛攻&保時(shí)捷聯(lián)名設(shè)計(jì)的AGONPD32M,miniLED背光、144Hz、高色域等一應(yīng)俱全。因此耕升RTX4070Ti星極幻姬OC才能在2K甚至4K分辨率下大放異彩。
測試前先用GPU-Z對顯卡的狀態(tài)與詳細(xì)信息進(jìn)行初步的了解,從圖中可以知道,耕升RTX4070Ti星極幻姬OC的基準(zhǔn)頻率為2310MHz,Boost頻率去到了2685MHz,比一般的RTX4070Ti的2610MHz還要高出75MHz,可以預(yù)見它的性能會有不錯(cuò)的表現(xiàn)。
除此之外,我們還可以看到這款顯卡的TGP設(shè)定最高去到330W,溫度墻上限定在了88℃,這顯然是給顯卡超頻預(yù)留了一定的空間。還有一點(diǎn)需要注意的是,在使用RTX40系顯卡前一定要確認(rèn)主板的ResizableBAR功能是否開啟,這樣顯卡才能夠最大限度的發(fā)揮出全部性能。
理論性能測試
國際慣例,先測試一下耕升RTX4070Ti星極幻姬OC的理論性能,從3DMark測試成績來看,耕升RTX4070Ti星極幻姬OC相比前代RTX3070Ti有50%的性能提升,如果是對比RTX3090Ti,性能表現(xiàn)則與之相近,基本上是五五開的水平。
不過耕升RTX4070Ti星極幻姬OC在部分場景下還是能夠領(lǐng)先RTX3090Ti,像在以DX12為代表的TimeSpy測試中,這款顯卡就跑出了22836分,這一成績比前代旗艦RTX3090Ti還要高出500分左右。
而在以DX11為代表的FireStrike中,耕升RTX4070Ti星極幻姬OC有著更出色的表現(xiàn),測試成績54948分,相比RTX3090Ti的52129分足足提升近3000分,可以預(yù)見的是這款顯卡在游戲方面應(yīng)該比RTX3090Ti要強(qiáng)一些。
算力方面,我們使用AIDA64GPGPU進(jìn)行測試,雖然耕升RTX4070Ti星極幻姬OC的顯存位寬不及前代顯卡,但得益于升級到了GDDR6X,以及用上了更新的AdaLovelace架構(gòu),讓這款顯卡在單精度和雙精度浮點(diǎn)運(yùn)算以及顯存速率上都當(dāng)仁不讓,絲毫不遜色于RTX3090Ti。如果是對比前代RTX3070Ti,那性能提升更是顛覆性,整體性能差距足足有1.7倍。
游戲性能測試
耕升RTX4070Ti星極幻姬OC的游戲性能才是玩家真正關(guān)心的,這次我們也選擇了10多款游戲在多個(gè)分辨率下進(jìn)行測試。
首先是1080P分辨率,參測的幾張顯卡都很輕松,不過耕升RTX4070Ti星極幻姬OC以更強(qiáng)的性能表現(xiàn)和更新的架構(gòu)革新,還是能夠領(lǐng)先RTX3070Ti46%以上。相比RTX3090Ti也有10%的性能領(lǐng)先,不少游戲能夠領(lǐng)先20FPS左右。
在1440p分辨率下,耕升RTX4070Ti星極幻姬OC顯卡整體游戲性能仍是比RTX3090Ti要強(qiáng)上不少的,約領(lǐng)先10%左右的性能,如果是跟RTX3070Ti相比,這個(gè)領(lǐng)先幅度將擴(kuò)大到52%之多。在我們實(shí)測中,有了耕升RTX4070Ti星極幻姬OC加持后,基本大部分的游戲都能運(yùn)行在120+FPS以上,那么我們配上目前主流的2K165Hz顯示器完全是沒有問題的。
4K分辨率下,耕升RTX4070Ti星極幻姬OC與RTX3090Ti互有勝負(fù),究其原因是RTX3090Ti有先天大顯存的優(yōu)勢,因此在游戲體驗(yàn)中會稍稍領(lǐng)先。不過耕升RTX4070Ti星極幻姬OC的性能還是比RTX3070Ti強(qiáng)不少,足足有127%左右的提升,另外這款顯卡還有DLSS3可用,所以實(shí)際游戲表現(xiàn)還是會比RTX3090Ti好不少。
4DLSS 3性能測試
DLSS 3性能測試
要說RTX40系顯卡在游戲方面最大的提升是什么,相信不少玩家都會說是DLSS3。全新的DLSS3技術(shù)可以大幅提升幀率,而且系統(tǒng)延遲大大降低,生成的畫面更是足以媲美甚至超越原始渲染的效果。老黃甚至在發(fā)布會上說用上DLSS3能夠?qū)崿F(xiàn)游戲性能的翻倍提升,下面我們就實(shí)測看看。
3 DM ark DLSS3 理論性能測試
還是老慣例,先測試一次理論性能,在3DMark的DLSS3測試中,耕升RTX4070Ti星極幻姬OC僅開啟DLSS2的情況下就已經(jīng)能夠?qū)崿F(xiàn)2K@144Hz,4K@60Hz的游戲體驗(yàn)了;如果開啟DLSS3后,2K下幀數(shù)能夠上升至160FPS,4K畫質(zhì)下已經(jīng)去到100+FPS。
8K畫質(zhì)其實(shí)我們也測試了,雖然DLSS3下能夠跑到54FPS,但離穩(wěn)定60FPS還有一段距離,想要用RTX4070Ti玩8K可能還需要游戲能有神優(yōu)化才能實(shí)現(xiàn)。不過這畢竟是一張定位2K高刷3A的游戲顯卡,這樣的理論性能表現(xiàn)筆者已經(jīng)相當(dāng)驚喜了。
《生死輪回》游戲?qū)崪y
上面我們說到DLSS3,現(xiàn)在已經(jīng)有不少游戲支持最新的DLSS3技術(shù),這里筆者也選擇了一款首發(fā)支持DLSS3的《生死輪回》進(jìn)行實(shí)測。在1080P下,開啟DLSS3的耕升RTX4070Ti星極幻姬OC領(lǐng)先RTX3090Ti足足有100FPS之多,2K分辨率下也能有60FPS以上的領(lǐng)先幅度。當(dāng)然最讓人驚喜的是,耕升RTX4070Ti星極幻姬OC的功耗全程僅有206W,足足比RTX3090Ti低180W,但卻實(shí)現(xiàn)了超越RTX3090Ti的性能,不可謂不強(qiáng)大。
在其他游戲中,耕升RTX4070Ti星極幻姬OC的表現(xiàn)也不錯(cuò),在開啟DLSS3后,多款游戲的幀數(shù)表現(xiàn)都大幅領(lǐng)先RTX3090Ti,基本都是1.5倍左右的性能提升,并且游戲全程功耗都在300W以下,相比RTX3090Ti動輒近400W的功耗來說,這樣的能耗比才是玩家所想看到的。用RTX3090Ti50%的功耗實(shí)現(xiàn)了RTX3090Ti150%的性能,售價(jià)還只有RTX3090Ti的一半,你還在等什么,這就是目前最具性價(jià)比的2K游戲顯卡!
1 080P 分辨率 DLSS 性能測試
1080P分辨率對于上代RTX3070Ti早已不是問題,對耕升RTX4070Ti星極幻姬OC更是不在話下,DLSS3的加持下,它的游戲性能已經(jīng)是RTX3070Ti的兩倍,即便是RTX3090Ti在場,耕升RTX4070Ti星極幻姬OC依舊有70%以上的游戲性能優(yōu)勢。我們實(shí)測在1080P分辨率下,使用這款顯卡搭配DLSS3,不少游戲都能做到200+FPS,這完全是電競級別在玩3A了屬于是。
2 K 分辨率 DLSS 性能測試
作為一張定位2K高刷3A游戲顯卡,耕升RTX4070Ti星極幻姬OC的表現(xiàn)果然不負(fù)眾望,在DLSS2下,這款顯卡已經(jīng)能夠跟RTX3090Ti平分秋色了,開啟DLSS3后,即使是前代旗艦RTX3090Ti也無法跟耕升RTX4070Ti星極幻姬OC相提并論,游戲性能領(lǐng)先足足有50%之多!并且從表中可以看到2K分辨率下,大部分游戲都在144+FPS以上,只要換上耕升RTX4070Ti星極幻姬OC,2K分辨率高刷暢玩3A不再是夢。
我們也使用耕升RTX4070Ti星極幻姬OC在DLSS2和DLSS3兩種模式下測試了多款游戲,從實(shí)測結(jié)果來看,DLSS3確實(shí)有點(diǎn)東西,不少游戲的幀數(shù)都有明顯提升,其中不乏一些游戲有翻倍的性能提升。像《毀滅全人類2》這款游戲,耕升RTX4070Ti星極幻姬OC在DLSS2下游戲幀數(shù)為108FPS,而開啟DLSS3后,游戲幀數(shù)達(dá)到了驚人的274FPS,這已經(jīng)不是老黃所說的翻倍,而是接近3倍的性能提升了!
4 K 分辨率 DLSS 性能測試
耕升RTX4070Ti星極幻姬OC在4K分辨率下開啟DLSS2后整體性能還是弱于RTX3090Ti,不過開啟DLSS3后,情況就有了逆轉(zhuǎn),實(shí)測大部分游戲在DLSS3加持下能夠跑到100+FPS,基本上與RTX3090Ti打得有來有回。不過想要用這款顯卡玩4K@144Hz高刷3A,可能需要降低部分特效才行。
總的來說,耕升RTX4070Ti星極幻姬OC在1080P和2K分辨率下已經(jīng)超越了30系顯卡中的旗艦RTX3090Ti,并且游戲幀數(shù)幾乎都在144FPS以上,完全符合它2K高刷3A游戲神卡的定位。而4K分辨率由于顯存比RTX3090Ti小,因此互有勝負(fù),不過好在老黃給這張卡加上了DLSS3這個(gè)黑科技,所以開啟DLSS3后,耕升RTX4070Ti星極幻姬OC的整體性能還是優(yōu)于RTX3090Ti。
5創(chuàng)作/專業(yè)生產(chǎn)力測試
創(chuàng)作生產(chǎn)力性能測試
理論與游戲上的性能提升讓筆者對耕升RTX4070Ti星極幻姬OC充滿期待,在創(chuàng)作生產(chǎn)力上是否也是如此?我們選擇PugetBench、PCMark10、ULProcyon等多款常見的測試軟件,來測試耕升RTX4070Ti星極幻姬OC在日常辦公、視頻內(nèi)容生產(chǎn)方面的表現(xiàn)。
首先看到的是PCMark10Extended測試,耕升RTX4070Ti星極幻姬OC在數(shù)位內(nèi)容創(chuàng)作與游戲兩個(gè)子項(xiàng)目上不僅大幅領(lǐng)先RTX3070Ti,甚至一度超越了RTX3090Ti,這與上面實(shí)測的游戲性能一致,下面我們對數(shù)位內(nèi)容創(chuàng)作進(jìn)行更詳細(xì)的測試。
在需要大顯存的ULProcyon與PugetBench測試中,RTX3090Ti憑借24GB的超大顯存稍稍領(lǐng)先于RTX4070Ti。不過兩者的性能差距不到5%,并且耕升RTX4070Ti星極幻姬OC還支持全新的AV1編碼,這項(xiàng)功能能夠大幅提升視頻的導(dǎo)出速度,這是30系顯卡所不具備的,因此越往后,耕升RTX4070Ti星極幻姬OC的優(yōu)勢只會越來越明顯。
專業(yè)生產(chǎn)力性能測試
不少用戶買顯卡也是為了能夠更好的從事專業(yè)性的工作,因此這次我們也選擇了Blender、V-Ray、OctaneBench等多款渲染、工業(yè)領(lǐng)域的軟件測試耕升RTX4070Ti星極幻姬OC的性能表現(xiàn)。
在N卡常用的Blender渲染軟件中,耕升RTX4070Ti星極幻姬OC相比RTX3070Ti有68%的性能提升,即便是30系的老大哥RTX3090Ti來了,這款顯卡也毫不遜色,依舊領(lǐng)先10%以上!可以說耕升RTX4070Ti星極幻姬OC已經(jīng)全方位的領(lǐng)先于前代卡皇。
在OC渲染器與SPEC測試中,成績也是如此,性能基本領(lǐng)先RTX3090Ti有10%左右。如果是RTX3070Ti就更不用說了,領(lǐng)先幅度能夠去到70%?,F(xiàn)在你想體驗(yàn)卡皇的性能僅需購買耕升RTX4070Ti星極幻姬OC即可,一半的價(jià)格帶你領(lǐng)略前代卡皇的魅力。
雙NVENC編碼器專項(xiàng)測試
RTX40系顯卡在游戲上帶來了DLSS3,在視頻創(chuàng)作上同樣帶來了黑科技,耕升RTX4070Ti星極幻姬OC內(nèi)置了雙編碼器NVENC,它支持時(shí)下熱門的AV1編碼,作為下一代主流的視頻編碼技術(shù)有著自己獨(dú)特的優(yōu)勢,更快的編碼速度和更高質(zhì)量的流媒體傳輸性能,讓越來越多的剪輯軟件和視頻網(wǎng)站青睞于它。
我們使用NVIDIA提供的8K片源與工程文件分別測試AV1格式和H.265格式下的編碼時(shí)間。實(shí)測同一段素材下,使用耕升RTX4070Ti星極幻姬OC進(jìn)行AV1編碼會比H.265編碼快不少;即使同樣使用H.265編碼,有雙編碼器的加持下,耕升RTX4070Ti星極幻姬OC有著無可比擬的優(yōu)勢,編碼效率比RTX3090Ti快60%以上。
導(dǎo)出速度快并不是AV1編碼的唯一優(yōu)勢,它的文件占用空間也比H.265要小,無論是4K分辨率還是8K分辨率,使用AV1編碼后,文件整體大小能夠降低25%以上。并且肉眼下幾乎感受不到AV1編碼與H.265編碼的畫質(zhì)區(qū)別,難怪越來越多的軟件和視頻網(wǎng)站開始支持AV1編碼,不久的將來,它將會是主流趨勢。
6
功耗與發(fā)熱
耕升RTX4070Ti星極幻姬OC雖然是一張定位300W的中端游戲顯卡,但耕升卻為其配備了一個(gè)比肩RTX4080的散熱器,不得不說這樣的散熱配置給RTX4070Ti用有些大材小用了。
在室溫25℃的情況下,使用Furmark單烤15分鐘后,耕升RTX4070Ti星極幻姬OC的GPU核心運(yùn)行在2650MHz左右,但此時(shí)核心溫度僅有68℃,顯存更是僅有58℃,這跟前代RTX3090Ti動輒70℃起跳相比,能耗比堪稱史詩級進(jìn)步。
耕升RTX4070Ti星極幻姬OC不僅僅是溫控做得不錯(cuò),功耗與噪音控制也相當(dāng)優(yōu)秀,烤機(jī)15分鐘僅有286W,比前代卡皇RTX3090Ti低了足足100W,但性能卻能夠做到持平甚至超越!并且烤機(jī)狀態(tài)下,風(fēng)扇轉(zhuǎn)速也不高,噪音也只有35dB,如果是放在機(jī)箱內(nèi),這個(gè)噪音水平幾乎是聽不到的。
為了更直觀的展示耕升RTX4070Ti星極幻姬OC的功耗表現(xiàn),我們利用HWINFO64軟件與FrameView軟件雙重記錄多款顯卡的功耗表現(xiàn)情況,從圖中可以看到耕升RTX4070Ti星極幻姬OC整體功耗控制相當(dāng)出色,在所有測試場景內(nèi)都沒有突破300W,部分項(xiàng)目的功耗甚至不到RTX3090Ti的一半,但性能卻已經(jīng)超越,這樣的表現(xiàn)難怪讓一眾游戲玩家高呼“真香“。
總的來說,老黃的AdaLovelace架構(gòu)和TSMC的4N工藝確實(shí)有點(diǎn)東西,耕升RTX4070Ti星極幻姬OC無論是理論測試還是生產(chǎn)力創(chuàng)作,甚至是游戲場景都妥妥的吊打前代顯卡,讓這代顯卡的每瓦性能實(shí)打?qū)嵉奶嵘搅艘粋€(gè)新高度,這是30系顯卡無論如何努力都無法企及的高度。
超頻潛力測試
換裝“幻姬22“散熱器的耕升RTX4070Ti星極幻姬OC在散熱效能上有不少的提升,這也給超頻提供了可能,因此筆者也測試了這款顯卡的超頻潛力。
我們使用的是耕升全新升級的GW-SOUL調(diào)控軟件,這款軟件不僅可以實(shí)時(shí)顯示顯卡頻率,還可以一鍵超頻,方便小白用戶操作。當(dāng)然風(fēng)扇調(diào)節(jié)、RGB調(diào)控等基礎(chǔ)功能也是應(yīng)有盡有,下載這款軟件幾乎可以滿足你對顯卡的所有設(shè)置了。
筆者經(jīng)過一系列的嘗試,最終將顯卡核心頻率提升了150MHz,顯存頻率提升了500MHz,在這樣的條件下運(yùn)行3DMarkTimeSpy項(xiàng)目,最終耕升RTX4070Ti星極幻姬OC的運(yùn)行頻率突破3000MHz,取得23921的高分,相比默頻狀態(tài)幾乎高出2000分,性能提升還是相當(dāng)可觀的。
評測總結(jié)
實(shí)際測完后不得不感嘆RTX4070Ti顯卡的性能確實(shí)強(qiáng),老黃的Ada架構(gòu)與DLSS3功不可沒,讓這代顯卡有著超乎預(yù)期的性能表現(xiàn)。同時(shí)換裝TSMC4N工藝后,顯卡的能耗比相比上代30系也有了全新的改變,超低的功耗更強(qiáng)的性能成為40系顯卡的標(biāo)配。毫無疑問,這代顯卡從里到外都是一次革新,處處皆驚喜。
再說說這次評測的主角——耕升GeForceRTX4070Ti星級幻姬OC,它的外觀設(shè)計(jì)幾乎是所有RTX4070Ti中最前衛(wèi)的,單是雙色漸變在辨識度上就超越了99%以上的顯卡。不得不說耕升在顯卡設(shè)計(jì)方面確實(shí)有一手,之前評測的炫光系列也是憑借獨(dú)特的RGB燈效俘獲玩家的芳心,現(xiàn)在在星極系列上用大膽跳脫的撞色設(shè)計(jì)讓顯卡依舊冷艷迷人。
然而耕升GeForceRTX4070Ti星級幻姬OC不單止在設(shè)計(jì)上有特色,在配置與性能上也是竭盡全力的給你最好的體驗(yàn)。得益于“幻姬22“散熱器的超強(qiáng)散熱能效與架構(gòu)工藝的更新,讓這款顯卡能夠以RTX3090Ti一半的功耗實(shí)現(xiàn)超越RTX3090Ti的性能!擁有這款顯卡你就能夠在2K畫質(zhì)下高刷暢玩3A,再加上這張顯卡的售價(jià)僅有RTX3090Ti的一半,可以說它的出現(xiàn),讓大眾玩家也能感受40系顯卡的強(qiáng)悍性能。
耕升GeForceRTX4070Ti星級幻姬OC現(xiàn)已上市,售價(jià)7099元,考慮到其更強(qiáng)的頻率設(shè)定與激進(jìn)的散熱配置,價(jià)格相比起步價(jià)6499元更高也是可以理解的。如果你最近想要更換一款性能強(qiáng)勁的顯卡,那不妨看看耕升GeForceRTX4070Ti星級幻姬OC,更低的售價(jià),超乎前代卡皇的性能相信一定能夠滿足你的需求。
7功耗&超頻&評測總結(jié)
技術(shù)講解:Ada Lovelace架構(gòu)解析
Turing、Ampere上兩代架構(gòu)核心均以人物來命名,前者是計(jì)算機(jī)科學(xué)之父——艾倫·麥席森·圖靈;后者則是“電學(xué)中的牛頓”——安德烈·瑪麗·安培,電流的國際單位安培就是以其姓氏命名。那AdaLovelace定非凡人,度娘一下果然,這是 人稱“數(shù)字女王”的阿達(dá)·洛芙萊斯,編寫了歷史上首款電腦程序,是被世界公認(rèn)的第一位計(jì)算機(jī)程序員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩人拜倫喔。
從Turing架構(gòu)開始,NVIDIA首次在顯卡中加入了加速光線追蹤的RTCore單元,以及面向AI推理的TensorCore單元,這革命性的創(chuàng)新使實(shí)時(shí)光線追蹤成為可能。而Ampere架構(gòu)則是全面的架構(gòu)改進(jìn),在加入新一代的二代RTCore和三代TensorCore基礎(chǔ)上,還有著更先進(jìn)的SM單元設(shè)計(jì),這樣顯卡工作效率那是翻倍的提升。而來到AdaLovelace架構(gòu),同時(shí)是以效率提升為大前提,自然是引入了最新的第三代RTCores與第四代TensorCores單元,同時(shí)加入眾多新穎的黑科技,從執(zhí)行效率來說AdaLovelace架構(gòu)是上代Ampere架構(gòu)的2倍以上,甚至光線追蹤能力更是達(dá)到了恐怖的4倍性能。
全新的SM流式多處理器
AdaLovelace架構(gòu)中最大的亮點(diǎn)之一:全新的SM流式多處理器,每個(gè)SM包含了128個(gè)CUDA核心、1個(gè)第三代的RTCores,4個(gè)第四代TensorCores(張量核心)、4個(gè)TextureUnits(紋理單元)、256KBRegisterFile(寄存器堆),以及128KBL1數(shù)據(jù)緩存/共享內(nèi)存子系統(tǒng),于是這一個(gè)全新的SM單元有著超過上一代2倍之的性能表現(xiàn)。
過去的Turing架構(gòu)INT32計(jì)算單元與FP32數(shù)量是一致的,而兩者相加才組成了64個(gè)CUDA核心。但是Ampere架構(gòu)開始,左側(cè)的計(jì)算單元實(shí)現(xiàn)了FP32+INT32的計(jì)算單元并發(fā)執(zhí)行,也就是說CUDA核心數(shù)量翻倍到了128個(gè)。
再來看看AdaLovelace架構(gòu)的SM,F(xiàn)P32/INT32的計(jì)算單元組合,同樣實(shí)現(xiàn)了每個(gè)SM內(nèi)含128個(gè)CUDA的設(shè)計(jì),看似提升不大,但是當(dāng)你了解到GeForceRTX4070Ti擁有60個(gè)SM,7680個(gè)CUDA核心,那你也就應(yīng)該明白它的著色器能力進(jìn)一步加強(qiáng),即使比起上一代的卡皇RTX3090Ti顯卡,那也是絲毫不虛的。
另外緩存方面AdaLovelace架構(gòu)也進(jìn)行了大規(guī)格的提升,首先每個(gè)SM單元中單獨(dú)配上了128KB的緩存,其次核心的二級緩存進(jìn)行進(jìn)行了重新的設(shè)計(jì),使得RTX4070Ti配備了48MB二級緩存,相比RTX3070Ti可以說是質(zhì)的飛躍。
8技術(shù)講解:Ada Lovelace架構(gòu)解析
技術(shù)講解:第三代 RT Cores 與 第四代 Tensor Cores
以為剛才的CUDA數(shù)量與超大L2緩存就已經(jīng)很猛了,實(shí)現(xiàn)上AdaLovelace架構(gòu)最大的提升還是在第三代RTCores與第四代TensorCores身上。
第三代RTCores
RTCores用于光線追蹤加速,第三代RTCores的有效光線追蹤計(jì)算能力達(dá)到191TFLOPS,是上一代產(chǎn)品2.8倍。
在Ampere架構(gòu)中,第二代RTCores支持邊界交叉測試(BoxIntersectiontesting)和三角形交叉測試(TriangleIntersectiontesting),用于加速BVH遍歷和執(zhí)行射線三角交叉測試計(jì)算,雖然光線追蹤處理能力已經(jīng)比初代的Turing架構(gòu)核心更高效,但是隨著環(huán)境和物體的幾何復(fù)雜性持續(xù)增加,傳統(tǒng)的處理方式很難再以更高效率、正確反應(yīng)出的現(xiàn)實(shí)世界中的光線,尤其是光的運(yùn)動準(zhǔn)確性。
所以在第三代RTCores增加了兩個(gè)重要硬件單元:OpacityMicromapEngine與DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine,主要是用于alpha通道的加速,可以將alpha測試幾何體的光線追蹤速度提高2倍。
在傳統(tǒng)光柵渲染中,開發(fā)人員使用一些Alpha通道的素材來實(shí)現(xiàn)更高效的畫面渲染,例如Alpha通道的葉子或火焰等復(fù)雜形狀的物體。但在光線追蹤時(shí)代,這傳統(tǒng)的做法會為光線追蹤帶為不少無效的計(jì)算,例如運(yùn)動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調(diào)用一次著色器來確定如何處理相交,這時(shí)就會做成嚴(yán)重的執(zhí)行成本與時(shí)間等待成本。
而OpacityMicromapEngine用于直接解析具有非不透明度光線交集的不透明度狀態(tài)
三角形。根據(jù)Alpha通道的不透明,透明與未知等三個(gè)不同的塊狀態(tài)進(jìn)行處理:透明則直接忽略繼續(xù)找下一個(gè),不透明塊則記錄并告之命中,而未知的則交給著色器來確定如何處理,這樣GPU很大部分都不需要進(jìn)行著色器的調(diào)試處理,能夠?qū)崿F(xiàn)更為高效的性能。
DisplacedMicro-MeshesEngine
如果說OpacityMicromapEngine加速的是面處理,那么DisplacedMicro-MeshesEngine就是幾何曲面細(xì)節(jié)的加速器。如上圖所示,在AdaLovelace架構(gòu)中,通過1個(gè)基底三角形+位移地圖,就可以創(chuàng)建出一個(gè)高度詳細(xì)的幾何網(wǎng)格,所需要資源占用比二代RTCores更低,效率也更高。
通過NVIDIA給出的創(chuàng)建14:1珊瑚蟹例子來說事,這里我們需要需要1.7萬個(gè)微網(wǎng)格、160萬個(gè)微三角形,在AdaLovelace架構(gòu)中BVH創(chuàng)建速度可加快7.6倍,存儲空間縮小8.1倍。DisplacedMicro-MeshesEngine起到了關(guān)鍵性的作用,其將一個(gè)幾何物體根據(jù)不同細(xì)節(jié)分成密度不一的微網(wǎng)絡(luò)處理,紅色密度超高,細(xì)節(jié)處理越為復(fù)雜。相應(yīng)的低密度微網(wǎng)絡(luò)區(qū)域則可以釋放更多的資源與存儲空間,這樣DisplacedMicro-MeshesEngine就可以幫助BVH加速過程,減少構(gòu)建時(shí)間和存儲成本。
同時(shí)AdaLovelace架構(gòu)SM中新增了著色器執(zhí)行重排序(ShaderExecutionReordering,SER),這是由于光線追蹤不再只有強(qiáng)光或者陰影渲染處理,未來將會更多的是在光線的運(yùn)動性,這樣光線就會變得越來越復(fù)雜,想要第三代RTCores與第四代TensorCores有著更高的執(zhí)行效率,那就得為他們來安排一位管家。而著色器執(zhí)行重排序(SER)就是為了能夠即時(shí)重新安排著色器負(fù)載來提高執(zhí)行效率,為光線追蹤提供2倍的加速,也能更好地利用GPU資源。不過目前仍未有實(shí)例,想實(shí)現(xiàn)這個(gè)功能,還得游戲與開發(fā)工具的支持才行。
第四代TensorCores
TensorCores是專門為執(zhí)行張量/矩陣運(yùn)算而設(shè)計(jì)的專用執(zhí)行單元,這些運(yùn)算是深度學(xué)習(xí)中使用的核心計(jì)算功能。第四代TensorCores新增FP8引擎,具有高達(dá)1.32petaflops的張量處理性能,超過上一代的5倍。
9技術(shù)講解:第三代RT Cores與第四代Tensor Cores
技術(shù)講解:DLSS 3
或者說第四代TensorCores太硬核你不會知道是啥?提升意義在哪?但是TensorCores最經(jīng)典的應(yīng)用DLSS你肯定會知道,這一次AdaLovelace架構(gòu)支持NVIDIA最新的DLSS3技術(shù)。
https://images.nvidia.cn/cn/youtube-replicates/r-hu006p23I.mp4
之前我們也聊過DLSS技術(shù),其設(shè)計(jì)之初是為了彌補(bǔ)光線追蹤技術(shù)后的性能損失,具體的表現(xiàn)為開啟光線追蹤技術(shù)后游戲幀數(shù)大幅度的下降,甚至很難保證游戲流暢的運(yùn)行。于是DLSS使用低分辨率內(nèi)容作為輸入并運(yùn)用AI技術(shù)輸出高分辨率幀,從而提升光線追蹤的性能。
在DLSS3中包含了三項(xiàng)技術(shù):DLSS幀生成、DLSS超分辨率(也稱為DLSS2)和NVIDIAReflex。你可以理解為DLSS3是在DLSS2的基礎(chǔ)上,新增了DLSS幀生成技術(shù);而后兩技術(shù)中,DLSS超分辨率只需要GeForceRTX顯卡都能使用上,NVIDIAReflex則是GeForce900系列以后的顯卡都用使用上。
想實(shí)現(xiàn)DLSS幀生成可不簡單,這需要配合上AdaLovelace架構(gòu)的GeForceRTX40系列顯卡才行。DLSS幀生成技術(shù)原理是:利用AI技術(shù)生成更多幀,以此提升性能。DLSS會借助GeForceRTX40系列GPU所搭載的全新光流加速器分析連續(xù)幀和運(yùn)動數(shù)據(jù),進(jìn)而創(chuàng)建其他高質(zhì)量幀,同時(shí)不會影響圖像質(zhì)量和響應(yīng)速度。
從Ampere架構(gòu)開始,NVIDIA顯卡就已經(jīng)支持了光流加速器,而AdaLovelace架構(gòu)的光流加速器升級到了第二代,其提供了高達(dá)300TeraOPS(TOPS),比安培架構(gòu)的初代光流加速器(OpticalFlowAcceleration,OFA)快2倍以上。為了實(shí)現(xiàn)DLSS幀生成,OFA扮演了重要的角色,其配合上新的運(yùn)行矢量分析算法在DLSS3技術(shù)框架內(nèi)實(shí)現(xiàn)精確和高性能的幀生成能力。
另外,由于DLSS幀生成是在GPU上作為后處理執(zhí)行的,那么即使在游戲受到CPU性能限制的時(shí)候,我們同樣能夠從中獲得更好的游戲性能提升。尤其是那種物理計(jì)算密集型的游戲或大型場景游戲,DLSS2均可以讓GeForceRTX40系列顯卡以高達(dá)兩倍于CPU可計(jì)算的性能來渲染游戲。
最后由于DLSS3是建立在DLSS2基礎(chǔ)之上的,游戲開發(fā)者可以在已支持DLSS2或NVIDIAStreamline的現(xiàn)有游戲中快速集成該功能,所以DLSS3已在游戲生態(tài)得到廣泛應(yīng)用,目前已有超過35款游戲和應(yīng)用即將支持該技術(shù)。
閱讀小亮點(diǎn):NVIDIAReflex
NVIDIAReflex也是DLSS3其中的一環(huán),它可以使GPU和CPU同步,確保最佳響應(yīng)速度和低系統(tǒng)延遲。
想要實(shí)現(xiàn)端對端的最低延遲,你需要確保游戲、顯示器以及鼠標(biāo)三者都同時(shí)支持并開啟了Reflex技術(shù)。
當(dāng)GeForceRTX40系列顯卡和NVIDIAReflex搭配上后,直接達(dá)到1440p分辨率360FPS的體驗(yàn),這著實(shí)是性能有點(diǎn)強(qiáng)勁了。
在GTC2022大會時(shí)已經(jīng)透露將會還有4款1440p分辨率的新型G-SYNC電競顯示器將要發(fā)布,包括采用mini-LED技術(shù)的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款顯示器刷新率均為300Hz,而最猛的是ASUSROGSwift360HzPG27AQN,刷新率直接來到了360Hz。
但唯一一個(gè)問題就在于,部分顯示器廠商認(rèn)為此類產(chǎn)品受眾人群較少,會降低此類顯示器的產(chǎn)能,甚至產(chǎn)品就已經(jīng)被內(nèi)部PASS掉,所以1440p360Hz是很美好,但現(xiàn)實(shí)也是相當(dāng)?shù)墓歉小?
10技術(shù)講解:DLSS 3
技術(shù)講解:雙NVIDIA編碼器(NVENC)
GeForceRTX40系列顯卡還有一個(gè)全新的升級,那就是雙編碼器NVENC。第八代的NVENC雙編碼器不僅支持H.264與H.265,還支持開放式視頻編碼格式AV1。
而由于AV1是一種免版稅的視頻編碼格式,上游軟件廠商與下游戲的配套端都在大力推廣此編碼格式,我們也會看到越來越多的硬件與軟件支持AV1格式,包括剪映專業(yè)版、DaVinciResolve、以及AdobePremierePro較為流行的Voukoder插件均支持,且均可通過編碼預(yù)設(shè)使用雙編碼器,這樣我們等待視頻導(dǎo)出的時(shí)間縮短將近一半。
不單是視頻制作軟件,AV1格式也將會是主播、游戲直播UP主們的新寵兒,在保證畫面最高質(zhì)量的情況下,AV1編碼器可將效率提高40%,同時(shí)顯卡的占用也更低。包括OBSStudio一代軟件中也會增加AV1格式的支持。另外我們還能通過GeForceExperience和OBSStudio錄制高達(dá)8K60的內(nèi)容,這樣我們做游戲錄制也會變得更為輕松。
包括我們之后測試時(shí)使用的游戲內(nèi)錄視頻都是支持AV1格式,同時(shí)雙編碼器NVENC在資源占用和適配上做得越來越好。
標(biāo)簽:
參與評論