1引言&規(guī)格對比&外觀賞析

(資料圖)

引言

老黃在2022秋季GTC大會上發(fā)布了萬眾矚目的RTX4090與RTX4080顯卡，全新的AdaLovelace架構(gòu)和TSMC4N工藝的升級讓這兩張顯卡在性能層面有了質(zhì)的飛躍，價(jià)格方面也是水漲船高，相信不少玩家也跟筆者一樣，期待NV趕緊推出適合玩家的中端顯卡?，F(xiàn)在GeForceRTX4070Ti它來了！

我們也在第一時(shí)間體驗(yàn)到了耕升的RTX4070Ti顯卡，在上手了使用了耕升GeForceRTX4070Ti星極幻姬OC一段時(shí)間后，筆者發(fā)現(xiàn)這張RTX4070Ti不僅顏值在線，性能也是超乎預(yù)期的強(qiáng)，經(jīng)過重新定價(jià)的RTX4070Ti確確實(shí)實(shí)可以稱得上是目前最具性價(jià)比的RTX40系顯卡，下面給大家講講這張顯卡究竟強(qiáng)在哪里。

*下文“耕升 GeForceRTX4070Ti星極幻姬OC”簡稱為“耕升RTX4070Ti星極幻姬OC”

規(guī)格對比

規(guī)格對比

開始測試前，先讓我們了解一下耕升RTX4070Ti星極幻姬OC，其采用的是AD104-400核心，TSMC4N工藝制造，芯片面積為295平方毫米，別看它面積比上代的GA104-400核心小，但它的晶體管密度達(dá)到了358億，晶體管數(shù)量相比較于上一代產(chǎn)品提升非常明顯，近乎翻倍，而這一代的核心還進(jìn)一步提升了頻率，因此能帶來更好的性能表現(xiàn)。

其他參數(shù)方面，耕升RTX4070Ti星極幻姬OC上的AD104核心標(biāo)配7680個(gè)CUDA，60個(gè)第三代RTCores，240個(gè)第四代TensorCores，并且用上了12GB的GDDR6X顯存，相比上代的提升還是很明顯的，畢竟大顯存配合性能上的提升更可以為游戲以及創(chuàng)作者帶來更好的使用體驗(yàn)。

目前耕升RTX4070Ti星極幻姬OC顯卡上配備的這顆AD104-400核心可以算是完整的AD104核心了。完整的AD104核心應(yīng)該包括5個(gè)GPC（圖形處理集群）、30個(gè)TPC（紋理處理集群）、60個(gè)SM（流式多處理器）以及一個(gè)帶有6個(gè)32Bit顯存控制器的192Bit顯存帶寬。

不過以老黃精準(zhǔn)的刀法來看，RTX4070Ti之下應(yīng)該還有一張RTX4070，筆者猜測，RTX4070顯卡應(yīng)該還會延用AD104核心，不過會在RTX4070Ti的基礎(chǔ)上進(jìn)行閹割，衍生出AD104-300核心，性能會稍遜一籌，不過價(jià)格也會有一定優(yōu)勢。

外觀賞析： 耕升 GeForce RTX 4070 Ti 星極幻姬 OC

耕升RTX4070Ti星極幻姬OC的外包裝還是相當(dāng)有特點(diǎn)的，正面滿滿當(dāng)當(dāng)?shù)馁惒┡罂孙L(fēng)。在包裝的右下角標(biāo)明了自己的身份GeForceRTX4070Ti，而在左下角是型號星極皓月OC12GBGDDR6X。

包裝盒的背面就顯得有些樸素了，主要介紹了耕升的品牌理念與星極系列顯卡的獨(dú)特設(shè)計(jì)。

耕升在包裝盒的正面還特地標(biāo)注了耕升RTX4070Ti星極幻姬OC支持三年質(zhì)保以及個(gè)人送保，玩家可以放心購買。

拆看包裝就能看到耕升RTX4070Ti星極幻姬OC的真容了，這款顯卡的設(shè)計(jì)相當(dāng)大膽，正面是冰川藍(lán)與少女粉的漸變組合，極致的色彩碰撞，讓顯卡冷艷而又不失高貴。把它與其他顯卡放在一起，它絕對是最迷人的存在。

正面的三把散熱風(fēng)扇格外引人注目，每把風(fēng)扇都達(dá)到了92mm的直徑，配合第二代耕升“炫風(fēng)之刃”造形扇葉，特殊分葉型設(shè)計(jì)讓風(fēng)扇在相同的轉(zhuǎn)速底下比傳統(tǒng)扇葉擁有更大的風(fēng)流量，進(jìn)一步舒緩顯卡溫度，加強(qiáng)核心動態(tài)頻率的提升幅度。

放大看細(xì)節(jié)，中間的散熱風(fēng)扇被銀色風(fēng)扇框所包圍，造型酷似一只眼睛，四周的鏤空其實(shí)是由耕升的“G”Logo所組成，出色的設(shè)計(jì)中也藏有不少細(xì)節(jié)。

耕升RTX4070Ti星極幻姬OC的背板由金屬材質(zhì)打造，可以給PCB提供充足的保護(hù)。正面的漸變色一直延申至背部，原本不起眼的背板也多了一分韻味。

背面還用上了穿透式散熱設(shè)計(jì)，在金屬背板的右方進(jìn)一步加大積鏤空間，配合散熱器上第三組風(fēng)扇的風(fēng)流直接穿透散熱鰭片以及鏤空的PCB設(shè)計(jì)，令顯卡溫度進(jìn)一步下降。

顯卡頂部是巨大的“耕升GAINWARD”Logo，不點(diǎn)亮?xí)r有著銀色的反光，在藍(lán)粉漸變雙色的映襯下格外顯眼。

點(diǎn)亮后即可看到RGB燈效，同時(shí)包裝盒內(nèi)還附送了ARGB的顯卡支架，跟顯卡配合使用能夠見到不一樣的RGB效果。如果你的其他硬件支持燈效同步，那整套平臺將還你一個(gè)酷炫的視覺盛宴。

供電接口使用的是在PCI-E5.0規(guī)范中引入的12VHPWR供電接口，理論上可以提供最高600W的持續(xù)供電，供電僅需一根12VHPWR供電線即可，如果使用的是ATX2.0標(biāo)準(zhǔn)的電源，也可使用贈送的2*8pin轉(zhuǎn)12VHPWR轉(zhuǎn)接。

顯卡的底部則還是一如既往的簡約，一大排鰭片出風(fēng)口貫穿始終，并且緊貼金屬背板，多重散熱加持，相信耕升RTX4070Ti星極幻姬OC在后續(xù)的測試中有不錯(cuò)的表現(xiàn)。

顯卡底部的PCIe金手指為標(biāo)準(zhǔn)的PCIe4.0x16速率，擁有更快的傳輸速度，有利于顯卡釋放更強(qiáng)的性能。

顯卡提供4個(gè)視頻輸出接口，包括三個(gè)DisplayPort1.4a和一個(gè)HDMI2.1接口，均可實(shí)現(xiàn)最高8K60Hz的視頻輸出，如果你是多屏黨，這款顯卡最大支持4屏輸出，絕對能夠滿足你的需求。

不得不說的是這款顯卡的厚度足足有64mm，也就是3槽的厚度，這對小體積的機(jī)箱會是不小的挑戰(zhàn)，選購機(jī)箱時(shí)要注意長度跟厚度相匹配。

2耕升 GeForce RTX 4070 Ti 星極幻姬 OC 顯卡拆解

顯卡拆解：耕升 GeForce RTX 4070 Ti 星極幻姬 OC

耕升RTX4070Ti星極幻姬OC不僅有著吸睛的外觀設(shè)計(jì)，內(nèi)部構(gòu)造也是極致豪華。拆解這款顯卡僅需卸下背板螺絲即可。

最讓人震驚的是短PCB設(shè)計(jì)，比RTX3090Ti還要短不少。并且還是8層PCB設(shè)計(jì)，既加強(qiáng)了散熱，也保證了電路系統(tǒng)的穩(wěn)定。

由于PCB正面的集成度較高，所以背部反而顯得較為簡潔一些，主要是一些供電的PWM控制芯片和濾波用的MLCC。

AD104-400-A1核心占據(jù)著PCB的C位，SMC4N工藝打造，295mm2的芯片面積內(nèi)塞下了7680個(gè)CUDA核心，這也是它能夠戰(zhàn)勝RTX3090Ti的資本。

核心四周是6顆GDDR6X顯存顆粒，來自美光科技，型號是2GU47D8BZC，單顆顯存容量為2GB，6顆顯存共組成12GB。不過顯存速率僅有21Gbps，相比大哥RTX4080略低。

耕升為這款顯卡配備了13相供電，其中11相為核心供電，位置安排在PCB的左側(cè)，每相供電都配上固態(tài)電容、封閉電感，以及DrMos芯片。

剩下兩相為顯存供電，位置就在GDDR6X顯存旁邊，配置與核心供電保持一致。

DrMos芯片來自萬國半導(dǎo)體，封裝型號為BLN3，實(shí)際應(yīng)為AOS的AOZ5311NQI-03，持續(xù)輸出電流為55A。

PWM主控芯片是UPI的uP9512R，能夠同時(shí)管理核心供電及顯存供電，這個(gè)配置與絕大多數(shù)RTX4070Ti顯卡一致。

供電配置都堆料了，供電接口也進(jìn)行了換代升級，全新的12VHPWR接口單口就能夠提供600W供電能力，用來帶這張300W出頭的耕升RTX4070Ti星極幻姬OC可以說是綽綽有余了。

耕升RTX4070Ti星極幻姬OC為了壓制這顆滿血的AD104核心，用上了全新的“幻姬22”散熱器，獨(dú)特的金屬外殼配搭迷人色彩，冷艷而不失高貴。

從側(cè)面看，“幻姬22”散熱器相當(dāng)?shù)挠蟹至?，幾乎與RTX4080的散熱器同等厚度了，這也讓筆者對這款顯卡的散熱表現(xiàn)充滿好奇。

散熱器的一端是大面積的均熱板，耕升在均熱板上為顯存、電感、MOS管接觸的地方用上了高系數(shù)的導(dǎo)熱墊輔助散熱，就連AD104核心處也是厚厚的一層硅脂，基本上把能堆料的地方都拉滿了。

散熱器另一邊是大面積緊密的散熱鰭片，能夠更快的將顯卡內(nèi)部的熱量導(dǎo)出，讓顯卡保持“冷靜”，全力輸出。

厚重的散熱器內(nèi)還藏了8根6mm的復(fù)合式熱導(dǎo)管，貫穿整個(gè)散熱器，還用上了抗氧化能力極強(qiáng)的鍍鎳工藝，延長使用壽命。

“幻姬22”散熱器上還有三把散熱風(fēng)扇作為主動散熱，三把風(fēng)扇的直徑達(dá)到了92mm，散熱能力一定是足夠的。

風(fēng)扇扇葉用的是經(jīng)優(yōu)化的耕升專用“炫風(fēng)之刃”扇葉，改良后可以提升風(fēng)流量，并減低聲噪，有效加強(qiáng)散熱，內(nèi)外兼?zhèn)洹?

3測試平臺介紹&理論/游戲性能測試

測試平臺介紹

下面介紹一下這次的測試平臺，還是我們評測室的最強(qiáng)平臺，CPU使用的是目前的旗艦——Inteli9-13900K處理器，主板為華碩Z790HERO，搭配金士頓的64GBDDR5-6000高規(guī)格內(nèi)存，只有最強(qiáng)的硬件才能真正展示這張顯卡的性能。

CPU、內(nèi)存等硬件都是旗艦級了，那顯示器也要襯得上才行，此次測試我們用的是愛攻&保時(shí)捷聯(lián)名設(shè)計(jì)的AGONPD32M，miniLED背光、144Hz、高色域等一應(yīng)俱全。因此耕升RTX4070Ti星極幻姬OC才能在2K甚至4K分辨率下大放異彩。

測試前先用GPU-Z對顯卡的狀態(tài)與詳細(xì)信息進(jìn)行初步的了解，從圖中可以知道，耕升RTX4070Ti星極幻姬OC的基準(zhǔn)頻率為2310MHz，Boost頻率去到了2685MHz，比一般的RTX4070Ti的2610MHz還要高出75MHz，可以預(yù)見它的性能會有不錯(cuò)的表現(xiàn)。

除此之外，我們還可以看到這款顯卡的TGP設(shè)定最高去到330W，溫度墻上限定在了88℃，這顯然是給顯卡超頻預(yù)留了一定的空間。還有一點(diǎn)需要注意的是，在使用RTX40系顯卡前一定要確認(rèn)主板的ResizableBAR功能是否開啟，這樣顯卡才能夠最大限度的發(fā)揮出全部性能。

理論性能測試

國際慣例，先測試一下耕升RTX4070Ti星極幻姬OC的理論性能，從3DMark測試成績來看，耕升RTX4070Ti星極幻姬OC相比前代RTX3070Ti有50%的性能提升，如果是對比RTX3090Ti，性能表現(xiàn)則與之相近，基本上是五五開的水平。

不過耕升RTX4070Ti星極幻姬OC在部分場景下還是能夠領(lǐng)先RTX3090Ti，像在以DX12為代表的TimeSpy測試中，這款顯卡就跑出了22836分，這一成績比前代旗艦RTX3090Ti還要高出500分左右。

而在以DX11為代表的FireStrike中，耕升RTX4070Ti星極幻姬OC有著更出色的表現(xiàn)，測試成績54948分，相比RTX3090Ti的52129分足足提升近3000分，可以預(yù)見的是這款顯卡在游戲方面應(yīng)該比RTX3090Ti要強(qiáng)一些。

算力方面，我們使用AIDA64GPGPU進(jìn)行測試，雖然耕升RTX4070Ti星極幻姬OC的顯存位寬不及前代顯卡，但得益于升級到了GDDR6X，以及用上了更新的AdaLovelace架構(gòu)，讓這款顯卡在單精度和雙精度浮點(diǎn)運(yùn)算以及顯存速率上都當(dāng)仁不讓，絲毫不遜色于RTX3090Ti。如果是對比前代RTX3070Ti，那性能提升更是顛覆性，整體性能差距足足有1.7倍。

游戲性能測試

耕升RTX4070Ti星極幻姬OC的游戲性能才是玩家真正關(guān)心的，這次我們也選擇了10多款游戲在多個(gè)分辨率下進(jìn)行測試。

首先是1080P分辨率，參測的幾張顯卡都很輕松，不過耕升RTX4070Ti星極幻姬OC以更強(qiáng)的性能表現(xiàn)和更新的架構(gòu)革新，還是能夠領(lǐng)先RTX3070Ti46%以上。相比RTX3090Ti也有10%的性能領(lǐng)先，不少游戲能夠領(lǐng)先20FPS左右。

在1440p分辨率下，耕升RTX4070Ti星極幻姬OC顯卡整體游戲性能仍是比RTX3090Ti要強(qiáng)上不少的，約領(lǐng)先10%左右的性能，如果是跟RTX3070Ti相比，這個(gè)領(lǐng)先幅度將擴(kuò)大到52%之多。在我們實(shí)測中，有了耕升RTX4070Ti星極幻姬OC加持后，基本大部分的游戲都能運(yùn)行在120+FPS以上，那么我們配上目前主流的2K165Hz顯示器完全是沒有問題的。

4K分辨率下，耕升RTX4070Ti星極幻姬OC與RTX3090Ti互有勝負(fù)，究其原因是RTX3090Ti有先天大顯存的優(yōu)勢，因此在游戲體驗(yàn)中會稍稍領(lǐng)先。不過耕升RTX4070Ti星極幻姬OC的性能還是比RTX3070Ti強(qiáng)不少，足足有127%左右的提升，另外這款顯卡還有DLSS3可用，所以實(shí)際游戲表現(xiàn)還是會比RTX3090Ti好不少。

4DLSS 3性能測試

DLSS 3性能測試

要說RTX40系顯卡在游戲方面最大的提升是什么，相信不少玩家都會說是DLSS3。全新的DLSS3技術(shù)可以大幅提升幀率，而且系統(tǒng)延遲大大降低，生成的畫面更是足以媲美甚至超越原始渲染的效果。老黃甚至在發(fā)布會上說用上DLSS3能夠?qū)崿F(xiàn)游戲性能的翻倍提升，下面我們就實(shí)測看看。

3 DM ark DLSS3 理論性能測試

還是老慣例，先測試一次理論性能，在3DMark的DLSS3測試中，耕升RTX4070Ti星極幻姬OC僅開啟DLSS2的情況下就已經(jīng)能夠?qū)崿F(xiàn)2K@144Hz，4K@60Hz的游戲體驗(yàn)了；如果開啟DLSS3后，2K下幀數(shù)能夠上升至160FPS，4K畫質(zhì)下已經(jīng)去到100+FPS。

8K畫質(zhì)其實(shí)我們也測試了，雖然DLSS3下能夠跑到54FPS，但離穩(wěn)定60FPS還有一段距離，想要用RTX4070Ti玩8K可能還需要游戲能有神優(yōu)化才能實(shí)現(xiàn)。不過這畢竟是一張定位2K高刷3A的游戲顯卡，這樣的理論性能表現(xiàn)筆者已經(jīng)相當(dāng)驚喜了。

《生死輪回》游戲?qū)崪y

上面我們說到DLSS3，現(xiàn)在已經(jīng)有不少游戲支持最新的DLSS3技術(shù)，這里筆者也選擇了一款首發(fā)支持DLSS3的《生死輪回》進(jìn)行實(shí)測。在1080P下，開啟DLSS3的耕升RTX4070Ti星極幻姬OC領(lǐng)先RTX3090Ti足足有100FPS之多，2K分辨率下也能有60FPS以上的領(lǐng)先幅度。當(dāng)然最讓人驚喜的是，耕升RTX4070Ti星極幻姬OC的功耗全程僅有206W，足足比RTX3090Ti低180W，但卻實(shí)現(xiàn)了超越RTX3090Ti的性能，不可謂不強(qiáng)大。

在其他游戲中，耕升RTX4070Ti星極幻姬OC的表現(xiàn)也不錯(cuò)，在開啟DLSS3后，多款游戲的幀數(shù)表現(xiàn)都大幅領(lǐng)先RTX3090Ti，基本都是1.5倍左右的性能提升，并且游戲全程功耗都在300W以下，相比RTX3090Ti動輒近400W的功耗來說，這樣的能耗比才是玩家所想看到的。用RTX3090Ti50%的功耗實(shí)現(xiàn)了RTX3090Ti150%的性能，售價(jià)還只有RTX3090Ti的一半，你還在等什么，這就是目前最具性價(jià)比的2K游戲顯卡！

1 080P 分辨率 DLSS 性能測試

1080P分辨率對于上代RTX3070Ti早已不是問題，對耕升RTX4070Ti星極幻姬OC更是不在話下，DLSS3的加持下，它的游戲性能已經(jīng)是RTX3070Ti的兩倍，即便是RTX3090Ti在場，耕升RTX4070Ti星極幻姬OC依舊有70%以上的游戲性能優(yōu)勢。我們實(shí)測在1080P分辨率下，使用這款顯卡搭配DLSS3，不少游戲都能做到200+FPS，這完全是電競級別在玩3A了屬于是。

2 K 分辨率 DLSS 性能測試

作為一張定位2K高刷3A游戲顯卡，耕升RTX4070Ti星極幻姬OC的表現(xiàn)果然不負(fù)眾望，在DLSS2下，這款顯卡已經(jīng)能夠跟RTX3090Ti平分秋色了，開啟DLSS3后，即使是前代旗艦RTX3090Ti也無法跟耕升RTX4070Ti星極幻姬OC相提并論，游戲性能領(lǐng)先足足有50%之多！并且從表中可以看到2K分辨率下，大部分游戲都在144+FPS以上，只要換上耕升RTX4070Ti星極幻姬OC，2K分辨率高刷暢玩3A不再是夢。

我們也使用耕升RTX4070Ti星極幻姬OC在DLSS2和DLSS3兩種模式下測試了多款游戲，從實(shí)測結(jié)果來看，DLSS3確實(shí)有點(diǎn)東西，不少游戲的幀數(shù)都有明顯提升，其中不乏一些游戲有翻倍的性能提升。像《毀滅全人類2》這款游戲，耕升RTX4070Ti星極幻姬OC在DLSS2下游戲幀數(shù)為108FPS，而開啟DLSS3后，游戲幀數(shù)達(dá)到了驚人的274FPS，這已經(jīng)不是老黃所說的翻倍，而是接近3倍的性能提升了！

4 K 分辨率 DLSS 性能測試

耕升RTX4070Ti星極幻姬OC在4K分辨率下開啟DLSS2后整體性能還是弱于RTX3090Ti，不過開啟DLSS3后，情況就有了逆轉(zhuǎn)，實(shí)測大部分游戲在DLSS3加持下能夠跑到100+FPS，基本上與RTX3090Ti打得有來有回。不過想要用這款顯卡玩4K@144Hz高刷3A，可能需要降低部分特效才行。

總的來說，耕升RTX4070Ti星極幻姬OC在1080P和2K分辨率下已經(jīng)超越了30系顯卡中的旗艦RTX3090Ti，并且游戲幀數(shù)幾乎都在144FPS以上，完全符合它2K高刷3A游戲神卡的定位。而4K分辨率由于顯存比RTX3090Ti小，因此互有勝負(fù)，不過好在老黃給這張卡加上了DLSS3這個(gè)黑科技，所以開啟DLSS3后，耕升RTX4070Ti星極幻姬OC的整體性能還是優(yōu)于RTX3090Ti。

5創(chuàng)作/專業(yè)生產(chǎn)力測試

創(chuàng)作生產(chǎn)力性能測試

理論與游戲上的性能提升讓筆者對耕升RTX4070Ti星極幻姬OC充滿期待，在創(chuàng)作生產(chǎn)力上是否也是如此？我們選擇PugetBench、PCMark10、ULProcyon等多款常見的測試軟件，來測試耕升RTX4070Ti星極幻姬OC在日常辦公、視頻內(nèi)容生產(chǎn)方面的表現(xiàn)。

首先看到的是PCMark10Extended測試，耕升RTX4070Ti星極幻姬OC在數(shù)位內(nèi)容創(chuàng)作與游戲兩個(gè)子項(xiàng)目上不僅大幅領(lǐng)先RTX3070Ti，甚至一度超越了RTX3090Ti，這與上面實(shí)測的游戲性能一致，下面我們對數(shù)位內(nèi)容創(chuàng)作進(jìn)行更詳細(xì)的測試。

在需要大顯存的ULProcyon與PugetBench測試中，RTX3090Ti憑借24GB的超大顯存稍稍領(lǐng)先于RTX4070Ti。不過兩者的性能差距不到5%，并且耕升RTX4070Ti星極幻姬OC還支持全新的AV1編碼，這項(xiàng)功能能夠大幅提升視頻的導(dǎo)出速度，這是30系顯卡所不具備的，因此越往后，耕升RTX4070Ti星極幻姬OC的優(yōu)勢只會越來越明顯。

專業(yè)生產(chǎn)力性能測試

不少用戶買顯卡也是為了能夠更好的從事專業(yè)性的工作，因此這次我們也選擇了Blender、V-Ray、OctaneBench等多款渲染、工業(yè)領(lǐng)域的軟件測試耕升RTX4070Ti星極幻姬OC的性能表現(xiàn)。

在N卡常用的Blender渲染軟件中，耕升RTX4070Ti星極幻姬OC相比RTX3070Ti有68%的性能提升，即便是30系的老大哥RTX3090Ti來了，這款顯卡也毫不遜色，依舊領(lǐng)先10%以上！可以說耕升RTX4070Ti星極幻姬OC已經(jīng)全方位的領(lǐng)先于前代卡皇。

在OC渲染器與SPEC測試中，成績也是如此，性能基本領(lǐng)先RTX3090Ti有10%左右。如果是RTX3070Ti就更不用說了，領(lǐng)先幅度能夠去到70%?，F(xiàn)在你想體驗(yàn)卡皇的性能僅需購買耕升RTX4070Ti星極幻姬OC即可，一半的價(jià)格帶你領(lǐng)略前代卡皇的魅力。

雙NVENC編碼器專項(xiàng)測試

RTX40系顯卡在游戲上帶來了DLSS3，在視頻創(chuàng)作上同樣帶來了黑科技，耕升RTX4070Ti星極幻姬OC內(nèi)置了雙編碼器NVENC，它支持時(shí)下熱門的AV1編碼，作為下一代主流的視頻編碼技術(shù)有著自己獨(dú)特的優(yōu)勢，更快的編碼速度和更高質(zhì)量的流媒體傳輸性能，讓越來越多的剪輯軟件和視頻網(wǎng)站青睞于它。

我們使用NVIDIA提供的8K片源與工程文件分別測試AV1格式和H.265格式下的編碼時(shí)間。實(shí)測同一段素材下，使用耕升RTX4070Ti星極幻姬OC進(jìn)行AV1編碼會比H.265編碼快不少；即使同樣使用H.265編碼，有雙編碼器的加持下，耕升RTX4070Ti星極幻姬OC有著無可比擬的優(yōu)勢，編碼效率比RTX3090Ti快60%以上。

導(dǎo)出速度快并不是AV1編碼的唯一優(yōu)勢，它的文件占用空間也比H.265要小，無論是4K分辨率還是8K分辨率，使用AV1編碼后，文件整體大小能夠降低25%以上。并且肉眼下幾乎感受不到AV1編碼與H.265編碼的畫質(zhì)區(qū)別，難怪越來越多的軟件和視頻網(wǎng)站開始支持AV1編碼，不久的將來，它將會是主流趨勢。

功耗與發(fā)熱

耕升RTX4070Ti星極幻姬OC雖然是一張定位300W的中端游戲顯卡，但耕升卻為其配備了一個(gè)比肩RTX4080的散熱器，不得不說這樣的散熱配置給RTX4070Ti用有些大材小用了。

在室溫25℃的情況下，使用Furmark單烤15分鐘后，耕升RTX4070Ti星極幻姬OC的GPU核心運(yùn)行在2650MHz左右，但此時(shí)核心溫度僅有68℃，顯存更是僅有58℃，這跟前代RTX3090Ti動輒70℃起跳相比，能耗比堪稱史詩級進(jìn)步。

耕升RTX4070Ti星極幻姬OC不僅僅是溫控做得不錯(cuò)，功耗與噪音控制也相當(dāng)優(yōu)秀，烤機(jī)15分鐘僅有286W，比前代卡皇RTX3090Ti低了足足100W，但性能卻能夠做到持平甚至超越！并且烤機(jī)狀態(tài)下，風(fēng)扇轉(zhuǎn)速也不高，噪音也只有35dB，如果是放在機(jī)箱內(nèi)，這個(gè)噪音水平幾乎是聽不到的。

為了更直觀的展示耕升RTX4070Ti星極幻姬OC的功耗表現(xiàn)，我們利用HWINFO64軟件與FrameView軟件雙重記錄多款顯卡的功耗表現(xiàn)情況，從圖中可以看到耕升RTX4070Ti星極幻姬OC整體功耗控制相當(dāng)出色，在所有測試場景內(nèi)都沒有突破300W，部分項(xiàng)目的功耗甚至不到RTX3090Ti的一半，但性能卻已經(jīng)超越，這樣的表現(xiàn)難怪讓一眾游戲玩家高呼“真香“。

總的來說，老黃的AdaLovelace架構(gòu)和TSMC的4N工藝確實(shí)有點(diǎn)東西，耕升RTX4070Ti星極幻姬OC無論是理論測試還是生產(chǎn)力創(chuàng)作，甚至是游戲場景都妥妥的吊打前代顯卡，讓這代顯卡的每瓦性能實(shí)打?qū)嵉奶嵘搅艘粋€(gè)新高度，這是30系顯卡無論如何努力都無法企及的高度。

超頻潛力測試

換裝“幻姬22“散熱器的耕升RTX4070Ti星極幻姬OC在散熱效能上有不少的提升，這也給超頻提供了可能，因此筆者也測試了這款顯卡的超頻潛力。

我們使用的是耕升全新升級的GW-SOUL調(diào)控軟件，這款軟件不僅可以實(shí)時(shí)顯示顯卡頻率，還可以一鍵超頻，方便小白用戶操作。當(dāng)然風(fēng)扇調(diào)節(jié)、RGB調(diào)控等基礎(chǔ)功能也是應(yīng)有盡有，下載這款軟件幾乎可以滿足你對顯卡的所有設(shè)置了。

筆者經(jīng)過一系列的嘗試，最終將顯卡核心頻率提升了150MHz，顯存頻率提升了500MHz，在這樣的條件下運(yùn)行3DMarkTimeSpy項(xiàng)目，最終耕升RTX4070Ti星極幻姬OC的運(yùn)行頻率突破3000MHz，取得23921的高分，相比默頻狀態(tài)幾乎高出2000分，性能提升還是相當(dāng)可觀的。

評測總結(jié)

實(shí)際測完后不得不感嘆RTX4070Ti顯卡的性能確實(shí)強(qiáng)，老黃的Ada架構(gòu)與DLSS3功不可沒，讓這代顯卡有著超乎預(yù)期的性能表現(xiàn)。同時(shí)換裝TSMC4N工藝后，顯卡的能耗比相比上代30系也有了全新的改變，超低的功耗更強(qiáng)的性能成為40系顯卡的標(biāo)配。毫無疑問，這代顯卡從里到外都是一次革新，處處皆驚喜。

再說說這次評測的主角——耕升GeForceRTX4070Ti星級幻姬OC，它的外觀設(shè)計(jì)幾乎是所有RTX4070Ti中最前衛(wèi)的，單是雙色漸變在辨識度上就超越了99%以上的顯卡。不得不說耕升在顯卡設(shè)計(jì)方面確實(shí)有一手，之前評測的炫光系列也是憑借獨(dú)特的RGB燈效俘獲玩家的芳心，現(xiàn)在在星極系列上用大膽跳脫的撞色設(shè)計(jì)讓顯卡依舊冷艷迷人。

然而耕升GeForceRTX4070Ti星級幻姬OC不單止在設(shè)計(jì)上有特色，在配置與性能上也是竭盡全力的給你最好的體驗(yàn)。得益于“幻姬22“散熱器的超強(qiáng)散熱能效與架構(gòu)工藝的更新，讓這款顯卡能夠以RTX3090Ti一半的功耗實(shí)現(xiàn)超越RTX3090Ti的性能！擁有這款顯卡你就能夠在2K畫質(zhì)下高刷暢玩3A，再加上這張顯卡的售價(jià)僅有RTX3090Ti的一半，可以說它的出現(xiàn)，讓大眾玩家也能感受40系顯卡的強(qiáng)悍性能。

耕升GeForceRTX4070Ti星級幻姬OC現(xiàn)已上市，售價(jià)7099元，考慮到其更強(qiáng)的頻率設(shè)定與激進(jìn)的散熱配置，價(jià)格相比起步價(jià)6499元更高也是可以理解的。如果你最近想要更換一款性能強(qiáng)勁的顯卡，那不妨看看耕升GeForceRTX4070Ti星級幻姬OC，更低的售價(jià)，超乎前代卡皇的性能相信一定能夠滿足你的需求。

7功耗&超頻&評測總結(jié)

技術(shù)講解：Ada Lovelace架構(gòu)解析

Turing、Ampere上兩代架構(gòu)核心均以人物來命名，前者是計(jì)算機(jī)科學(xué)之父——艾倫·麥席森·圖靈；后者則是“電學(xué)中的牛頓”——安德烈·瑪麗·安培，電流的國際單位安培就是以其姓氏命名。那AdaLovelace定非凡人，度娘一下果然，這是人稱“數(shù)字女王”的阿達(dá)·洛芙萊斯，編寫了歷史上首款電腦程序，是被世界公認(rèn)的第一位計(jì)算機(jī)程序員，果真是一代比一代還要更牛。PS：她的父親是《唐璜》的作者，詩人拜倫喔。

從Turing架構(gòu)開始，NVIDIA首次在顯卡中加入了加速光線追蹤的RTCore單元，以及面向AI推理的TensorCore單元，這革命性的創(chuàng)新使實(shí)時(shí)光線追蹤成為可能。而Ampere架構(gòu)則是全面的架構(gòu)改進(jìn)，在加入新一代的二代RTCore和三代TensorCore基礎(chǔ)上，還有著更先進(jìn)的SM單元設(shè)計(jì)，這樣顯卡工作效率那是翻倍的提升。而來到AdaLovelace架構(gòu)，同時(shí)是以效率提升為大前提，自然是引入了最新的第三代RTCores與第四代TensorCores單元，同時(shí)加入眾多新穎的黑科技，從執(zhí)行效率來說AdaLovelace架構(gòu)是上代Ampere架構(gòu)的2倍以上，甚至光線追蹤能力更是達(dá)到了恐怖的4倍性能。

全新的SM流式多處理器

AdaLovelace架構(gòu)中最大的亮點(diǎn)之一：全新的SM流式多處理器，每個(gè)SM包含了128個(gè)CUDA核心、1個(gè)第三代的RTCores,4個(gè)第四代TensorCores（張量核心）、4個(gè)TextureUnits（紋理單元）、256KBRegisterFile（寄存器堆），以及128KBL1數(shù)據(jù)緩存/共享內(nèi)存子系統(tǒng)，于是這一個(gè)全新的SM單元有著超過上一代2倍之的性能表現(xiàn)。

過去的Turing架構(gòu)INT32計(jì)算單元與FP32數(shù)量是一致的，而兩者相加才組成了64個(gè)CUDA核心。但是Ampere架構(gòu)開始，左側(cè)的計(jì)算單元實(shí)現(xiàn)了FP32+INT32的計(jì)算單元并發(fā)執(zhí)行，也就是說CUDA核心數(shù)量翻倍到了128個(gè)。

再來看看AdaLovelace架構(gòu)的SM，F(xiàn)P32/INT32的計(jì)算單元組合，同樣實(shí)現(xiàn)了每個(gè)SM內(nèi)含128個(gè)CUDA的設(shè)計(jì)，看似提升不大，但是當(dāng)你了解到GeForceRTX4070Ti擁有60個(gè)SM，7680個(gè)CUDA核心，那你也就應(yīng)該明白它的著色器能力進(jìn)一步加強(qiáng)，即使比起上一代的卡皇RTX3090Ti顯卡，那也是絲毫不虛的。

另外緩存方面AdaLovelace架構(gòu)也進(jìn)行了大規(guī)格的提升，首先每個(gè)SM單元中單獨(dú)配上了128KB的緩存，其次核心的二級緩存進(jìn)行進(jìn)行了重新的設(shè)計(jì)，使得RTX4070Ti配備了48MB二級緩存，相比RTX3070Ti可以說是質(zhì)的飛躍。

8技術(shù)講解：Ada Lovelace架構(gòu)解析

技術(shù)講解：第三代 RT Cores 與第四代 Tensor Cores

以為剛才的CUDA數(shù)量與超大L2緩存就已經(jīng)很猛了，實(shí)現(xiàn)上AdaLovelace架構(gòu)最大的提升還是在第三代RTCores與第四代TensorCores身上。

第三代RTCores

RTCores用于光線追蹤加速，第三代RTCores的有效光線追蹤計(jì)算能力達(dá)到191TFLOPS，是上一代產(chǎn)品2.8倍。

在Ampere架構(gòu)中，第二代RTCores支持邊界交叉測試（BoxIntersectiontesting）和三角形交叉測試（TriangleIntersectiontesting），用于加速BVH遍歷和執(zhí)行射線三角交叉測試計(jì)算，雖然光線追蹤處理能力已經(jīng)比初代的Turing架構(gòu)核心更高效，但是隨著環(huán)境和物體的幾何復(fù)雜性持續(xù)增加，傳統(tǒng)的處理方式很難再以更高效率、正確反應(yīng)出的現(xiàn)實(shí)世界中的光線，尤其是光的運(yùn)動準(zhǔn)確性。

所以在第三代RTCores增加了兩個(gè)重要硬件單元：OpacityMicromapEngine與DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine，主要是用于alpha通道的加速，可以將alpha測試幾何體的光線追蹤速度提高2倍。

在傳統(tǒng)光柵渲染中，開發(fā)人員使用一些Alpha通道的素材來實(shí)現(xiàn)更高效的畫面渲染，例如Alpha通道的葉子或火焰等復(fù)雜形狀的物體。但在光線追蹤時(shí)代，這傳統(tǒng)的做法會為光線追蹤帶為不少無效的計(jì)算，例如運(yùn)動性的光線多次通過一塊葉子，光線每擊中一次葉子，都會調(diào)用一次著色器來確定如何處理相交，這時(shí)就會做成嚴(yán)重的執(zhí)行成本與時(shí)間等待成本。

而OpacityMicromapEngine用于直接解析具有非不透明度光線交集的不透明度狀態(tài)

三角形。根據(jù)Alpha通道的不透明，透明與未知等三個(gè)不同的塊狀態(tài)進(jìn)行處理：透明則直接忽略繼續(xù)找下一個(gè)，不透明塊則記錄并告之命中，而未知的則交給著色器來確定如何處理，這樣GPU很大部分都不需要進(jìn)行著色器的調(diào)試處理，能夠?qū)崿F(xiàn)更為高效的性能。

DisplacedMicro-MeshesEngine

如果說OpacityMicromapEngine加速的是面處理，那么DisplacedMicro-MeshesEngine就是幾何曲面細(xì)節(jié)的加速器。如上圖所示，在AdaLovelace架構(gòu)中，通過1個(gè)基底三角形+位移地圖，就可以創(chuàng)建出一個(gè)高度詳細(xì)的幾何網(wǎng)格，所需要資源占用比二代RTCores更低，效率也更高。

通過NVIDIA給出的創(chuàng)建14:1珊瑚蟹例子來說事，這里我們需要需要1.7萬個(gè)微網(wǎng)格、160萬個(gè)微三角形，在AdaLovelace架構(gòu)中BVH創(chuàng)建速度可加快7.6倍，存儲空間縮小8.1倍。DisplacedMicro-MeshesEngine起到了關(guān)鍵性的作用，其將一個(gè)幾何物體根據(jù)不同細(xì)節(jié)分成密度不一的微網(wǎng)絡(luò)處理，紅色密度超高，細(xì)節(jié)處理越為復(fù)雜。相應(yīng)的低密度微網(wǎng)絡(luò)區(qū)域則可以釋放更多的資源與存儲空間，這樣DisplacedMicro-MeshesEngine就可以幫助BVH加速過程，減少構(gòu)建時(shí)間和存儲成本。

同時(shí)AdaLovelace架構(gòu)SM中新增了著色器執(zhí)行重排序（ShaderExecutionReordering，SER），這是由于光線追蹤不再只有強(qiáng)光或者陰影渲染處理，未來將會更多的是在光線的運(yùn)動性，這樣光線就會變得越來越復(fù)雜，想要第三代RTCores與第四代TensorCores有著更高的執(zhí)行效率，那就得為他們來安排一位管家。而著色器執(zhí)行重排序（SER）就是為了能夠即時(shí)重新安排著色器負(fù)載來提高執(zhí)行效率，為光線追蹤提供2倍的加速，也能更好地利用GPU資源。不過目前仍未有實(shí)例，想實(shí)現(xiàn)這個(gè)功能，還得游戲與開發(fā)工具的支持才行。

第四代TensorCores

TensorCores是專門為執(zhí)行張量/矩陣運(yùn)算而設(shè)計(jì)的專用執(zhí)行單元，這些運(yùn)算是深度學(xué)習(xí)中使用的核心計(jì)算功能。第四代TensorCores新增FP8引擎，具有高達(dá)1.32petaflops的張量處理性能，超過上一代的5倍。

9技術(shù)講解：第三代RT Cores與第四代Tensor Cores

技術(shù)講解：DLSS 3

或者說第四代TensorCores太硬核你不會知道是啥？提升意義在哪？但是TensorCores最經(jīng)典的應(yīng)用DLSS你肯定會知道，這一次AdaLovelace架構(gòu)支持NVIDIA最新的DLSS3技術(shù)。

https://images.nvidia.cn/cn/youtube-replicates/r-hu006p23I.mp4

之前我們也聊過DLSS技術(shù)，其設(shè)計(jì)之初是為了彌補(bǔ)光線追蹤技術(shù)后的性能損失，具體的表現(xiàn)為開啟光線追蹤技術(shù)后游戲幀數(shù)大幅度的下降，甚至很難保證游戲流暢的運(yùn)行。于是DLSS使用低分辨率內(nèi)容作為輸入并運(yùn)用AI技術(shù)輸出高分辨率幀，從而提升光線追蹤的性能。

在DLSS3中包含了三項(xiàng)技術(shù)：DLSS幀生成、DLSS超分辨率（也稱為DLSS2）和NVIDIAReflex。你可以理解為DLSS3是在DLSS2的基礎(chǔ)上，新增了DLSS幀生成技術(shù)；而后兩技術(shù)中，DLSS超分辨率只需要GeForceRTX顯卡都能使用上，NVIDIAReflex則是GeForce900系列以后的顯卡都用使用上。

想實(shí)現(xiàn)DLSS幀生成可不簡單，這需要配合上AdaLovelace架構(gòu)的GeForceRTX40系列顯卡才行。DLSS幀生成技術(shù)原理是：利用AI技術(shù)生成更多幀，以此提升性能。DLSS會借助GeForceRTX40系列GPU所搭載的全新光流加速器分析連續(xù)幀和運(yùn)動數(shù)據(jù)，進(jìn)而創(chuàng)建其他高質(zhì)量幀，同時(shí)不會影響圖像質(zhì)量和響應(yīng)速度。

從Ampere架構(gòu)開始，NVIDIA顯卡就已經(jīng)支持了光流加速器，而AdaLovelace架構(gòu)的光流加速器升級到了第二代，其提供了高達(dá)300TeraOPS(TOPS)，比安培架構(gòu)的初代光流加速器（OpticalFlowAcceleration，OFA）快2倍以上。為了實(shí)現(xiàn)DLSS幀生成，OFA扮演了重要的角色，其配合上新的運(yùn)行矢量分析算法在DLSS3技術(shù)框架內(nèi)實(shí)現(xiàn)精確和高性能的幀生成能力。

另外，由于DLSS幀生成是在GPU上作為后處理執(zhí)行的，那么即使在游戲受到CPU性能限制的時(shí)候，我們同樣能夠從中獲得更好的游戲性能提升。尤其是那種物理計(jì)算密集型的游戲或大型場景游戲，DLSS2均可以讓GeForceRTX40系列顯卡以高達(dá)兩倍于CPU可計(jì)算的性能來渲染游戲。

最后由于DLSS3是建立在DLSS2基礎(chǔ)之上的，游戲開發(fā)者可以在已支持DLSS2或NVIDIAStreamline的現(xiàn)有游戲中快速集成該功能，所以DLSS3已在游戲生態(tài)得到廣泛應(yīng)用，目前已有超過35款游戲和應(yīng)用即將支持該技術(shù)。

閱讀小亮點(diǎn)：NVIDIAReflex

NVIDIAReflex也是DLSS3其中的一環(huán)，它可以使GPU和CPU同步，確保最佳響應(yīng)速度和低系統(tǒng)延遲。

想要實(shí)現(xiàn)端對端的最低延遲，你需要確保游戲、顯示器以及鼠標(biāo)三者都同時(shí)支持并開啟了Reflex技術(shù)。

當(dāng)GeForceRTX40系列顯卡和NVIDIAReflex搭配上后，直接達(dá)到1440p分辨率360FPS的體驗(yàn)，這著實(shí)是性能有點(diǎn)強(qiáng)勁了。

在GTC2022大會時(shí)已經(jīng)透露將會還有4款1440p分辨率的新型G-SYNC電競顯示器將要發(fā)布，包括采用mini-LED技術(shù)的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款顯示器刷新率均為300Hz，而最猛的是ASUSROGSwift360HzPG27AQN，刷新率直接來到了360Hz。

但唯一一個(gè)問題就在于，部分顯示器廠商認(rèn)為此類產(chǎn)品受眾人群較少，會降低此類顯示器的產(chǎn)能，甚至產(chǎn)品就已經(jīng)被內(nèi)部PASS掉，所以1440p360Hz是很美好，但現(xiàn)實(shí)也是相當(dāng)?shù)墓歉小?

10技術(shù)講解：DLSS 3

技術(shù)講解：雙NVIDIA編碼器（NVENC）

GeForceRTX40系列顯卡還有一個(gè)全新的升級，那就是雙編碼器NVENC。第八代的NVENC雙編碼器不僅支持H.264與H.265，還支持開放式視頻編碼格式AV1。

而由于AV1是一種免版稅的視頻編碼格式，上游軟件廠商與下游戲的配套端都在大力推廣此編碼格式，我們也會看到越來越多的硬件與軟件支持AV1格式，包括剪映專業(yè)版、DaVinciResolve、以及AdobePremierePro較為流行的Voukoder插件均支持，且均可通過編碼預(yù)設(shè)使用雙編碼器，這樣我們等待視頻導(dǎo)出的時(shí)間縮短將近一半。

不單是視頻制作軟件，AV1格式也將會是主播、游戲直播UP主們的新寵兒，在保證畫面最高質(zhì)量的情況下，AV1編碼器可將效率提高40%，同時(shí)顯卡的占用也更低。包括OBSStudio一代軟件中也會增加AV1格式的支持。另外我們還能通過GeForceExperience和OBSStudio錄制高達(dá)8K60的內(nèi)容，這樣我們做游戲錄制也會變得更為輕松。

包括我們之后測試時(shí)使用的游戲內(nèi)錄視頻都是支持AV1格式，同時(shí)雙編碼器NVENC在資源占用和適配上做得越來越好。

標(biāo)簽：

全球熱點(diǎn)評！耕升 GeForce RTX 4070 Ti 星極幻姬 OC顯卡評測：雙色碰撞，千變?nèi)f化

參與評論

全球熱點(diǎn)評！耕升 GeForce RTX 4070 Ti 星極幻姬 OC顯卡評測：雙色碰撞，千變?nèi)f化

參與評論

全球熱點(diǎn)評！耕升 GeForce RTX 4070 Ti 星極幻姬 OC顯卡評測：雙色碰撞，千變?nèi)f化