耕升RTX 4090炫光OC评测:科幻造型,强劲散热
无论是突飞猛进的核心性能,还是惊艳四座的新技术,每一代RTX新显卡的发布总能令人倍感期待。今年的RTX 40系列也不例外,跨代的制程工艺升级与强大的DLSS 3技术再次令人垂涎。10月12日,首批非公版NVIDIA GeForce RTX 4090显卡性能终于迎来正式解禁,我们也首发上手了耕升GeForce RTX 4090 炫光OC,一起来看看这张新晋卡皇究竟会有怎样的表现。
01/ Ada Lovelace架构与RTX 4090
Ada Lovelace架构核心
GeForce RTX 4090 显卡所采用的AD102-300核心采用全新的NVIDIA Ada Lovelace 架构和与TSMC 4N NVIDIA定制工艺,实现了高达2倍的性能功耗比飞跃,以及N卡史上最 高的2.52GHz的运行频率。
与此同时,Ada Lovelace架构核心还大幅度提升了其L2缓存,完整版的Ada Lovelace架构核心拥有最 高96MB的L2缓存(RTX 4090为72MB),大容量的L2缓存带来了数据命中率的有效提升。在现阶段显存带宽提升有限的情况下,通过升级更大容量的L2缓存,可以进一步提升数据命中表现,带来性能方面的升级。
在Ada Lovelace架构上,专用于光追计算第三代RT Core有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。这将满足未来更加复杂的光追计算,为次世代级别的画质表现提供更好的支持,如即将上线的《赛博朋克:2077》OVERDRIVE画质可对每个像素执行635次的光追计算来确定光照,相比四年前首批光追游戏《战地5》增加了多达16倍。
光追需要光线面对不同物体、环境的多次反射、折射,处理强度不同的负载,着色器面对的工作量是复杂多变的,往往有的已经完成了,有的还在执行,需要等待。
面对这一问题,Ada Lovelace引入了着色器执行重排序(SER)技术,通过即时重新安排着色器的负载,将凌乱的信息排序整齐,从而提高执行效率,更好地利用GPU资源。
以为光追带来最 高3倍的性能提升,整体游戏性能提升也可达25%,以《赛博朋克2077》、《Portal RTX》、《Racer RTX》等游戏为例,性能可以分别提升44%、29%、20%。
DLSS 3
不过即便有了上述的升级,光线追踪技术所需的性能开销仍然不容小觑。GeForce RTX显卡一直凭借着基于Tensor Core张量核心的DLSS超分辨率技术,实现光追模式下画质与帧率兼得的体验。
而基于Ada Lovelace光流加速器(算力305Tops)、第四代Tensor张量核心(1.4PFlops算力)、NVIDIA超级计算机平台(AI算力1EFlops)三大硬件基础,RTX40系显卡带来了全新的DLSS 3。
DLSS技术前两代的原理是超分辨率,提升帧率的方式简单说就是以低分辨率渲染,然后通过AI训练重建高分辨率画面返回输出。如4K分辨率下打开DLSS那么实际的计算过程是先以1080p分辨率渲染帧画面,然后AI学习经过训练的更高分辨率的帧,再将这个帧画面压缩到4K最终输出。因为中间相差的这3/4部分的像素信息主要是通过Tensor Core的AI计算来添加的,所以GPU每一帧所需的计算量就少了,帧率自然也就提高了。
而DLSS 3则是在包含DLSS 2超分辨率技术的基础上,进一步加入了DLSS光学多帧生成技术。DLSS帧生成技术通过光流处理器所得到的一系列数据后,以光流加速技术(OFA)来生成画面信息,而AI算力则负责来对画面进行进一步的优化,从而在游戏中加入了更多的帧画面,进行帧数的提升。
DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程,进一步带来更好游戏体验。同时这也意味着生成的画面中,有一半都完全由GPU计算得出,不需要由CPU参与,所以理论上可以将原本受限于CPU性能的游戏帧率提高一倍。
而在DLSS 3的帧生成技术上,由于可能带来延迟的增加,因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法,DLSS 3通过整合NVIDIA Reflex以及一系列的技术,可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。
在应用支持方面,NVIDIA向开发者表示,DLSS 3与DLSS 2大部分引擎开发接口是相通的,还可以通过Streamline这一NVIDIA发布的开源平台进行集成,极大的简化了游戏开发者对新技术的集成工作,支持DLSS 2技术的游戏将会很容易地升级到对DLSS 3的支持。
首批宣布即将支持DLSS 3的游戏及应用等有35款,不仅包括《巫师3:狂猎》《黑神话: 悟空》《赛博朋克2077》《逆水寒》《杀手3》《微软模拟飞行》等热门游戏,还得到了寒霜引擎、Unity 、虚幻引擎4 & 5 等知名游戏引擎的支持。
首次支持第八代NVENC AV1双编码器
Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)的升级以外,带来了全新的第八代NVENC AV1双编码器,这一全新的第八代NVENC双硬件编码器整合了对AV1视频编码格式的支持,可以在传统的H.264等格式之外,加入了对AV1这一主流新标准的支持,可以进行对于AV1格式的编码与解码,有效提升了生产力方面的表现,对于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显示,第八代NVENC双硬件编码器在AV1的效率上比H.264编码器的效率提高了40%,这一提升非常明显。
RTX 4090
RTX 4090采用的是AD102-300 显示核心,采用了TSMC 4N NVIDIA定制工艺进行制造,芯片面积为608.5平方毫米,晶体管密度达到了763亿,相比较于上一代产品提升非常明显,而这一代的核心还进一步提升了频率,因此能带来更好的性能表现。
RTX 4090配备了24GB的GDDR6 X显存,大显存配合性能上的提升更可以为游戏以及创作者带来更好的使用体验,RTX 4090可谓是现阶段消费级显卡中顶尖存在。
而值得注意的是,现阶段发布的RTX 4090采用的并非是完整版的ADD 102核心,是在完整版的Ada Lovelace架构核心上屏蔽了一部分的GPG而来的产品,并且其L2缓存也从完整版的96MB降低为了72MB。因此我们猜测,RTX 4090或有可能不是NVIDIA旗下RTX 40系列的最旗舰产品,或有可能存在使用完整AD 102核心的RTX 4090Ti或者RTX TITAN将会在后续进行推出。
我们可以通过下方的规格表来直观的看到RTX 4090和RTX 3090Ti的规格差距,而我们此次拿到的耕升RTX 4090炫光OC进一步提升了Boost频率,在实际的表现上能有更进一步的发挥。
02/ 外观拆解
耕升 GeForce RTX 4090炫光 OC外观采用了全新升级的第二代「炫之黑曜石」散热器,流线型的亮面外壳静态下颇具神秘感,上机点亮后还会亮起科幻感十足的灯效。它支持5V ARGB可调灯效,也支持连接市面上主流主板的神光同步。
第二代「炫之黑曜石」散热器不仅升级了外观和灯效设计,还升级优化耕升专用的「炫风之刃」扇叶。
由 2 个 102mm 和 1 个 92mm 组合而成的三风扇,经过升级后能提升风流量的同时减低声噪,更高速有效地散热,以应对高达600W TGP功耗下的温度。
显卡外壳采用了PCB板花纹设计,能让显卡在通电运行时呈现出电路板的纹路,使得显卡整体更加具备未来感和设计感。显卡背面印着“GeForce RTX”的字样和 NVIDIA 核心AIC之一“耕升”的英文名称,同时采用了穿透式金属散热背板在右方进一步加大积镂空间。
在供电方面,耕升 GeForce RTX 4090 炫光 OC使用的是12VHPWR供电接口,包装内附赠一根电源转接线,玩家们也不用担心自己的电源适配问题。耕升 GeForce RTX 4090 炫光 OC 450W~600W 的TGP功耗建议使用850W及以上电源,确保显卡能在功率充足稳定的电源中使用。
显卡侧板是显示器连接口,也有DP 1.4a*3/HDMI 2.1a *1,可以支持最多四联屏输出。
随包装还附赠了一个官方显卡支架,无需拼装直接使用,还可以自由调节高度。显卡支架可以起到支撑作用,防止显卡过重导致主板上的显卡槽变形甚至断裂,这对于较重的旗舰卡而言非常重要。
上机效果展示:
拆解:
耕升RTX 4090炫光OC采用了类公版的PCB设计,18相核心供电和4相显存供电, 稳定输出持久耐用。
PCB正中间是AD102-300-A1核心。
周围有12颗显存颗粒围绕,均是美光的GDDR6X显存,型号为美光的D8BZC,单颗2GB容量,32-bit位宽,12颗一共组成24GB 384-bit的显存规格。
和RTX 3090 Ti一样,由于换用了单颗2GB的显存,所以24GB的显存颗粒都可以贴在正面,背面已经没有显存了,这对显存的散热是更加友好的。
第二代「炫之黑曜石」散热器还升级了特大面积散热鳍片,内建8根复合式热导管,加入镀镍设计加强抗氧化能力。配合升级后的第三组风扇和镂空PCB设计,可让显卡温度得到进一步降低,延长显卡使用寿命。
03/ 理论性能及散热测试
由于首发测试的时候,13代酷睿平台还没有上市,所以本次评测搭配的是12代酷睿的旗舰型号i9-12900K,同时在主板BIOS内开启Resizable BAR技术,尽可能充分地发挥出耕升RTX 4090炫光OC的性能。
DLSS 3是RTX 40系列显卡带来的全新技术,在维持高画质的情况下也可以实现更为流畅的游戏表现,这也让玩家可以更好的享受4K光追游戏带来的画质体验,所以4K性能将作为后面游戏测试的重点。为了更好的感受RTX4090显卡在游戏方面的升级,我们在测试RTX4090显卡时也选择了爱攻&保时捷(Porsche Design)联合设计的PD32M显示器。
这款显示器为31.5英寸,采用MIni LED背光技术,拥有3456颗LED颗粒以及1152个独立分区,拥有1600尼特峰值亮度,8000万:1动态对比度,并通过HDR1400认证,在画质上有着更为出色的表现。此外,PD32M拥有4K分辨率以及144Hz的刷新率,支持97%DCI-P3色域以及99% Adobe RGB覆盖,并且拥有HDMI 2.1接口,是一款旗舰级电竞显示器。
GPU-Z显示的耕升RTX 4090炫光OC规格信息如下:
在3DMark基准测试中,耕升RTX 4090炫光OC对比上代旗舰RTX 3090Ti,除了1080P下运行的Fire Strike项目提升50%外,其余项目提升均在70%左右。显而易见,单从跑分成绩来看,RTX4090显卡的性能提升堪称是非常大的。
3DMark基准测试新增加了DLSS功能测试(DLSS 3)。该测试项目目前还需要测试阶段,需要下载NVIDIA提供的测试版程序。
根据实测来看,在开启DLSS 3之后,RTX4090显卡在2K、4K分辨率下均实现了巨大的FPS提升。
在更高的8K分辨率下,开启DLSS 3之后RTX4090显卡的FPS依然能跑到60帧以上。可以说在DLSS 3技术的助力之下,RTX4090显卡能够畅玩的8K游戏会更多。
室温26°C开放平台,在10分钟Furmark烤机测试中,耕升RTX4090炫光OC在满载功耗430-450W功耗下,核心温度仅64.7°C,散热表现相当好。
04/ 游戏测试
传统游戏
首先我们测试七款主流游戏,看看RTX 4090对比RTX 3090 Ti实际表现到底提升有多大。
游戏实测——《地铁:离去》
游戏实测——《刺客信条:奥德赛》
游戏实测——《战争机器5》
游戏实测——《幽灵行动:荒野》
游戏实测——《光明记忆:无限》
游戏实测——《古墓丽影:暗影》
游戏实测——《无主之地3》
对比上一代卡皇RTX3090Ti,新一代卡皇RTX4090的游戏性能提升是非常显著的,也基本符合理论测试的70%提升。
DLSS 3游戏
由于首测时,DLSS 3版本目前均处于测试阶段,进行测试的话需要下载NVIDIA提供的测试版游戏,此次评测项目包括《赛博朋克2077》、《逆水寒》、《瘟疫传说:安魂曲》的测试版本。
DLSS 3游戏测试版——《逆水寒》默认开启
DLSS 3游戏测试版——《瘟疫传说:安魂曲》
DLSS 3游戏测试版——《赛博朋克2077》
通过上述三款DLSS 3游戏来看,DLSS 3技术为RTX40系列显卡带来的性能提升是巨大的。NVIDIA的DLSS 3技术除了能够助力游戏帧数的大幅提升之外,还有一大优势,那就是助力游戏画质的提升。
上图这个《赛博朋克2077》游戏场景,开启DLSS质量模式之后,篮球架上面的针叶树的树叶模型要更加精细。
上图这个《逆水寒》游戏场景,开启DLSS质量模式之后,屋檐下灯笼的模型要更加精细。
上图这个《瘟疫传说:安魂曲》游戏场景,开启DLSS画质模式之后,树叶的模型要更加精细。
05/ 生产力测试
AV1硬件加速编解码测试
为什么AV1编解码技术越来越受欢迎?理由很简单,AV1编解码的视频能够以更低的码率,实现其它主流编解码视频相同的画质。说白了,在视频画质相同的情况下,采用AV1编解码的视频文件体积会更小,以至于能够为视频创作者们节省大量的硬盘空间。
目前万兴喵影、达芬奇等视频软件已可支持AV1硬件加速编/解码功能。以万兴喵影为例,分别利用AV1编解码和H.264编解码导出一部码率基本相同的MP4视频。
最终,AV1编解码的视频体积仅为853MB,而H.264编解码的视频体积则达到了1.22GB。怎么样,AV1编解码技术可以高效地帮助你节省硬盘空间。
目前达芬奇这款软件已推出了支持N卡AV1硬件加速编解码的测试版。
将一部12GB容量的4K视频,利用N卡AV1硬件加速编解码导出一部MP4视频。最终,利用RTX4090的加速效果,视频导出时间仅为48秒,速度相当快。
H.265硬件加速编解码测试
将一部12GB容量的4K视频,利用H.265硬件加速编解码导出一部MP4视频。此项测试对比了RTX 3090 Ti的成绩。
最终,RTX4090的成绩为43秒,而RTX3090Ti的成绩为85秒。新卡皇的H.265加速能力也要比老卡皇好上很多。
工业设计领域测试
利用SPECviewperf 13这款基准测试软件,笔者再来实测下RTX4090显卡在工业设计领域的表现。
显而易见,RTX4090在工业设计领域的性能提升也是相当大的。
06/ 总结
上一代RTX30系显卡首发的时候,我们已经非常惊叹于高端卡相比上代产品50%的提升,没想到这一代进步的速度竟然更胜以往,RTX 4090即便是面对前代旗舰级的RTX 3090 Ti也提升也了超过70%,而且这还是在维持450W功耗墙不变的情况下实现的。
同时NVIDIA作为目前市场占有率领先的显卡厂商,此次为RTX 40显卡加入开创性的光学多帧生成功能,以及AV1编解码等特性,并积极推动对应生态的发展,对于整个显卡行业来说也有路标式的引导意义。
而我们此次评测的非公版型号—耕升RTX4090炫光OC,不仅有着颇具未来科幻风格的前卫设计,高端的ARGB灯控支持,以及高于公版的OC频率,「炫之黑曜石」散热器的散热表现也十分不俗,算是首批非公型号中兼具颜值实力,性价比也很不错的选择。