影驰RTX4080星曜OC评测:雅致纯白高颜值,更有ARGB夺目炫光
影驰在RTX 30系列中最令人印象深刻的莫过于显卡产品线新推出的星曜系列了。由外包装的年轻时尚气息,再到显卡别出心裁的透明亚克力外壳设计,给人如水晶一般晶莹剔透的既视感,追求个性的玩家还可以拆下外壳定制丰富的DIY涂装,着实让笔者在内的不少玩家都眼前一亮。
随着RTX 40系列的上市,影驰也带来了新一代的星曜设计,一体的纯白背板和5V ARGB的加入,相信也能弥补不少机友们的缺憾。本次我们就上手了影驰 GeForce RTX 4080 16GB 星曜 OC,看看新版星曜又有怎样的新实力。
01/ Ada Lovelace架构与RTX 4080
GeForce RTX 4080 16GB显卡采用的是AD 103-300显示核心,该核心基于TSMC 4N工艺和Ada Lovelace架构核心进行制造,其芯片面积为378.6 平方毫米,晶体管密度为459亿。
其中,Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。
根据NVIDIA官方的介绍,Ada Lovelace架构核心所采用的第 3 代 RT Core 不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能提高了一倍之多。第 3 代 RT Core 还配备了全新的 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎,进一步提升了光追计算的性能以及减少计算开销,带来了更好的光线追踪效果表现。Ada Lovelace架构核心配备的第四代Tensor Core更是引入了来自专业级H100数据中心GPU的 FP8 Transformer 引擎,从而带来了更加强悍的AI算力。
▲第三代RT Core结构示意图,相比前代,增加了2个功能
Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER 着色器执行重排序 )技术来更好的对于着色器的工作进行调度排序,在使用上可以根据不同的负载需求来执行渲染,可对负载较为统一的画面进行渲染,降低工作开销。
根据英伟达官方的介绍,这一个SER功能将作为API开放给开发者使用。英伟达官方宣称,SER功能的加入最 高可带来两倍RT Core性能上的改善,对于光追游戏来说更可带来体验的升级。根据NVIDIA官方的数据,全新的SM(流式单元处理器)可带来最 高两倍的性能以及能效升级,升级幅度是非常明显的。
▲Ada Lovelace架构核心 SM结构图
Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流多处理器)的升级以外,带来了全新的第八代NVENC双硬件编码器,这一全新的第八代NVENC双硬件编码器整合了对AV1视频编码格式的支持,可以在传统的H.264等格式之外,加入了对AV1这一主流新标准的支持,可以进行对于AV1格式的编码与解码,有效提升了生产力方面的表现,对于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显示,第八代NVENC双硬件编码器在AV1的效率上比H.264编码器的效率提高了40%,这一提升非常明显。
除了核心上的升级以外,Ada Lovelace架构核心还大幅度提升了其L2缓存,GeForce RTX4080 16GB拥有64MB的L2缓存,大容量的L2缓存带来了数据命中率的有效提升。在现阶段显存带宽提升有效的情况下,通过升级更大容量的L2缓存,可以提升数据命中表现,带来性能方面的升级,根据NVIDIA官方的说法,大容量L2缓存的加入为GPU的一系列操作带来了更高的收益,尤其是在光线追踪等场景下,表现更为明显。
▲RTX 4080 16GB核心架构图
Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升。
DLSS 3包含有DLSS 2(DLSS超分辨率技术),以及全新加入的DLSS帧生成技术,这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处理器以及Tensor Core的AI算力。在一项技术在运行过程中,其通过光流处理器所得到的一系列数据后,以光流加速技术(Optical Flow Acceleration,简称为OFA)来生成画面信息,而AI算力则负责来对画面进行进一步的优化,从而在游戏中加入了更多的帧画面,进行帧数的提升。
DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程,而通过这一个流程的循环,可在提升帧数的同时节省资源开销,进一步带来更好游戏体验。
而在DLSS 3的帧生成技术上,由于可能带来延迟的增加,因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法,DLSS 3通过整合NVIDIA Reflex以及一系列的技术,可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。
得益于更加先进的制程工艺,GeForce RTX 40系列显卡在晶体管密度与核心频率上都有着相当显著的提升。此次测试的RTX 4080 16GB的CUDA核心数已经可与上代旗舰型号RTX 3090 Ti比肩,并且公版卡就实现了高达2.5GHz的加速频率。我们此次测试的影驰GeForce RTX 4080星曜OC更是实现一键超频至2.58GHz的加速频率,同时功耗也远低于RTX 3090 Ti。
02/ 外观拆解
影驰GeForce RTX 4080 16GB 星曜 OC采用了近乎纯白色的外观设计,配合其水晶质感的透明上盖,在外观上非常具有个性,带来了很不错的视觉观感。
影驰GeForce RTX 4080 16GB 星曜 OC采用了透明的可拆卸上盖,其上盖在四周边缘和风扇的周围采用了钻石切割的外形设计,在视觉上呈现光线折射效果。在上盖的大部分区域,影驰GeForce RTX 4080 16GB 星曜 OC是采用了平整的处理,方便用户进行对外观进行个性化的操作。
影驰GeForce RTX 4080 16GB 星曜 OC采用的透明上盖可以支持拆卸,拆卸后会展现纯白的外壳,用户可以通过个性化的DIY 设计,打造个人专属外观。
影驰GeForce RTX 4080 16GB 星曜 OC在显卡的顶部配备有logo灯,logo灯支持多种灯效,并且采用了多重反射的处理,打造了极具科技感的灯光效果。
影驰GeForce RTX 4080 16GB 星曜 OC除了顶部的灯光外,还在风扇部位配备了RGB灯光,灯效可透过静霜扇叶。其风扇支持智能启停,在风扇转动时可以带来更加出色的视觉效果。影驰GeForce RTX 4080 16GB 星曜 OC的灯效也支持到几大厂商的5V RGB灯光同步,并且还配备有“负能量”检测系统,在发生故障的时候会有不同的灯光效果出现。
影驰GeForce RTX 4080 16GB 星曜 OC配备了一体压铸的金属背板。这一块背板采用了近乎纯白的设计,观感十分不错。这一块金属背板可以对于显卡起到一定的支撑作用,并且其通过尾部的大面积镂空设计,进一步辅助热量有效导出。
影驰GeForce RTX 4080 16GB 星曜 OC为三槽宽度,配备的输出接口为3个DP 1.4以及1个HDMI 2.1。
影驰GeForce RTX 4080 16GB 星曜 OC配备的是全新的星卓 III 散热系统,这一套散热系统在显卡的正面是配备了 3 个直径 102mm的风扇,风扇采用了经过特殊设计的 11 片静霜扇叶,可带来风力和风量上的提升。
影驰GeForce RTX 4080 16GB 星曜 OC所采用的星卓 III 散热系统配备有4*Φ8mm+5*Φ6mm 镀镍复合热管,并且通过大面积的均热板和鳍片来进一步导出热量。
影驰GeForce RTX 4080 16GB 星曜 OC采用的是12 层的高规格 PCB,其布局进行了进一步的优化,在PCB的中间我们可以看到其采用的AD 103-300核心。
影驰GeForce RTX 4080 16GB 星曜 OC采用的是AD 103-300核心,其频率提升到了 2580 MHz,在核心的周围我们可以看到一圈16GB的GDDR6X 显存。
影驰GeForce RTX 4080 16GB 星曜 OC配备的是18相的GPU供电和3相的显存供电。
影驰GeForce RTX 4080 16GB 星曜 OC采用的是全新的12VHPWR供电接口,通过一根12VHPWR的电源线就可以完成对于显卡的供电,如果用户使用的是ATX 2.0标准的电源,也可以附赠的12VHPWR转3*8Pin转接线来进行使用。这一张显卡官方给到的推荐是750W及以上的电源进行使用,因此用户也需要注意一下。
影驰GeForce RTX 4080 16GB 星曜 OC还配备了一根带有RGB灯光效果的显卡支架,方便用户对于显卡进行支撑。
03/ 基准测试
强大的CPU单核性能对如今高端显卡的性能释放非常重要,此次测试我们选择了13代酷睿i5-13600K平台,并将大核手动超频至5.7GHz,尽量减少CPU造成的显卡性能瓶颈。
从GPU-Z可以看到,影驰GeForce RTX 4080 16GB 星曜 OC的加速频率是2580MHz,但默认TGP和公版一致是320W,最大解锁至450W。
在3DMark基准测试当中,影驰 GeForce RTX 4080 16GB 星曜 OC跑分已经全面超越了前代卡皇RTX 3090 Ti,而且领先幅度甚至高达20%以上。
在DLSS基准测试中,影驰 GeForce RTX 4080 16GB 星曜 OC在DLSS 2模式下的4K性能提升了159%,DLSS3模式下更是提升了235%。
04/ 游戏表现
RTX 4080强劲的理论性能我们已经有目共睹,接下来是游戏帧数方面的测试。这里我们先分别在2K与4K分辨率下测试四款经典的游戏。
传统游戏测试
在《绝地求生:大逃杀》当中,影驰 GeForce RTX 4080 16GB 星曜 OC的表现如预期般超过了RTX 3090 Ti,领先幅度在15%左右。
在其它大多数的大型游戏场景中,影驰 GeForce RTX 4080 16GB 星曜 OC的表现也都稳稳超过了RTX 3090 Ti,领先幅度分别在15-20%。RTX 4080开启DLSS 2模式对比原生分辨率的性能提升则有30-120%不等。
仅仅除了在2K分辨率DLSS模式下测试《永劫无间》时,可能是由于帧率太高造成了CPU瓶颈,导致显卡占用不满,对比原生2K的实际帧率表现并没有提升,导致还不及RTX 3090 Ti的情况。
DLSS 3与Reflex专项测试
接下来,我们再测试几款含有NVIDIA新一代DLSS 3技术的游戏,游戏的画质都会调至全高,看看这些游戏分别在原生画面、DLSS 2超分辨率、DLSS 3帧生成之下,性能与延迟的差别。
首先我们看看Reflex低延迟功能究竟有多大的作用,在《守望先锋 归来》当中g开启Reflex功能的延迟低了一半以上,而且对帧率几乎没有影响。这一功能可以很好地减轻DLSS 3补帧功能增加的延迟,所以开启DLSS 3也会同步开启Reflex。对于延迟追求更高的玩家来说,使用Reflex+Boost还可以有进一步增强,不过效果就没有那么明显了,而且还会造成小幅的帧率损失。
在基于Unity的《Enemies》DLSS 3测试Demo里面,RTX 4080原生4K下只能跑到22帧,这种极低帧的模式下帧生成时间是很长的,所以延迟来到了192ms。而在打开DLSS 3后,帧率达到3倍以上,延迟也降到了56ms。
同样的情况也出现在《赛博朋克:2077》当中,原生4K下30帧的平均帧带来了117ms的画面延迟,画面卡顿、操作迟滞。而在开启DLSS 3后帧率提升到了95帧,延迟49ms,甚至还比DLSS 2不开Reflex状态要更低。
类似的,在《幻塔》测试版中,由于这款游戏没有单独开启Reflex的选项,所以DLSS 3模式的延迟也要比DLSS 2下面更低。
赛博题材的横版3D游戏《生死轮回》里面,DLSS 3在实现原生分辨率近3倍性能的同时,延迟控制在了仅仅32ms。
在《瘟疫传说:安魂曲》里面,DLSS 3同样带来了较原生分辨率不止翻倍的提升,延迟的增加也不明显。
《暗影火炬城》里面,RTX 4080在DLSS 3模式的平均帧和DLSS 2模式差不多,应该是碰到帧率上限了,但前者在1%低帧的表现上有了比较明显的提升。
在《毁灭全人类》里面,开启DLSS 3的RTX 4080也有着比原生画质翻倍的性能,以及更低的延迟。
画质方面,使用OBS分别对DLSS和原生画质进行高码率录制。从下图对比可以看到,开启DLSS模式的画质(下图左半部分),甚至比原生分辨率(下图右半部分)的纹理细节更加清晰。
05/ 生产力表现
除了游戏以外,如今从游戏主播、内容创作者,到视频编辑、3D 建模和渲染等生产力工作,也没有一样离得开 GPU 的性能支持。
在渲染能力方面,我们先围绕 Blender Benchmark 进行,在 Moster、Junkshop、Classroom 按个场景中,影驰 GeForce RTX 4080星曜OC相对 GeForce RTX 3090 Ti 至多提升了 52% 的性能。
同样 V-Ray 5 Benchmark 中,会同时考验到 GPU CUDA 性能和光线追踪性能表现,能够看到影驰 GeForce RTX 4080 16GB 星曜 OC相对 GeForce RTX 3090 Ti的RTX渲染效率效率提升了38%。
在SPECviewperf 2020集成的8款工业软件测试中,影驰 GeForce RTX 4080星曜 OC相比RTX 3090 Ti也是全面领先。
Octane Render RTX 经常被用作于场景建模,特别是开启光线追踪之后,对实时预览性能以及渲染输出都有着极高的要求,与 GPU 以及 GPU 的 RTX 性能直接挂钩。在这一项目中,影驰 GeForce RTX 4080星曜OC 相对 GeForce RTX 3090 Ti 性能提升 30% 以上。
视频内容创作方面,在使用达芬奇渲染同一段4K H.265视频的任务中,影驰 GeForce RTX 4080 16GB 星曜 OC也比RTX 3090 Ti快了20%以上。
同时,GeForce RTX 40系列显卡还首次加入了 AV1 双编码器。AV1 编码是由英特尔、微软、亚马逊、谷歌、网飞等网络巨头组成的开放多媒体联盟 AOMedia 所推出的免费编码格式,在国内已经获得了哔哩哔哩、爱奇艺支持。它的特点是能在相同文件体积下拥有更高清的画质,或者相同清晰度的画质下拥有更小的体积。
下图是AV1(左)和AVC(右)的画质对比。
GeForce RTX 40系列显卡是目前市面上较少可以支持硬件AV1渲染加速的GPU,实测渲染导出同一段AV1视频,其效率对比纯CPU软件编码效率高了4倍左右。
与此同时,对游戏主播而言,GeForce RTX系列显卡支持的Broadcast工具还可以一键实现人像跟踪、视频去噪、噪音和回声消除、消除/虚化背景等实用功能。
06/ 功耗与散热测试
使用Furmark对影驰 GeForce RTX 4080 16GB 星曜 OC进行10分钟满载压力测试。最终,显卡功耗稳定在320W左右,比RTX 3090 Ti的功耗低了一大截,不得不感叹这一代显卡的能效确实是十分强劲。此时显卡核心温度仅低至61.9°C,风扇也不到1200转,凉快又安静,延续了星曜系列显卡一贯优良的散热水准。
07/ 总结
RTX 4080 16GB显卡再次展现了RTX 40系强大的能效表现,它仅以300W左右的功耗就实现了超越上代旗舰450W功耗下的性能,加上比RTX 3090 Ti低不少的发售价格,必定会成为4K级发烧玩家的新宠。
在首批的非公版型号当中,影驰 GeForce RTX 4080 16GB 星曜 OC继承了上一代白色透明风格的时尚外观和丰富的DIY空间,并进一步做到了更为纯粹的一体纯白,还配备了更为先进的5V ARGB灯效,对于钟爱白色主题MOD的玩家已经是近乎完 美的选择了。