泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

耕升RTX 4070踏雪评测:素雅纯白配色,畅玩2K游戏性价比新选

  刚刚,NVIDIA正式发布了GeForce RTX 4070显卡,新卡号称拥有远超前代同档次的性能,将带来1440P光追游戏100帧的表现,下面我们就来实测看看它的表现究竟如何,又是否成为使用2K屏的玩家们更具性价比的选择。

01/ Ada Lovelace架构与GeForce RTX 4070

AD104核心

  GeForce RTX 4070采用了与GeForce RTX 4070 Ti同款的AD104核心,该系列GPU核心基于台积电4N定制工艺与全新的Ada Lovelace架构打造,在性能、能耗比等方面带来了飞跃式的进步。

  Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。据了解,Ada Lovelace架构核心所采用的新一代SM(流式多处理器)带来了至高2倍的性能以及能效提升。

  ▲Ada Lovelace架构核心 SM结构图

  Ada Lovelace架构核心在RT Core上引入的两个全新硬件单元——Opacity Micro-Map引擎和Displaced Micro-Mesh引擎,大幅度提升了光线追踪的计算表现,则使得全景光线追踪得以实现,从而带来更为逼真的阴影及纹理细节,

▲第三代RT Core结构示意图,相比前代,增加了2个功能

  Ada Lovelace架构核心配备的第四代Tensor Core则是引入了来自专业级H100数据中心GPU的 FP8 Transformer 引擎带来了更加强悍的AI算力。这部分AI算力的提升不仅在DLSS 3技术中有所发挥,也可以使得其在AIGC的内容生产上拥有更好的表现。

  Ada Lovelace架构核心的升级也带来了Shader Execution Reordering(SER/着色器执行重排序)技术来更好的对于着色器的工作进行调度排序,在使用上可以根据不同的负载需求来执行渲染,可对负载较为统一的画面进行渲染,降低工作开销。

▲SER 着色器执行重排序

  Ada Lovelace架构核心还配备有全新的第八代NVENC硬件编码器,这一全新的第八代NVENC编码器在支持传统的H.265等格式之外,整合了对AV1视频编码格式的支持,有效提升了在视频内容创作方面的生产力表现。

  Ada Lovelace架构核心在提供了诸如SER技术、全局光线追踪技术、AV1格式等方面的提升以外,还在现阶段显存带宽提升有限的情况下,大幅度提升了Die上的L2缓存容量,从而带来数据命中率的有效提升,为光线追踪等相关性能场景的表现带来更高的收益。

DLSS 3

  Ada Lovelace架构核心的升级也使得RTX 40系列显卡得以通过DLSS 3技术来进一步获得相关的表现提升。根据NVIDIA官方的介绍,DLSS 3技术由DLSS 2(DLSS 超分辨率技术)+DLSS 帧生成技术+NVIDIA Reflex这三方面所共同组成。

  DLSS 3帧生成技术依赖于Ada Lovelace架构核心的独立光流处理器以及Tensor Core的AI算力,这一项技术在运作过程中,将通过光流处理器所得到的一系列数据,以光流加速技术(Optical Flow Acceleration,简称为OFA)以及Tensor Core所提供的AI算力来进演算画面内容以及进行画面的优化,从而实现帧数上的提升。

  DLSS 3帧生成技术可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程。而通过这一个流程的循环,可在提升帧数的同时节省资源开销,进一步带来更好游戏体验。

  DLSS 3帧生成技术可以极大提升游戏的帧数表现,但由于可能带来延迟的增加,因此DLSS 3中帧生成技术的开启需要整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟,从而带来帧数更高且流畅性更佳的体验。根据NVIDIA官方的说法,DLSS 3帧生成技术配合NVIDIA Reflex,可使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。

GeForce RTX 4070

  GeForce RTX 4070显卡采用了AD 104-250核心,这一核心为TSMC 4N工艺进行制造,其芯片面积以及晶体管密度与RTX 4070 Ti的AD 104-400核心一致,芯片面积为294.5 平方毫米、晶体管密度为358亿。

  不过值得注意的是,虽然GeForce RTX 4070采用的AD 104-250核心其面积与晶体管密度和RTX 4070 Ti的AD 104-400核心一致。但通过架构图我们可以看到,AD 104-250核心相比较于 AD 104-400核心少了1组GPC+1组TPC,合计少了14组SM(流式多处理器)。

  ▲RTX 4070 Ti采用的AD104-400核心架构切片

▲RTX 4070采用的AD104-250核心架构切片

  显存方面, RTX 4070与RTX 4070 Ti保持了一致,均为192 bit位宽、21Gbps的显存速率、12GB的 GDDR6X显存容量以及504.2GB/s的显存总带宽。虽然仅从参数看显存位宽较RTX 3070 Ti有所下降,但由于这一代的二级缓存来到了36MB(为上一代的9倍),所以RTX 4070对于显存带宽的依赖性已经大大降低,从理论来说是完全可以轻松超越上一代同级的RTX 3070 Ti的。

02/ 外观拆解

  本期我们拿到的耕升GeForce RTX 4070 踏雪显卡,对应的是原先入门定位的的追风系列,价格采用了NVIDIA官方的4799元起步价,不过换上了全新的纯白配色,也为追求性价比的玩家带来全新的视觉风格,整卡尺寸为315*122*40mm(不含挡板)。

  显卡正面采用了三个92mm 而且经优化的耕升专用「炫风之刃」扇叶,经改良后提升风流量,并减低声噪,有效加强散热。

  显卡背板同样以白色为底色,背板右方的做了大面积的镂空,配合散热器上第三组风扇的风流直接穿透散热鳍片以及镂空的PCB设计,进一步提升散热效率。

  耕升GeForce RTX 4070 踏雪采用了传统的单8 Pin供电接口,使用非PCIe 5.0的电源也能直插白色模组线,不需要转接,对于使用纯白主题机箱的用户来说非常友好。供电旁边还有一个显卡灯效同步接口。

耕升GeForce RTX 4070 踏雪采用了标准的双槽设计,整卡厚度仅为40mm,在紧凑型的机箱中安装有更良好的兼容性。显卡侧边挡板提供了3个DP 1.4a和1个HDMI 2.1a接口,前者至高可支持4K@240Hz或8K@60Hz超清输出。

  位于显卡顶部的耕升ARGB炫光LOGO,可通过附赠的灯光同步线来支持主流板厂的神光同步功能。

  通过升级版GW-SOUL调控软件,玩家可以轻松实现性能监控、超频设置、ARGB灯效操控等。

  耕升GeForce RTX 4070 踏雪的散热器内部配备了大面积的紧密散热鳍片,以及4根6mm复合式热导管,导管还加入了抗氧化镀镍设计。底座与GPU核心接触的部分采用了更加高效的散热铜板。

  耕升GeForce RTX 4070 踏雪采用8层PCB设计,短小的面积为镂空散热提供了更充分的空间,PCB上面共有8相核心供电和2相显存供电。

  PCB正中间为AD104-250-A1核心,核心周围是6颗镁光GDDR6X显存,组成了12GB的容量,显存为192 bit,等效显存频率为21 Gbps。

03/ 基准测试

  测试平台选用了目前主流的i7-13700KF处理器和DDR5-6400内存的组合。

  从GPU-Z的信息可以看到,耕升GeForce RTX 4070 踏雪的加速频率达到2535MHz,相比公版高了60MHz,同时TGP功耗也对应提升至215W。

  从理论测试来看,综合FSE和TS两项2K测试成绩来说,耕升GeForce RTX 4070 踏雪相比RTX 3070 Ti的OC非公版性能提升在20%以上,同时光追游戏性能提升约25%。

  在3DMark 2K质量档为的DLSS性能测试里,耕升GeForce RTX 4070 踏雪的DLSS 2帧率高出近25%,开启DLSS 3后帧率差距更是能够拉大到50%。

04/ 游戏测试

  首先在三款热门的吃鸡类FPS网游中,耕升GeForce RTX 4070 踏雪均能满足全高画质2K 144Hz的电竞帧率要求,对比RTX 3070 Ti也基本符合20%左右的理论提升幅度。

  在以下三款以光栅化渲染为主的3A大作中,耕升GeForce RTX 4070 踏雪也都可以跑到100帧以上,另外对于支持DLSS 2超分辨率的游戏,开启功能后帧率还能更进一步提升至144帧级别。

  支持完整光线追踪渲染的游戏对性能有着更为严苛的要求,可以看到在不具备DLSS技术支持的情况下,耕升GeForce RTX 4070 踏雪在运行2K光追画质时,大多很难达到60帧的流畅水准。

  不过在开启DLSS 3帧生成功能后,即便是原生2K下只有十几帧的《传送门RTX》也达到了2K60帧的流畅标准,部分游戏甚至可以获得超过100帧的表现。与此同时,在NVIDIA Reflex技术的加持下,游戏在插帧过程中的画面延迟甚至比原生还要更低。

  相比起仅支持DLSS 2技术的RTX 3070 Ti而言,耕升GeForce RTX 4070 踏雪在DLSS 3下的帧率表现进一步拉开了差距,如在《赛博朋克:2077》当中近乎拥有翻倍的提升。

  另外值得注意的是,RTX 3070 Ti的显存容量仅有8GB,在光追重制版的《巫师3》全高画质下疑似出现了爆显存的情况,导致画面帧率异常低,而拥有12GB显存的RTX 4070则未出现这一问题。

05/ 直播及内容创作测试

  除了游戏以外,如今从游戏主播、内容创作者,到视频编辑、3D 建模和渲染等生产力工作,同样离不开 GPU 的性能支持。

  在渲染能力方面,我们先围绕 V-Ray5 进行,在 CUDA和RTX两个渲染场景中,耕升GeForce RTX 4070踏雪显卡相对 GeForce RTX 3070 Ti 分别提升了17%和45%。

  RTX系列显卡的Tensor核心拥有强大的深度学习能力,可以高效完成AI绘图创作。这次测试我们使用Satble Diffusion应用运行AI程序,绘制20张718*718高清图片,并计算每分钟生成的张数。结果显示,RTX 4070平均每分钟可生成9.3张图片,对比RTX 3070 Ti效率也有32%的提升。

  在视频内容创作方面,GeForce RTX 40系列显卡还首次加入了 AV1 双编码器。AV1 编码是由英特尔、微软、亚马逊、谷歌、网飞等网络巨头组成的开放多媒体联盟 AOMedia 所推出的免费编码格式,在国内已经获得了剪映Pro、哔哩哔哩、爱奇艺的支持。它的特点是能在相同文件体积下拥有更高清的画质,或者相同清晰度的画质下拥有更小的体积。在传输同样质量的画面时候AV1对比传统H.264格式只需要大约70%的数据量。

AV1(左)和AVC(右)画质对比

  GeForce RTX 40系列显卡是目前市面上为数不多可以支持硬件AV1渲染加速的GPU。视频内容创作方面,在使用剪映Pro渲染同一段4K H.264视频的任务中,耕升GeForce RTX 4070踏雪显卡也比GeForce RTX 3070 Ti快了30%以上。实测渲染导出同一段AV1视频,其效率对比不支持AV1编码的RTX 30系列显卡(仅采用CPU软件编码)效率高了4倍左右。

  与此同时,AV1编码也可以用于OBS直播推流,在相同的码率和网络带宽下实现更高的画质。对视频主播而言,使用GeForce RTX系列显卡支持的Broadcast工具还可以一键实现人像跟踪、视频去噪、噪音和回声消除、消除/虚化背景等实用功能。

  英伟达在近期推出了一项重磅更新——RTX Video Super Resolution,这一项功能翻译过来就是视频超分辨率技术,简称VSR。它可以允许用户在播放视频时,以GPU配备的Tensor Core以及强悍的AI算力来进行内容的计算,从而提升画面分辨率,带来至高4K分辨率视频输出,为用户带来视频观感的提升。

  VSR功能目前可在30/40系列显卡上进行开启,用户能在英伟达控制面板内开启这一项功能的使用,其在70级别以上显卡提供了4档的VSR增强选项可供调整。这一项VSR功能可在Google Chrome(110.0.5481.105版本以上)或者Microsoft Edge(110.0.1587.56版本以上)播放视频时进行调用。

  我们也采用RTX 4070显卡对英伟达推出的VSR功能进行了实际的体验,首先选取的是在网页上播放480P的经典动画《猫和老鼠》,这一动画由于成片年代较早,因此画面在4K分辨率屏幕上的播放存在许多瑕疵。而通过开启VSR进行增强后,画面的细节有了明显的改善,并且画面的噪点有了明显的降低。在这里我们也通过截取同一帧画面,通过英伟达ICAT进行画面对比,方便各位感受到VSR 带来的画面效果提升。

  △左480P原生画面,右 480P RTX VSR 4X画面

  △左480P原生画面,右 480P RTX VSR 4X画面

  除了在网页端可以进行VSR的调用外,英伟达也在和不少的本地播放器进行合作,让用户在本地播放器也可以体验到VSR功能带来的提升。比如知名的开源播放软件VLC将会提供到VSR的功能支持,而我们也是提前拿到了VLC的内部测试版本进行了本地VSR播放的体验。

  在通过VLC本地播放《少女与战车》720P画面时,我们截取关闭与开启VSR功能的画面,通过ICAT进行了A/B画面对比。从对比中可看到,在VLC播放时开启VSR功能后,画面的噪点被进行了明显的压制,并且画面的线条整体更为锐利清晰,对于观感加成不少。

△左720P原生画面,右 720P RTX VSR 4X画面

△左720P原生画面,右 720P VSR 4X画面

06/ 功耗与散热表现

  耕升GeForce RTX 4070 踏雪在Time Spy压力测试中,以99.7%的成绩通过了测试,稳定性表现优异。

  FurMark 30分钟烤机测试中,耕升GeForce RTX 4070 踏雪的显卡功耗稳定在215W左右,核心温度63.5°C,显存温度52°C,散热性能相当不错,此时风扇转速约为1800转。

  值得注意的是,215W只是这张显卡的功耗上限,除了极限的烤机场景外,实际游戏中即使满载运行也往往达不到这么高,大多数情况下都运行在200W以内。

  也就是说,RTX 4070在游戏帧率显著提高的情况下,功耗相比RTX 3070 Ti还降低了近30%,足见其能耗比的优势显著。

07/ 总结

  对于目前广大正在使用2K屏幕的用户而言,RTX 4070不仅能提供稳定的144+电竞游戏帧率,而且在全新DLSS 3技术的加持下,光追游戏能够获得百帧的体验,相比同等画质只有60帧左右的及格水准的RTX 3070 Ti,流畅度可以说是有了质的飞跃。

  同时,新卡在视频渲染、3D、AI等生产力项目中,也能带来相当明显的效率提升,综合来说无疑比目前价位近似RTX 3070 Ti、RTX 3080都更加值得选购。

  而耕升GeForce RTX 4070 踏雪作为一款定位持平起售价的非公版显卡,不仅拥有强劲的散热,还给玩家带来了素雅的纯白配色以及5V RGB灯效,性价比相当不错。并且值得称道的是,它也充分地利用了这一代显卡低功耗的优势,采用了兼容性更佳的双槽设计,适合更多玩家装机时选择。

0人已赞

关注我们

泡泡网

手机扫码关注