耕升RTX 4070踏雪评测：素雅纯白配色，畅玩2K游戏性价比新选-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

耕升RTX 4070踏雪评测：素雅纯白配色，畅玩2K游戏性价比新选

2023年04月12日 21:05作者：陈沐梁编辑：陈沐梁文章出处：泡泡网原创

　　刚刚，NVIDIA正式发布了GeForce RTX 4070显卡，新卡号称拥有远超前代同档次的性能，将带来1440P光追游戏100帧的表现，下面我们就来实测看看它的表现究竟如何，又是否成为使用2K屏的玩家们更具性价比的选择。

01/ Ada Lovelace架构与GeForce RTX 4070

AD104核心

　　GeForce RTX 4070采用了与GeForce RTX 4070 Ti同款的AD104核心，该系列GPU核心基于台积电4N定制工艺与全新的Ada Lovelace架构打造，在性能、能耗比等方面带来了飞跃式的进步。

　　Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。据了解，Ada Lovelace架构核心所采用的新一代SM（流式多处理器）带来了至高2倍的性能以及能效提升。

　　▲Ada Lovelace架构核心 SM结构图

　　Ada Lovelace架构核心在RT Core上引入的两个全新硬件单元——Opacity Micro-Map引擎和Displaced Micro-Mesh引擎，大幅度提升了光线追踪的计算表现，则使得全景光线追踪得以实现，从而带来更为逼真的阴影及纹理细节，

▲第三代RT Core结构示意图，相比前代，增加了2个功能

　　Ada Lovelace架构核心配备的第四代Tensor Core则是引入了来自专业级H100数据中心GPU的 FP8 Transformer 引擎带来了更加强悍的AI算力。这部分AI算力的提升不仅在DLSS 3技术中有所发挥，也可以使得其在AIGC的内容生产上拥有更好的表现。

　　Ada Lovelace架构核心的升级也带来了Shader Execution Reordering（SER/着色器执行重排序）技术来更好的对于着色器的工作进行调度排序，在使用上可以根据不同的负载需求来执行渲染，可对负载较为统一的画面进行渲染，降低工作开销。

▲SER 着色器执行重排序

　　Ada Lovelace架构核心还配备有全新的第八代NVENC硬件编码器，这一全新的第八代NVENC编码器在支持传统的H.265等格式之外，整合了对AV1视频编码格式的支持，有效提升了在视频内容创作方面的生产力表现。

　　Ada Lovelace架构核心在提供了诸如SER技术、全局光线追踪技术、AV1格式等方面的提升以外，还在现阶段显存带宽提升有限的情况下，大幅度提升了Die上的L2缓存容量，从而带来数据命中率的有效提升，为光线追踪等相关性能场景的表现带来更高的收益。

DLSS 3

　　Ada Lovelace架构核心的升级也使得RTX 40系列显卡得以通过DLSS 3技术来进一步获得相关的表现提升。根据NVIDIA官方的介绍，DLSS 3技术由DLSS 2(DLSS 超分辨率技术)+DLSS 帧生成技术+NVIDIA Reflex这三方面所共同组成。

　　DLSS 3帧生成技术依赖于Ada Lovelace架构核心的独立光流处理器以及Tensor Core的AI算力，这一项技术在运作过程中，将通过光流处理器所得到的一系列数据，以光流加速技术（Optical Flow Acceleration，简称为OFA）以及Tensor Core所提供的AI算力来进演算画面内容以及进行画面的优化，从而实现帧数上的提升。

　　DLSS 3帧生成技术可直接生成游戏第1帧3/4的像素以及整个游戏第2帧，相当于使用1/8的算力，就完成了整个计算过程。而通过这一个流程的循环，可在提升帧数的同时节省资源开销，进一步带来更好游戏体验。

　　DLSS 3帧生成技术可以极大提升游戏的帧数表现，但由于可能带来延迟的增加，因此DLSS 3中帧生成技术的开启需要整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟，从而带来帧数更高且流畅性更佳的体验。根据NVIDIA官方的说法，DLSS 3帧生成技术配合NVIDIA Reflex，可使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。

GeForce RTX 4070

　　GeForce RTX 4070显卡采用了AD 104-250核心，这一核心为TSMC 4N工艺进行制造，其芯片面积以及晶体管密度与RTX 4070 Ti的AD 104-400核心一致，芯片面积为294.5 平方毫米、晶体管密度为358亿。

　　不过值得注意的是，虽然GeForce RTX 4070采用的AD 104-250核心其面积与晶体管密度和RTX 4070 Ti的AD 104-400核心一致。但通过架构图我们可以看到，AD 104-250核心相比较于 AD 104-400核心少了1组GPC+1组TPC，合计少了14组SM（流式多处理器）。

　　▲RTX 4070 Ti采用的AD104-400核心架构切片

▲RTX 4070采用的AD104-250核心架构切片

　　显存方面， RTX 4070与RTX 4070 Ti保持了一致，均为192 bit位宽、21Gbps的显存速率、12GB的 GDDR6X显存容量以及504.2GB/s的显存总带宽。虽然仅从参数看显存位宽较RTX 3070 Ti有所下降，但由于这一代的二级缓存来到了36MB（为上一代的9倍），所以RTX 4070对于显存带宽的依赖性已经大大降低，从理论来说是完全可以轻松超越上一代同级的RTX 3070 Ti的。

02/ 外观拆解

　　本期我们拿到的耕升GeForce RTX 4070 踏雪显卡，对应的是原先入门定位的的追风系列，价格采用了NVIDIA官方的4799元起步价，不过换上了全新的纯白配色，也为追求性价比的玩家带来全新的视觉风格，整卡尺寸为315*122*40mm（不含挡板）。

　　显卡正面采用了三个92mm 而且经优化的耕升专用「炫风之刃」扇叶，经改良后提升风流量，并减低声噪，有效加强散热。

　　显卡背板同样以白色为底色，背板右方的做了大面积的镂空，配合散热器上第三组风扇的风流直接穿透散热鳍片以及镂空的PCB设计，进一步提升散热效率。

　　耕升GeForce RTX 4070 踏雪采用了传统的单8 Pin供电接口，使用非PCIe 5.0的电源也能直插白色模组线，不需要转接，对于使用纯白主题机箱的用户来说非常友好。供电旁边还有一个显卡灯效同步接口。

耕升GeForce RTX 4070 踏雪采用了标准的双槽设计，整卡厚度仅为40mm，在紧凑型的机箱中安装有更良好的兼容性。显卡侧边挡板提供了3个DP 1.4a和1个HDMI 2.1a接口，前者至高可支持4K@240Hz或8K@60Hz超清输出。

　　位于显卡顶部的耕升ARGB炫光LOGO，可通过附赠的灯光同步线来支持主流板厂的神光同步功能。

　　通过升级版GW-SOUL调控软件，玩家可以轻松实现性能监控、超频设置、ARGB灯效操控等。

　　耕升GeForce RTX 4070 踏雪的散热器内部配备了大面积的紧密散热鳍片，以及4根6mm复合式热导管，导管还加入了抗氧化镀镍设计。底座与GPU核心接触的部分采用了更加高效的散热铜板。

　　耕升GeForce RTX 4070 踏雪采用8层PCB设计，短小的面积为镂空散热提供了更充分的空间，PCB上面共有8相核心供电和2相显存供电。

　　PCB正中间为AD104-250-A1核心，核心周围是6颗镁光GDDR6X显存，组成了12GB的容量，显存为192 bit，等效显存频率为21 Gbps。

03/ 基准测试

　　测试平台选用了目前主流的i7-13700KF处理器和DDR5-6400内存的组合。

　　从GPU-Z的信息可以看到，耕升GeForce RTX 4070 踏雪的加速频率达到2535MHz，相比公版高了60MHz，同时TGP功耗也对应提升至215W。

　　从理论测试来看，综合FSE和TS两项2K测试成绩来说，耕升GeForce RTX 4070 踏雪相比RTX 3070 Ti的OC非公版性能提升在20%以上，同时光追游戏性能提升约25%。

　　在3DMark 2K质量档为的DLSS性能测试里，耕升GeForce RTX 4070 踏雪的DLSS 2帧率高出近25%，开启DLSS 3后帧率差距更是能够拉大到50%。

04/ 游戏测试

　　首先在三款热门的吃鸡类FPS网游中，耕升GeForce RTX 4070 踏雪均能满足全高画质2K 144Hz的电竞帧率要求，对比RTX 3070 Ti也基本符合20%左右的理论提升幅度。

　　在以下三款以光栅化渲染为主的3A大作中，耕升GeForce RTX 4070 踏雪也都可以跑到100帧以上，另外对于支持DLSS 2超分辨率的游戏，开启功能后帧率还能更进一步提升至144帧级别。

　　支持完整光线追踪渲染的游戏对性能有着更为严苛的要求，可以看到在不具备DLSS技术支持的情况下，耕升GeForce RTX 4070 踏雪在运行2K光追画质时，大多很难达到60帧的流畅水准。

　　不过在开启DLSS 3帧生成功能后，即便是原生2K下只有十几帧的《传送门RTX》也达到了2K60帧的流畅标准，部分游戏甚至可以获得超过100帧的表现。与此同时，在NVIDIA Reflex技术的加持下，游戏在插帧过程中的画面延迟甚至比原生还要更低。

　　相比起仅支持DLSS 2技术的RTX 3070 Ti而言，耕升GeForce RTX 4070 踏雪在DLSS 3下的帧率表现进一步拉开了差距，如在《赛博朋克：2077》当中近乎拥有翻倍的提升。

　　另外值得注意的是，RTX 3070 Ti的显存容量仅有8GB，在光追重制版的《巫师3》全高画质下疑似出现了爆显存的情况，导致画面帧率异常低，而拥有12GB显存的RTX 4070则未出现这一问题。

05/ 直播及内容创作测试

　　除了游戏以外，如今从游戏主播、内容创作者，到视频编辑、3D 建模和渲染等生产力工作，同样离不开 GPU 的性能支持。

　　在渲染能力方面，我们先围绕 V-Ray5 进行，在 CUDA和RTX两个渲染场景中，耕升GeForce RTX 4070踏雪显卡相对 GeForce RTX 3070 Ti 分别提升了17%和45%。

　　RTX系列显卡的Tensor核心拥有强大的深度学习能力，可以高效完成AI绘图创作。这次测试我们使用Satble Diffusion应用运行AI程序，绘制20张718*718高清图片，并计算每分钟生成的张数。结果显示，RTX 4070平均每分钟可生成9.3张图片，对比RTX 3070 Ti效率也有32%的提升。

　　在视频内容创作方面，GeForce RTX 40系列显卡还首次加入了 AV1 双编码器。AV1 编码是由英特尔、微软、亚马逊、谷歌、网飞等网络巨头组成的开放多媒体联盟 AOMedia 所推出的免费编码格式，在国内已经获得了剪映Pro、哔哩哔哩、爱奇艺的支持。它的特点是能在相同文件体积下拥有更高清的画质，或者相同清晰度的画质下拥有更小的体积。在传输同样质量的画面时候AV1对比传统H.264格式只需要大约70%的数据量。

AV1（左）和AVC（右）画质对比

　　GeForce RTX 40系列显卡是目前市面上为数不多可以支持硬件AV1渲染加速的GPU。视频内容创作方面，在使用剪映Pro渲染同一段4K H.264视频的任务中，耕升GeForce RTX 4070踏雪显卡也比GeForce RTX 3070 Ti快了30%以上。实测渲染导出同一段AV1视频，其效率对比不支持AV1编码的RTX 30系列显卡（仅采用CPU软件编码）效率高了4倍左右。

　　与此同时，AV1编码也可以用于OBS直播推流，在相同的码率和网络带宽下实现更高的画质。对视频主播而言，使用GeForce RTX系列显卡支持的Broadcast工具还可以一键实现人像跟踪、视频去噪、噪音和回声消除、消除/虚化背景等实用功能。

　　英伟达在近期推出了一项重磅更新——RTX Video Super Resolution，这一项功能翻译过来就是视频超分辨率技术，简称VSR。它可以允许用户在播放视频时，以GPU配备的Tensor Core以及强悍的AI算力来进行内容的计算，从而提升画面分辨率，带来至高4K分辨率视频输出，为用户带来视频观感的提升。

　　VSR功能目前可在30/40系列显卡上进行开启，用户能在英伟达控制面板内开启这一项功能的使用，其在70级别以上显卡提供了4档的VSR增强选项可供调整。这一项VSR功能可在Google Chrome（110.0.5481.105版本以上）或者Microsoft Edge（110.0.1587.56版本以上）播放视频时进行调用。

　　我们也采用RTX 4070显卡对英伟达推出的VSR功能进行了实际的体验，首先选取的是在网页上播放480P的经典动画《猫和老鼠》，这一动画由于成片年代较早，因此画面在4K分辨率屏幕上的播放存在许多瑕疵。而通过开启VSR进行增强后，画面的细节有了明显的改善，并且画面的噪点有了明显的降低。在这里我们也通过截取同一帧画面，通过英伟达ICAT进行画面对比，方便各位感受到VSR 带来的画面效果提升。

　　△左480P原生画面，右 480P RTX VSR 4X画面

　　除了在网页端可以进行VSR的调用外，英伟达也在和不少的本地播放器进行合作，让用户在本地播放器也可以体验到VSR功能带来的提升。比如知名的开源播放软件VLC将会提供到VSR的功能支持，而我们也是提前拿到了VLC的内部测试版本进行了本地VSR播放的体验。

　　在通过VLC本地播放《少女与战车》720P画面时，我们截取关闭与开启VSR功能的画面，通过ICAT进行了A/B画面对比。从对比中可看到，在VLC播放时开启VSR功能后，画面的噪点被进行了明显的压制，并且画面的线条整体更为锐利清晰，对于观感加成不少。

△左720P原生画面，右 720P RTX VSR 4X画面

△左720P原生画面，右 720P VSR 4X画面

06/ 功耗与散热表现

　　耕升GeForce RTX 4070 踏雪在Time Spy压力测试中，以99.7%的成绩通过了测试，稳定性表现优异。

　　FurMark 30分钟烤机测试中，耕升GeForce RTX 4070 踏雪的显卡功耗稳定在215W左右，核心温度63.5°C，显存温度52°C，散热性能相当不错，此时风扇转速约为1800转。

　　值得注意的是，215W只是这张显卡的功耗上限，除了极限的烤机场景外，实际游戏中即使满载运行也往往达不到这么高，大多数情况下都运行在200W以内。

　　也就是说，RTX 4070在游戏帧率显著提高的情况下，功耗相比RTX 3070 Ti还降低了近30%，足见其能耗比的优势显著。

07/ 总结

　　对于目前广大正在使用2K屏幕的用户而言，RTX 4070不仅能提供稳定的144+电竞游戏帧率，而且在全新DLSS 3技术的加持下，光追游戏能够获得百帧的体验，相比同等画质只有60帧左右的及格水准的RTX 3070 Ti，流畅度可以说是有了质的飞跃。

　　同时，新卡在视频渲染、3D、AI等生产力项目中，也能带来相当明显的效率提升，综合来说无疑比目前价位近似RTX 3070 Ti、RTX 3080都更加值得选购。

　　而耕升GeForce RTX 4070 踏雪作为一款定位持平起售价的非公版显卡，不仅拥有强劲的散热，还给玩家带来了素雅的纯白配色以及5V RGB灯效，性价比相当不错。并且值得称道的是，它也充分地利用了这一代显卡低功耗的优势，采用了兼容性更佳的双槽设计，适合更多玩家装机时选择。

0人已赞

耕升RTX 4070踏雪评测：素雅纯白配色，畅玩2K游戏性价比新选

关注我们