开启游戏画质新时代 NVIDIA RTX 2080/2080Ti显卡首发评测
就像刚刚过去的苹果发布会一样,NVIDIA每一代的新旗舰显卡的发布在玩家心目中也完全可以被当做一场“科技春晚”,只不过最近的“春晚”周期横跨了2016-2018三个年头,间隔长达两年零三个月。或许也只有这样一个破纪录的更新周期才能消化2016年5月发布会上Pascal架构产品那令人震惊的性能跨越。这也让我们看到老黄在2018年新品发布会上拿出新款“核弹”时有了更多的期待。按照惯例,笔者在第一时间拿到了这两款国内外玩家翘首以盼的新显卡——”GeForce RTX 2080Ti和GeForce RTX 2080“。
规格参数一览
以TU102和GP102核心为例,从规格上来看,CUDA核心的数量增长并不是非常夸张,相对而言最大的变化就是增加了用于光线追踪的RT Cores 和深度学习用的Tensor Cores。这也是这一代显卡最重量级的升级。新成员的加入也让图灵架构的显卡核心面积大幅度增加。TU102相比GP102在面积上就增加了60%。相应的频率也有所增加,但幅度相对较小。
TU102核心透视实拍
TU102的晶体管数量达到了186亿,而前一代GTX 1080Ti所使用的GP102则只有118亿,增加了57%。这颗GPU核心也顺理成章成为了目前规模最大的游戏显卡核心。巨大的规模带来的副作用就是潜在的功耗和发热量的增加。
相比两年前Pascal时代28nm到14/16nm工艺的巨大工艺红利来说,这一代从16nm 到12nm 的提升幅度就没那么夸张,一定意义上来说,台积电以及三星的12nm工艺更多的是在之前14/16nm工艺基础上的小改成果。所以虽然有一定的效果,但对于NVIDIA来说并不会有太多频率和发热控制上的显著进步。
RTX6000采用的完整TU102核心拥有72个SM单元,而很不幸的是RTX2080Ti阉割掉了4个SM单元,仅有68组。相应的内存控制器也阉割掉了一组,剩下11个,整体的策略和GTX 1080Ti时期对GP102的“刀法”完全一致。
每一组SM单元中都配备了一个RT Core,以及两两成对的TENSOR Cores。可以看出,事实上这一代FP32和INT32单元所占据的比例其实相对不那么高。可以说这一代是近几年来,在底层变化最大的一代产品。
如果细化到Tensor Core本身,图灵架构的Tensor Core相对于Pascal上搭载的相同结构的最大变化就是将处理方式从2D平面升级到了3D,这意味着以数量级计的效率提升。
GDRR6显存:求稳之举
出乎很多人意料的是NVIDIA在这一代产品中并没有使用大家所期待的性能强大的HBM2显存。继续使用了最新的DDR显存,也就是GDDR6显存。
架构上没有多少变化的GDDR6是基于前一代产品的继续优化产物,通过提升频率到7000MHz(等效14000MHz)将带宽提升到了14Gbps的水平,同时降低了40%的串扰。虽然性能仍然不可能与HBM相比,但胜在成本低,良率高,可以持续大规模供货,不至于出现被显存拖累的窘境。
前文我们说到,RT Cores占用了很大的核心面积,而这些单元并不会提升传统的光栅渲染效能。他们的用途要比单独提升游戏的FPS值更有价值。基于这些单元,NVIDIA在这一代显卡产品中加入了酝酿多年的“实时光线追踪”(RTX)技术。这也是为什么这一代显卡产品的命名从“GTX”变成“RTX”的原因。
光线追踪与实时光线追踪
传统的光栅化渲染其实将一个3D图形的几何信息转变为一个个栅格组成的2D图像的过程,可以理解为在这个3D图形的每个点都包含有颜色、深度以及纹理数据,经过一系列计算变换后,将其转换为2D图像的像素,进而呈现在显示设备上。更多的是一种基于作者认为“这里应该有这个”的创作性质的图形渲染方式,一定以上来说就是已知结果并把结果写出来,而并不能知道这个结果是正确的还是错误的。
而光线追踪技术则是通过通过光源位置、射线、和物体关系进行真实的光线模拟运算,来得出这里应该有哪些光线,有怎样的反射关系。这样得出的游戏画面的光影效果也就更加真实。
光线追踪在以往游戏中的应用都是在游戏的制作中提前进行运算,将得出的结果写到游戏程序中,显卡所做的也仅仅是将已经写好的“台词”念出来。这样的做法意味着无法实现大量且精细的光线追踪,那将意味着海量的计算过程和无比巨大的供调用的结果数据。
而“实时光线追踪”就是将光线追踪的运算过程拿到游戏过程中来,实时地计算出光线应该投影和反射形成的效果。如果性能足够强大,不仅可以在同样的场景中做到更高数量级的光线追踪效果,游戏画面可以得到显著的提高,还能大幅度降低游戏开发者的运算量。
如果把图形渲染比喻成一场数学考试,那么光栅化渲染基本上约等于不会做题目所有的选项都靠“三短一长选最长”的直觉来回答;而“光线追踪”则是将尽可能多的题目死记硬背,靠题海战术来完成答卷;而“实时光线追踪”(RTX)技术则是将做题的方式学会,通过聪明的大脑来运算解决遇到的每一个题目。这样毫无疑问,最后一种方式所得到的分数必然要远胜前两者。
落实到游戏的话,目前支持光线追踪的游戏并不多,近期《古墓丽影:暗影》虽然已经承诺支持,但并未在首发版本中加入。而另一款NVIDIA演示的RTX游戏《战地V》也延期上市。所以目前还不能玩到支持实时光线追踪技术的游戏。但是相信不久的将来,在NVIDIA的推动下,会有更多的支持RTX技术的游戏来到我们面前。
靠“脑补”的DLSS技术
科隆发布会上占据时长同样多的还有全新的基于AI人工智能技术的“深度学习超级采样”(DLSS)技术。这也是图灵GPU核心中的那些Tensor Core的用途所在。
原理是这样的,NVIDIA 使用自己的超级计算机以64 倍于标准分辨率的分辨率运行游戏,绘制出极多的超高画质的画面,再用一定的方式挑选出一些细分画面作为完美渲染的“标准答案”。然后通过DLSS深度学习,将标准分辨率的画面和这些画面进行对比,生成一张最优画面,然后再与全尺寸(64倍超采样)进行对比,得出差别,然后将这些差别反推到神经网络中,进行循环训练。在几轮之后就人工智能网络就可以学会如何将标准画面渲染到接近64倍分辨率原图的方法。
这些学习结果定期通过软件更新提供给图灵GPU的显卡,通过Tensor Cores,就可以进行实时比对,将较低分辨率的画面“脑补”为正确的高分辨率画面,从而实现画面细节的提升。超采样也消灭了画面中可能存在的锯齿。
最终的效果就是,要得出一个4K分辨率的高画质反锯齿画面,通过DLSS技术并不需要真的在4K分辨率下渲染画面,实际渲染一个低分辨率画面,通过DLSS技术即可达到需要的效果。这样不仅画质有所保证,还可以大幅度降低游戏的性能需求,游戏的运行效率将大幅度提升。
虽然效率提升,但画质方面却并不会因为DLSS技术而受到损失,相反的,相比TAA(时间性反锯齿),DLSS技术大量的机器学习可以避免拖影和细节错位,从而获得更好的反锯齿效果。
相比需要更深度技术基础的实时光线追踪而言,DLSS更加容易实现,所以很多现有的游戏很快就可以经过NVIDIA的运算后支持DLSS技术,运行效率,尤其是4K下的性能会显著提升。目前NVIDIA承诺的DLSS技术游戏包括《绝地求生》《古墓丽影:暗影》《剑侠情缘三》等众多我们熟悉的作品。
不过由于需要硬件层面的支持,DLSS技术也是图灵架构GPU的专属功能。后续的基准测试中,我们会有针对DLSS技术的实测数据。
我们拿到了来自NVIDIA官方的公版,也就是Founders Edition(创始人版)。我们通过两张显卡的对比拆解来了解一下新一代公版显卡的设计有什么变化。
新一代的包装盒保持了之前一贯的设计风格。
首先最大的变化就是从前几代的涡轮散热方式更换成了被网友戏称为“煤气灶”的双风扇散热器。这样做的原因毫无疑问是之前"泰坦皮"散热器的效能问题造成GTX 1080Ti公版产品动辄85℃以上的高温,同时也意味着这一代显卡产品的发热值得关注。毕竟这是历史上规模最大的一颗游戏GPU核心。
一体化铝合金背板做工优秀,质感极强,颜值非常高,不仅起到加固作用,良好的导热效率也有一定的散热效果。
外壳同样也大量采用了铝合金CNC倒角,塑料件的比例相当有限,所以整体显得更加扎实并且有着十分不错的观感。
接口部分最大的变化在于额外的一个Type-C视频接口,用于VR头显的接驳,可以提供35W的对外供电。除此之外,DP1.4a和HDMI2.0b接口可以完美支持4K HDR显示器的输出和多屏连接。
显卡厚度方面,RTX 2080Ti相比RTX 2080略厚约2mm左右,这与散热器的效能需求有一定关系。
由于TDP的不同,RTX 2080Ti选择了8+8Pin供电,而RTX 2080则只有8+6Pin。这张图也可以比啊较明显的看出散热器厚度的差别。
NV Link接口采用了隐藏式设计,专门配备了一个做工精致的保护罩,不使用时可以完美隐藏金手指,避免氧化的同时也照顾到了美观需求。
散热器采用了全尺寸均热板设计,可谓下足了功夫,成本上相对于以往的泰坦皮涡轮散热器要高上不少,当然散热能力也值回票价。
RTX 2080Ti PCB
RTX 2080Ti的供电规模达到了14相,达到了公版显卡的新高度,也超越了以往很多非公版的GTX 1080Ti。一扫以往公版显卡供电用料羸弱的印象,并且此次PCB的做工相比前代Pascal系列有着相当明显的提高。而RTX 2080供电规模也达到了10相,同样相对“奢华”。
据厂商介绍,此次TU102显示核心背部的元器件密度和数量已经超越了很多集成度非常高的手机主板,对工艺要求极高。
RTX 2080Ti的核心代号为TU102-300A-K-A1,产地为韩国三星。
而RTX 2080所使用的TU104-400A-A1产地则为台湾,代工厂为台积电。
二者使用的显存均为镁光生产。
整体来看,这是NVIDIA公版显卡近些年来无论是做工、用料、外观、还是散热能力都是最给力的一款,相对于非公版产品更高的售价也是有一定道理的。
为了给时隔两年的全新一代显卡的首测做准备,我们准备了一套性能强悍且十分有针对性的测试平台。
处理方面我们使用了6核心12线程,最高睿频达到5GHz的酷睿i7-8086K处理器,搭配双通道DDR4 2933MHz的16GB内存。
为了更好的展现4K HDR的游戏画面,我们特意找到了一台来自明基的PD2700U显示器,这是一款27英寸的超窄边框4K HDR显示器产品。采用标准16:9比例的3840x2160分辨率原生10bit面板,并支持HDR10标准。色域方面达到了99% sRGB,除了游戏之外,专业修图也可以胜任。支架也支持旋转升降,使用十分方便。
电源方面我们使用了一款来自NZXT的E850全模组电源,额定功率达到850W,转化率达到80Plus金牌认证标准,当然我们选择它的主要原因是自带了负载软件监测功能,可以非常方便地查看显卡、CPU等硬件的实时功耗情况。很方便我们对显卡的功耗情况进行监测。
3DMark
首先是传统的3DMark测试:
在基于DX11的Firestrike测试中,RTX 2080Ti显卡相对于GTX 1080Ti有着约20%的性能优势。而RTX 2080则相对于GTX 1080有着26-28%的性能提升,而相对于GTX 1080Ti有着5%左右的差距。
而来到DX12测试中,RTX 2080Ti的性能优势大幅度扩大,相比GTX 1080Ti有着高达44%和43%的性能优势。反观RTX2080,则相对GTX 1080有着38%和51%的性能提升。
Unigine Valley1.0
Valley是一款常用的DX11图形性能测试工具,包含大量先进的画面技术。
在手动开启最高画质并设定3840x2160分辨率开启8x反锯齿后,Valley的测试成绩如图所示,基本上与3DMark Firestrike的测试结果保持一致。RTX 2080Ti 20%左右的性能优势,并且RTX 2080的表现扔略逊于GTX 1080Ti。
DLSS技术效能测试
我们使用《最终幻想15》的DLSS Benchmark程序进行了开启和关闭DLSS技术的对比测试。分辨率为3840x2160。
可以看到,在未开启DLSS的情况下,RTX 2080Ti相比GTX 1080Ti有25%左右的优势,而开启DLSS之后,RTX 2080Ti的得分提升了高达39%。相对于GTX 1080Ti的性能优势扩大到惊人的75%。甚至RTX 2080开启 DLSS之后的成绩也提升了38%,超过GTX 1080Ti 44%,相对于GTX 1080的优势更是毫无意外的达到了63.7%!
由此可见,DLSS技术毫无疑问可以显著提升游戏的运行效能,不过这样的性能释放还需要游戏的支持才能解锁,让我们一起期待DLSS技术在游戏产业的普及吧。
NVIDIA前段时间宣称新一代的图灵显卡可以完美征服4K分辨率的高画质大作,那么我们就挑选几款高画质大作进行一番4K游戏的测试。
在实际游戏中,RTX2080Ti展现了新一代的旗舰的性能水准,相对于GTX 1080Ti的优势基本上在20-25%之间,而RTX 2080则波动较大,总体相比GTX 1080的提升幅度在30-40%,表现不错。
可以看出,这一代显卡在现有非DLSS游戏中的提升没有上一代Pascal和Maxwell换代时的惊艳。表现基本上向上进步了一档,次旗舰RTX 2080战平前代旗舰GTX 1080Ti。但必须强调的是这都是在DLSS和RTX技术没有引入的情况下得出的结论,未来如果有足够多的DLSS游戏上市,我们还会再一次进行类似的测试,与此次的结论相比照,得出相应的最终结论。
功耗测试
我们使用FurMark进行压力测试,设定为2560x1440分辨率。通过NZXT电源自带的CAM软件捕捉最高功耗值。
由于此时CPU为空载状态,CPU负载维持在20W以下。另外此时显卡的功耗数据仅代表PCI-E供电线所提供的功率,不包含PCI-E插槽的供电部分。
如果计算CPU满载时约100W的功耗水平,那么RTX 2080Ti整机的峰值功耗将超过400W,那么一款500W额定功率并且转化率良好的电源是最低标准,如果考虑到一些冗余的话,官方给出的650W电源需求基本上是合理的。
散热
这一代公版显卡采用了有别于以往涡轮散热器的双风扇散热器,在TDP变化不大的情况下,满载烤机测试中的温度相比前代有着明显的降低,RTX 2080Ti Founders Edition满载仅78摄氏度的表现已经达到了之前一些GTX 1080Ti非公的水平。可以说公版显卡在这一代上基本上摘掉了散热不佳的帽子。
评测总结:
新一代的RTX系列显卡出乎我们意料地选择了对画质和人工智能进行革新和探索,而不是我们之前所期待的大幅度的理论性能提升。RTX 2080Ti相比GTX 1080Ti在DX11下20%左右在DX12下44%的理论性能提升也意味着NVIDIA在缺少强劲的对手情况下,更加重视新技术的支持和优化。这也体现在RTX和DLSS技术的实践上,DLSS技术的AI黑科技带来的提升令人震惊,另外,此次加入的RTX实时光线追踪技术带来了堪称革命性的画质提升,将游戏画面与电影和现实世界的差距缩小到了一个新的程度。
回到值不值得买的话题上,这一代产品的主要卖点是新技术的支持,而不单纯是性能上的进步。这与以往“强不强”的讨论话题不一样,此次更多的是解决DLSS和RTX技术“有没有”的问题。从这个角度上来说,买新不买旧是绝对成立的。当然考虑这些之前你还要考虑到目前两款显卡分别达到5699元和8199元的市场指导价。
本文编辑:孙斌
关注泡泡网,畅享科技生活。
与NVIDIA送来的公版产品一起,我们还收到了多款来自不同AIC厂商的非公产品:
华硕ROG STRIX RTX 2080Ti O11G GAMING
这是一款纯非公产品,使用了自行设计的PCB,并使用了改进型的三风扇6热管散热器。PCB采用华硕独家全自动制程工艺制造。支持AURA神光同步信仰灯。性能方面,默认频率1350MHz,最高Boost频率达到1665MHz。
映众 RTX 2080Ti黑金至尊OC版
映众RTX 2080Ti采用公版PCB设计,这也是目前除华硕之外送测的其它RTX显卡的共同特征。双风扇设计,显卡长度仅268mm,对小型机箱十分友好。频率方面,官方给出的是boost频率1590MHz。
映众 RTX 2080黑金至尊OC版
除此之外,映众还送来了RTX 2080黑金至尊OC版,采用同样的公版P150方案PCB,Boost频率1755MHz。同样也是短小精悍的一款产品。
影驰 RTX 2080Ti大将
影驰送测的同样是一款公版PCB方案的产品,采用了规模庞大的三风扇“星爵”散热器。相信散热表现会有惊喜等着我们。
耕升 RTX 2080炫光 OC
最后是来自耕升旗下的RTX 2080炫光 OC,同样是公版PCB方案,三风扇散热器配备了大量炫酷的信仰灯。频率方面官方宣称Boost频率高达1800MHz。