NVIDIA GTX 1080异步运算仍落后A卡!
NVIDIA Pascal架构新卡GTX 1080做了很多努力工作减小Maxwell时代在DX12异步运算(Async Compute)上对A卡的劣势,我们先来看一下NV的官方介绍——
异步计算
如今,GPU早已不再是单纯的图像渲染,尤其是在DirectX 12时代,GPU往往会被赋予更多的工作,如计算任务等等。
NVIDIA GeForce GTX 1080支持异步计算技术,它可以快速而高效的并行处理多任务,做到动态负载平衡,以及像素级别的任务“抢占”,实现运行效率的更大化。
在静态模式下,当GPU同时处理图形渲染及计算两个任务时,这两个任务的完成时间往往是不一样的。如下图Static Partitioning所示,图形任务在60%时间点便完成了,剩下的40%时间则要等待计算任务完成,才能进行下一个任务。这将造成大量的GPU空闲情况发生。
而在动态负载平衡模式下(上图Dynamic Balancing部分),图形任务率先完成,用于这部分的GPU资源可马上接管剩下的计算工作,缩短任务完成时间。
Preemption(抢占)指的是为了使重要工作可以快速完成,GPU会选择关闭不太重要的工作,让重要工作优先处理。Pascal也是目前首个支持像素级别抢占的GPU架构,它可以让GPU以更快的速度和更小的性能开销完成抢占。
实际表现如何,外媒已经在首款原生DX12游戏《奇点灰烬》正式版上进行了测试,结果如下——
在4K、2K和1080P三种分辨率,开启异步运算支持后,GTX 1080在4K下并没有获得提升,甚至还不如DX11下的帧率。
反之A卡Fury X在三种分辨下都有增长,以1080P分辨为例,Fury X DX12+Async对DX11增幅为16%,GTX 1080为2%。
我们再通过另外一家测试站对4K分辨的考察——
关闭异步运算,R9 Fury X DX12对DX11提高7%,GTX 1080降帧2%,GTX 980 Ti更惨,降帧7%
开启异步运算,R9 Fury X DX12对DX11暴增18%,GTX 1080降帧3%,GTX 980 Ti降帧8%。
2K分辨——
N卡总算挽回了一些面子,但仍远输A卡,另外Maxwell架构对于异步的支持的确是不尽人意。
结论:
总上来看,Pascal的动态分配对于DX12异步运算进行了大幅改进,但相较于先天优势的GCN存在差距。当然,要强调的是,这仅仅是《奇点灰烬》一款DX12游戏,而且考察的是提升幅度而非帧数绝对值,后者N卡早发一代的优势还是很明显的,仅作参考。
背景资料——AMD异步运算简介
AMD的做法是,GPU划分出三条队列,分别运行渲染、计算、复制任务,而且分别可达100%满载,互不影响。这样的好处有三点,其一是可以实现更高的帧速率,让游戏更加流畅;第二是在“虚拟现实”中的应用,它可以减少延迟;第三则可以带来更好的图像质量。■