三世同堂!DX10/10.1/11游戏效率对决
泡泡网显卡频道12月23日 三个月前,AMD重磅发布了HD5800系列显卡,除了其强大的性能外,更令人期待的是其支持微软全新的DX11。如果说HD4000是AMD的翻身之作的话,那么HD5000就是扬眉吐气的力作,一连串的反击打得对手毫无还手之力!
与之前中端卡上市时间较高端卡晚半年左右的不成文规则不同,此次AMD一口气将HD5000系列的高中端一起上市,且可根据市场变化,下个月就让面向低端用户设计的HD5600系列上市。这样的话,DX11显卡并非高不可攀,对DX11的硬件支持已不是障碍。目前DX11游戏并不是多,但比起当年DX10的情况要好很多,优秀的技术必然受到大家的追捧,DX11也不例外,DX11已经是大势所趋。
HD5000全面上市之后,目前的显卡市场格局就比较混乱了,ATI方面是DX11和DX10.1显卡共存,而NVIDIA方面中高端依然坚守DX10的阵地,低端才刚开始引入DX10.1支持,这就出现了罕见的DX10、10.1、11三代显卡共存的局面。
DX10.1和DX11,相比DX10最大的改进就是提升渲染效率,充分发挥GPU和CPU的资源,消除瓶颈。那么DX11相比DX10.1能提升多少速度呢?DX10.1相比DX10有多大优势呢?本文对此进行专项测试。
DX10带来了众多绚丽无比的新特效,“滥用”各种特效导致GPU不堪重负。而GPU自身的发展受到诸多因素的制约,如果制造工艺跟不上的话运算能力很难取得突破。因此,必须通过不断改进架构运算效率来进一步提升3D图形性能。在DX10之后,微软也开始将重心集中在如何提升算法和效率上面,而不是一味的加入新特效或提高模型复杂度。
此后微软发布了DX10.1 API,对DX10进行了小修小补,DX10.1主要更新内容有:
DX10.1的更新内容虽然不少,但相比DX10没有什么革命性的改进,大部分内容都是提高GPU的资源利用率、将一些可选标准列为必须,其实不少项目DX10显卡通过修改驱动就能实现。因此DX10.1没能得到游戏开发商足够多的重视,并没有像当年的DX9C那样迅速成为主流。
屈指可数的DX10.1游戏
ATI从HD3000系列开始,也就是第二代DX10显卡中,就全面提供了对DX10.1 API的支持。而对手NVIDIA则对于DX10.1比较抵触,第二代GF9系列和第三代GTX200系列都不支持DX10.1,并且宣称“DX10.1并非必须,DX10也能部分实现”之类的言论。《刺客信条》这款原本支持DX10.1的游戏也迫于压力在新版本中取消了支持。
但是,NVIDIA刚发布的GT210/220/240显卡却非常低调的对DX10.1提供了支持。在DX11时代即将来临之际,NVIDIA没有将抵制DX10.1的策略进行到底,而选择了妥协,真是令人费解。
至少,NVIDIA用实际行动证明了,DX10.1虽然改进有限,但也并不是没用。实际上,DX10.1只不过是微软的一个试水石,其目的非常明确,那就是尽可能的提高DX10的渲染效能,达到节约GPU资源的目的,而DX11正是基于这种设计理念而来的。
从游戏画面逼真度来看,短期内恐怕没有哪款游戏能够达到Crysis的高度,但是这款依靠暴力模型、着色技术和诸多特效堆积而成的游戏,对显卡的要求之高令人叹为观止,至今都没有哪颗GPU敢打包票说能在最高特效下面流畅运行。也就是说Cryengine 3是丝毫没有考虑现有GPU的性能而开发的一款超级引擎。
虚幻3是最高效最成功的引擎,Cryengine只是画面最强的引擎
以高效率著称的虚幻引擎缔造者Tim Sweeney称,想要把现有游戏模型复杂度提高数十倍是很容易的事情(比如CG模型和影视渲染),但同样的你也需要数十倍与现有主机机能的显卡才能流畅运行,比如三路甚至四路优异系统,而这种系统的市场占有率连1%都不到,独孤求败的Crysis还卖不过快餐式的使命召唤系列、Cryengine至今无法染指游戏机领域就是这个道理。
所以,架空硬件的引擎是不可取的,唯有充分利用有限的GPU资源,通过各种辅助技术最大化画面表现力,才是图形技术公司和游戏开发商首当其冲要解决的内容。
因此,在DX10发布四年、成为主流之后,业界将期望都寄托在了DX11身上,虽然DX11并没有带来全新的特效,但却通过各种手段提升了GPU的渲染效率,当GPU有了富裕的运算资源之后,游戏开发商就可以大胆的去使用更多的特效和技术,如此一来DX11游戏很容易就能从画面到速度全面超越DX10游戏!
DX11最关键的特性有以下五点:
1. Tessellation:镶嵌式细分曲面技术(第三章做专门解析)
2. Multi-Threading:多线程处理
3. DirectCompute 11:计算着色器(第二章做专门解析)
4. ShaderModel 5.0:着色器模型5.0版
5. Texture Compression:纹理压缩
在DX11的五大关键特性中,其中有四项都是专为改进效率而生,所以我们就通过新款DX11游戏来看看,效率究竟能提升多少?
DX11/DX10.1介绍完毕,现在就来看看性能如何,毕竟DX11和DX10.1主要改进的是性能而不是画质。
● 测试平台:
PCPOP.COM评测室 | |
硬件系统配置 | |
|
Intel Core 2 Extreme QX9770 |
主 板 |
MSI X48C Platinum |
显 卡 |
HD5870 1GB (850/4800MHz) |
内 存 |
Apogee DDR3-1600 (9-9-9-24-1T) |
硬 盘 |
日立1TB |
电 源 |
Tt暗黑650p |
软件系统配置 | |
操作系统 |
Windows 7 RTM 7600.16385 32Bit |
DirectX |
Directx_aug2009_redist |
显示驱动 |
NVIDIA Forceware 195.65WHQL ATI Catalyst 9.11WHQL |
● 测试方法:
使用最新的《鹰击长空》、《潜行者》、《BattleForge》游戏,通过打开关闭DX11或者DX10.1模式,对比不同API下的性能有无差别。
● 测试目的:
测试DX11/DX10.1/DX10三种模式下的性能差别,检验DX11显卡和DX10.1显卡性能提升。
● 首款DX11游戏——BattleForge
作为HD5800发布当天同步支持DX11的游戏,BattleForge虽然没有带来任何新的特效,但却依靠DX11模式有效的提升了性能。
BattleForge测试中,特效全开最高,SSAO设定为VeryHigh时其实就已经是HDAO技术,然后对比HD5870在DX11和DX10.1模式下的性能。
虽然DX11带来的画质提升几乎看不出来,但游戏运行效率的提升令人惊讶不已!从1680到2560分辨率,从0AA到8AA,12种模式下都有极为可观的帧数提升。
很多RTS游戏都会将帧数锁定在30帧,保持不低于25帧的速度即可认为是流畅。通过上表来看,HD5870可以在2560 8AA这种最优异模式下保持25.6帧的平均速度,真是难能可贵,这当然都是DX11的功劳,因为在DX10.1模式下只有21.7帧,不要小瞧了4帧之差,这可是质的提升。
DX11 2560 8AA的性能等同于DX10.1 2560 4AA,可见DX11高效率的特性既可以给玩家带来更快的运行速度,也能带来更高的画质。
● 第二款DX11游戏——《潜行者:普里皮亚季的呼唤》
第二款DX11游戏同样主要是改进了效率,当然也加入了Tessellation技术的支持,但仅在人物模型上使用了该技术,所以画面改进并不大。
游戏提供了DX11和DX10两种渲染模式,通过自带的Benchmark测试可以直接获得两种模式下的性能差别到底有多大:
无论是否开启抗锯齿,DX11都能获得十分可观的性能提升,以目前最便宜的DX11显卡HD5750为例看看提升幅度:
从数据分析,DX11较DX10.1效率更高已经是事实,且提升效率可以用显著来形容。这一次,显卡终于可以通过非晶体管堆积的方式获得性能提升了。
● 首款DX11游戏——BattleForge
BattleForge这款网游在支持DX11之前就能够支持DX10.1,所以我们还可以用它来对比DX10.1和DX10的效率差别。
测试中,将SSAO设定为High,这就是传统的SSAO效果,然后对比HD5870在DX10.1和DX10模式下的性能。
提升幅度虽然不如从DX10.1到DX11那么显著,但也有意外收获了,看来DX10.1绝非浪得虚名。
● DX10.1游戏——《鹰击长空》
在《鹰击长空》这款DX10.1游戏中,DX10.1的主要作用就是用来改进SSAO算法,因此开启关闭DX10.1也能获得20%左右的性能提升,与《BattleForge》DX10.1模式基本相同。
作为NVIDIA最新的DX10.1显卡,GT240通过DX10.1模式也能提升一些性能,但幅度更小。DX10.1毕竟是半代更新的API,虽然也能提升效率,但远不如DX11那么显著,算是聊胜于无吧。
● DX10.1主要改进效率,未得到足够重视
从2007年底的HD3000系列开始,ATI全线显卡就已经对DX10.1提供了完整的支持。可惜DX10.1相对于DX10的改进不多,新增的特效“多重采样算法”和“屏幕空间环境光遮蔽”,DX10硬件也能实现而且画质完全相同,只不过效率稍低一些。正因为如此,显卡是否支持DX10.1就没那么重要了,最关键的是游戏性能。
以《孤岛惊魂2》和《刺客信条》为代表的第一批DX10.1游戏,同级A卡并不比N卡强多少,由此导致DX10.1被众人所无视。但在今年以《鹰击长空》和《潜行者:晴空》为代表的新一代DX10.1游戏中,开启关闭DX10.1性能可以相差20%之多,因此直到两年后的今天DX10.1才受到了广泛关注,可见新技术能否得到游戏的大力支持十分关键,因为显卡更新换代频率实在太快,而消费者大都是比较现实的。
终于,一向宣称DX10.1无用的NVIDIA没有将抵制策略进行到底,也在中低端显卡GT210、GT220、GT240显卡中加入了DX10.1支持,目的就是为了提升性能,增加卖点。花很小的代价就能让显卡性能提升10-20%,何乐而不为呢?
● DX11革命尚未成功,游戏仍需努力
NVIDIA前脚刚迈入DX10.1,ATI就已经大踏步进入DX11时代了,HD5000系列的发布让ATI扬眉吐气,在中高端力压对手。其实同价位的HD5000显卡并不比N卡强多少,但新一代DX11 API的支持让A卡增色不少,DX11的诱惑力显然要比DX10.1大很多。
DX11主要有五项关键特性,其中的三项(多线程处理、计算着色器11、纹理压缩)都是用来改进图形渲染效率的,另外的两项——SM5.0新增的指令可以带来一些新特效,细分曲面技术可以让模型更加细腻平滑。
DX11游戏来得比想象中还要快,HD5870发布当天《BattlaForge》这款RTS网游就同步升级至DX11,通过笔者的测试来看,DX11虽然没有带来新的特效,但却让速度提升了20%以上!可惜这款游戏只在欧美运营,对于国内玩家来说没有任何意义。
第二款DX11游戏是《Stalker:COP》(潜行者:普里皮亚季的呼唤),它除了使用DirectCompute11改进渲染效率外(性能提升也在20%以上),还对人物模型应用了Tessellation技术,效果提升不少。
第三款DX11游戏是《DiRT2》(科林麦克雷:尘埃2),通过游戏的静态截图来看,DX11的五大关键技术在该作中都得到了体现,不过对于这款紧张刺激的赛车游戏来说,玩家在游戏过程中很难注意到DX11所带来的观众、旗帜或水面的差别,DX11和DX9C的画面区别并不大。
总的来说,目前游戏对于DX11技术的应用和DX10.1类似,主要还是集中在改进效能的方面,对于增强画质的细分曲面和阴影技术使用率并不高,DX11的潜力还需要重量级大作来深度挖掘。■<