要DX11还是PhysX?2009年显卡技术分析
泡泡网显卡频道12月20日 今年的显卡市场特别热闹,也很有意思,像往年那样一边倒一家独大的局面不复存在了,NVIDIA和ATI双方竞争异常激烈,新技术新工艺新产品层出不穷,让消费者眼花缭乱,选购时难以抉择。
新旧产品共存的局面导致产品线比较杂乱,但实际上每款产品的定位都十分精确,就连作为竞争对手的NVIDIA和ATI双方,其产品线几乎都是一一对应的,定价和性能都惊人的相似。
拿千元价位最受关注的产品来说,HD5770、HD4870、GTX260+这三款显卡的游戏性能相差不过10%,HD5750、HD4850、GTS250三者的性能也基本处在同一水平,价位也相差不多,那么在性能、价格都差不多的情况下,还有什么能够左右消费者的选择呢?
N卡和A卡在不同的游戏中互有胜负,谁也没有绝对的领先优势,当微弱的帧数差距不足以影响游戏体验之时,功耗发热噪音、通用计算、附加功能、特殊应用……这些对于传统显卡来说“不务正业”的规格参数开始成为新的关注焦点。这也就是今年CUDA、Stream、PhysX、绿色节能版等特殊功能大行其道的主要原因。
下面笔者就将主流显卡常见的附加技术和特殊功能列出来,供读者参考,并由大家一起来评判,到底哪些技术更实用一些,哪些能够影响您的选择。
● DX10.1主要改进效率,未得到足够重视
从2007年底的HD3000系列开始,ATI全线显卡就已经对DX10.1提供了完整的支持。可惜DX10.1相对于DX10的改进不多,新增的特效“多重采样算法”和“屏幕空间环境光遮蔽”,DX10硬件也能实现而且画质完全相同,只不过效率稍低一些。正因为如此,显卡是否支持DX10.1就没那么重要了,最关键的是游戏性能。
以《孤岛惊魂2》和《刺客信条》为代表的第一批DX10.1游戏,同级A卡并不比N卡强多少,由此导致DX10.1被众人所无视。但在今年以《鹰击长空》和《潜行者:晴空》为代表的新一代DX10.1游戏中,开启关闭DX10.1性能可以相差20%之多,因此直到两年后的今天DX10.1才受到了广泛关注,可见新技术能否得到游戏的大力支持十分关键,因为显卡更新换代频率实在太快,而消费者大都是比较现实的。
终于,一向宣称DX10.1无用的NVIDIA没有将抵制策略进行到底,也在中低端显卡GT210、GT220、GT240显卡中加入了DX10.1支持,目的就是为了提升性能,增加卖点。花很小的代价就能让显卡性能提升10-20%,何乐而不为呢?
● DX11革命尚未成功,游戏仍需努力
NVIDIA前脚刚迈入DX10.1,ATI就已经大踏步进入DX11时代了,HD5000系列的发布让ATI扬眉吐气,在中高端力压对手。其实同价位的HD5000显卡并不比N卡强多少,但新一代DX11 API的支持让A卡增色不少,DX11的诱惑力显然要比DX10.1大很多。
DX11主要有五项关键特性,其中的三项(多线程处理、计算着色器11、纹理压缩)都是用来改进图形渲染效率的,另外的两项——SM5.0新增的指令可以带来一些新特效,细分曲面技术可以让模型更加细腻平滑。
DX11游戏来得比想象中还要快,HD5870发布当天《BattlaForge》这款RTS网游就同步升级至DX11,通过笔者的测试来看,DX11虽然没有带来新的特效,但却让速度提升了20%以上!可惜这款游戏只在欧美运营,对于国内玩家来说没有任何意义。
第二款DX11游戏是《Stalker:COP》(潜行者:普里皮亚季的呼唤),它除了使用DirectCompute11改进渲染效率外(性能提升也在20%以上),还对人物模型应用了Tessellation技术,效果提升不少。
第三款DX11游戏是《DiRT2》(科林麦克雷:尘埃2),通过游戏的静态截图来看,DX11的五大关键技术在该作中都得到了体现,不过对于这款紧张刺激的赛车游戏来说,玩家在游戏过程中很难注意到DX11所带来的观众、旗帜或水面的差别,DX11和DX9C的画面区别并不大。
总的来说,目前游戏对于DX11技术的应用和DX10.1类似,主要还是集中在改进效能的方面,对于增强画质的细分曲面和阴影技术使用率并不高,DX11的潜力还需要重量级大作来深度挖掘。
全屏抗锯齿是游戏中最重要的一项特效,对于画面的改进甚至比DX10、DX11还要显著,因此抗锯齿的倍数、画质和效率一直都是NVIDIA和ATI双方不断优化改进的重点技术。
相信大家也曾记得ATI HD2000/3000系列产品失败的主要原因就是MSAA效能太差,而HD4000系列大打翻身仗也是因为强大的AA效能。现在双方在抗锯齿方面的角逐再次升级。
● ATI HD5000系列拥有超强8xMSAA效能
为了弥补HD2000/3000系列低下的AA效能,也为了对抗NVIDIA的CSAA(覆盖采样抗锯齿)技术,ATI曾推出了CFAA(可编程过滤抗锯齿),最高提供24xCFAA,遥遥领先于NVIDIA的16xQAA!
魔兽世界中打开CFAA后画面和文字模糊
但实际上CFAA是很不成熟的技术,众多玩家发现打开CFAA后游戏内所有物体包括文字都有发糊的现象,CFAA也因此被玩家戏称为“糨糊AA”。此后,ATI依然在驱动中提供多种CFAA选项,但官方已经不再对此进行过多的宣传,因为CFAA本身的采样原理就决定了发糊的现象不可避免。
HD5000系列8xMSAA相比传统4xMSAA的性能损失很小
在HD5000系列显卡当中,ATI大幅改进了光栅单元,从而使得AA效能大幅提升,以前不敢轻易使用的8xMSAA成为可能。通过ATI官方测试和笔者自己的测试来看,8xMSAA效率确实惊人,性能损失幅度远小于N卡,实用性更高!
● NVIDIA CSAA成为事实上的游戏标准
虽然N卡在8xMSAA性能方面不如A卡,但NVIDIA也有自己的独门绝技,那就是从G80时代引入的CSAA技术,经过几年的发展后更加成熟和易用,画质和效率都令人满意,所以很多数游戏都直接内置了CSAA支持,从而已很小的性能损失实现更平滑的画面:
CSAA是在MSAA基础上更进一步的节省显存使用量及带宽,简单说CSAA就是将边缘多边形里需要取样的子像素坐标覆盖掉,把原像素坐标强制安置在硬件和驱动程序预先算好的坐标中。这就好比取样标准统一的MSAA,能够最高效率的执行边缘取样,效能提升非常的显著。比方说16xCSAA取样性能下降幅度仅比4xMSAA略高一点,效果却几乎和8xMSAA一样。8xCSAA有着4xMSAA的处理效果,性能消耗却和2xMSAA相同。
目前主流游戏大作都提供了CSAA支持(TheWay游戏必然支持),就连DX11代表作DIRT2中也可以找到CSAA的踪影,由此可见CSAA已经成为了事实上的标准,强烈建议N卡用户直接使用16xCSAA,这样就能以4xMSAA的性能,实现接近于8xMSAA的画质。
而且,CSAA当中还包括基于8xMSAA、精度更高的8xQAA和16xQAA,实现更加完美的画面,不过这两种模式的性能损失太大,一些变态的DX10游戏没有提供支持,也只有要求较低的DX9游戏才能开启,算是一种备选方案。
大家应该可以发现,芯片厂商在宣传自己的产品时,很少提“性价比”这个词,而最常见的则是“性能功耗比/每瓦性能”(Performance per Watt),因为半导体芯片的功耗控制一直都是一大难题,尤其是目前晶体管数急剧膨胀的情况下。
功耗大意味着发热大,需要很强的散热器,导致噪音不好控制,功耗大也需要大功率电源的支持,整机成本增加,长期电费开支也不可忽视。因此近年来NVIDIA和ATI双方都非常在意显卡的功耗。
控制显卡功耗主要有以下几个方法:
1. 采用更先进的工艺,比如55nm、40nm;
2. 降低GPU电压和频率;
3. 采用GDDR5和gDDR3,这两种新显存的电压和内核频率比GDDR3低很多;
4. 2D模式下大幅降低核心/显存的电压和频率,达到节能目的。
● NVIDIA绿色版备受欢迎,ATI也跟进
在40nm工艺量产之前,显卡功耗控制难度较大,但NVIDIA推出的几款绿色版显卡还是令人眼前一亮,9600GT绿色版和9800GT绿色版的频率只比普通版低一点,性能损失在10%以内,但待机功耗和满载功耗都下降了30-40%之多,此外9800GTX+改名GTS250之后也重新设计了供电电路,功耗略有下降。
通过我们之前的测试来看,96GT和98GT绿色版在功耗发热控制方面确实做的很出色,在市场上也很受欢迎。其实绿色版显卡控制功耗的方法很简单,就是降压降频、优化供电设计。
在看到NVIDIA绿色版取得成功后,ATI方面也开始仿效,各大AIB纷纷推出了HD4670绿色版,但并未在中高端产品上使用,因为HD4800系列所使用的GDDR5显存功耗控制并不理想,PowerPlay技术作用有限,无论功耗还是发热控制都并不比GTX200系列好。
● HD5000集众多节能技术于一身,能耗比大幅提升
在HD4770身上试水40nm工艺之后,HD5000系列震撼出击,抛开新技术、新功能和DX11不谈,在功耗发热控制方面HD5000系列的确可圈可点,前面我们提到过的四种功耗控制方法它都有使用。
40nm工艺使得GPU核心面积变得很小,TDP大幅下降;而第四代GDDR5显存的使用,频率取得了突破性进展,而且在空闲模式下的频率可以降到很低,可谓是能屈能伸:
HD5800/HD5700四款显卡待机时的频率都一样,同为157/300MHz,难怪功耗控制可以做到如此完美。
当然,NVIDIA的三款新显卡——GT240/220/210,拜40nm工艺和GDDR5/gDDR3显存所赐,功耗发热也非常低,但这些显卡本身定位中低端,用户不太在意功耗发热,因此未能得到足够多的重视,也没有过多的进行宣传。
● ATI Eyefinity技术实现三屏游戏之梦
已经面世的五款HD5000显卡无一例外全都支持ATI Eyefinity技术,沿用N年的显卡双头输出方案被终结,三屏给玩家带来了全新的游戏体验:
双屏有很多便利,但并不适合游戏玩家,因为玩家始终面对的是显示器的边框。而三屏就没这个顾虑了,主屏和传统显示器一样,两侧的副屏用来扩充视野,从而获得超宽的广角的显示效果。
此前Matrox推出了专门的3D环幕仪,可以将显卡的一个DVI接口扩展成为三个D-DUB接口,从而为游戏玩家提供最高1280x1024x3的三屏输出,但这种方案不但价格昂贵(Matrox 3D环幕仪的售价是2000元左右),而且局限性太大,只支持1280分辨率的VGA显示器。而定位中端的HD5770/5750都能支持2560x1600x3的超高分辨率,根本不是一个级别。
● ATI Eyefinity三屏游戏实拍效果展示
ATI Eyefinity技术是随HD5000免费赠送的,但三台显示器价值不菲,需要玩家们仔细斟酌。另外三屏玩游戏的话分辨率也是三倍,对显卡性能要求非常高,需要优异A卡甚至交火系统才有能力流畅运行。
● DirectCompute和OpenCL:NVIDIA和ATI支持度不同
提起GPU通用计算,自然会让人想到NVIDIA的CUDA、ATI的Stream以及开放式的OpenCL标准,再加上微软推出的DirectCompute,四种技术标准令人眼花缭乱,他们之间的竞争与从属关系也比较模糊。
首先我们来明确一下概念:
1. OpenCL类似于OpenGL,是由整个业界共同制定的开放式标准,能够对硬件底层直接进行操作,相对来说比较灵活,也很强大,但开发难度较高;
2. DirectCompute类似于DirectX,是由微软主导的通用计算API,与Windows集成并偏向于消费领域,在易用性和兼容性方面做得更出色一些;
3. CUDA和Stream更像是图形架构或并行计算架构,NVIDIA和ATI对自己的GPU架构自然最了解,因此会提供相应的驱动、开发包甚至是现成的应用程序,通过半开放的形式授权给程序员使用。
CUDA和Stream我们暂且不提,先说说关于DirectCompute和OpenCL这两大通用计算标准的故事。
● DirectCompute:A卡仅HD5000支持,N卡全系列都支持
理论上来说,DX10以上级别的显卡都可以支持DirectCompute技术,但DirectCompute也分版本的,它与DirectX(或ShaderModel)是一一对应的(10.0、10.1、11.0),比如DX10显卡就只支持DirectCompute 10(GPU-Z识别为DirectCompute 4.0),DX10.1显卡支持DirectCompute 10.1(4.1),DX11显卡支持DirectCompute 11(5.0)。
由于ATI HD4000都支持DX10.1,HD5000支持DX11,按理说在DirectCompute支持方面A卡是绝对强于N卡的。但目前AMD只为HD5000提供DirectCompute 11的支持,在昨天刚刚发布的催化剂9.12驱动中,AMD终于为HD4000开放了DirectCompute 10.1支持。
NVIDIA方面因为没有DX11显卡的关系,虽然不支持DirectCompute 11,但全线DX10显卡都能支持DirectCompute 10,部分新显卡支持DirectCompute 10.1,让所有用户都能使用Windows 7系统集成的转码功能。
● OpenCL:N卡驱动内置,A卡需要安装特定Beta驱动
NVIDIA依靠强大的驱动研发团队,对DirectCompute和OpenCL都第一时间提供了完美支持,所以打开GPU-Z的话我们可以看到N卡能够支持所有的四项通用计算技术,而HD4000系列A卡默认是一项都不支持的。
AMD也有供开发者测试用的OpenCL Beta驱动,并未向普通用户开放下载,必须进AMD官网注册之后才能下载到特殊版本的驱动,这个驱动需要搭配催化剂9.12以及催化剂9.12Hotfix驱动才能生效,安装之后GPU-Z就可以显示全系列A卡都支持OpenCL了(官网链接)。
● CUDA通用计算遍地开花
虽然GPU通用计算的概念最早由ATI提出并率先应用,但NVIDIA早已后来者居上。通过我们此前的诸多报道来看,CUDA软件无论数量还是质量都远超Stream,即便是同时支持CUDA和Stream的软件,对于Stream的支持也都要晚上几个月,N卡用户有更多的选择,而A卡用户有得用就不错了,看来AMD还得加倍努力才行。
今年,GPU通用计算在民用领域的应用出现了爆炸性成长的局面,CoreAVC CUDA解码器、GPU倍线视频、MediaShow、MediaCoder、暴风转码等一批更好用、更实用的软件,让普通用户真正感受到了CUDA技术所带来的好处。
通过此前我们的一项调查来看,CUDA软件显然要比Stream软件更受欢迎一些,那些同时支持CUDA和Stream的软件,对于CUDA的支持更快更到位,而且性能也更好一些。
参考文章:游戏外的精彩!GPU通用计算软件大放送
● PhysX:物理加速卡免费送,普及开始
物理效果由于需要真实的模拟现实生活中物体的运动,所以从计算量方面来看,CPU这样的串行计算架构很难满足越来越复杂的物理效果,业界一直在寻找通过硬件来实现物理加速的方法。2005年,Ageia公司推出了首款物理卡产品,通过一颗专用的处理器进行物理运算,从而彻底的减小了CPU的负担,性能有了质的提升。
Ageia公司因此一夜成名,霎时成为了业界关注的焦点。而Ageia的竞争对手Havok也被Intel收购,向来财大气粗的NVIDIA公司为了在显卡上实现硬件物理加速,于2008年初将Ageia公司并入囊中,从此GPU硬件物理加速时代来临。
可以说,NVIDIA收购了Ageia,并推出GPU物理加速在显卡发展史上具有革命性的历史意义。相对于CPU物理加速来说,使用GPU进行物理加速运算有很多的优势,综合起来我们可以归纳为以下几点:
1、用户不必花更多的钱
NVIDIA将物理加速应用在GPU上之后,用户再也不需要够买价格昂贵且功能十分单一的物理加速卡,对于用户来说节省了很大一部分开支,而且效果更加出色(游戏可以更加大胆的使用复杂的物理运算)。这一点无疑是最具历史意义的!同时,使用GPU物理加速之后,用户也不需要购买非常高档的CPU来进行物理加速的“软”计算,用户只需要购买一颗低端的CPU即可。
2、物理运算性能更好
前面我们就已经说过,由于CPU串行计算架构上的缺陷以及性能的不足,很难以满足越来越大的物理场景渲染;而专门使用物理加速卡的话,性能方面显然也无法和当今两倍于摩尔定律发展速度的GPU相比,所以在性能方面,GPU物理加速也无疑是最好的选择。
3、引擎更加容易使用
NVIDIA收购Ageia之后,采用CUDA架构,标准的C语言环境使得NVIDIA公司在一个月之内就完成了PhysX的移植。PhysX引擎从PPU上移植到GPU上之后,游戏开发人员不必再去研究如何保证与PPU的兼容性和利用率,只要能够支持NVIDIA的显卡,NVIDIA的物理加速驱动程序就会搞定这一切,所以对于游戏开发商来说,在GPU上进行物理加速也有着十分重要的作用。
4、支持物理加速的游戏越来越多
NVIDIA在游戏界有着举足轻重的影响力,和众多游戏开发商保持着密切的合作关系,大名鼎鼎的“The Way”计划就保证了N卡在几乎所有游戏大作中都有着良好的性能发挥。PhysX物理引擎被NVIDIA收入囊中之后,原本屈指可数的物理游戏逐渐开花结果,以《镜之边缘》、《蝙蝠侠》为代表的一些重量级大作开始使用PhysX物理引擎,影响力非同小可。
而且,中国本土游戏开发商也开始使用PhysX引擎来增强画面,比如《MKZ铁甲突袭》和《剑网3》都内置了PhysX支持,可见PhysX技术显然要比其它同类物理技术更易用一些。
虽然物理加速技术还没有一个统一的标准,但PhysX无论从游戏数量还是画面效果方面,都更胜一筹。
● 3D Vision立体游戏:免费的红蓝眼镜也可以玩玩
尽管我们玩的确实是3D游戏,但这个3D是针对电脑内部显卡渲染过程而言,对于玩家来说,我们看到的图像是电脑内部三维物体“投影”到显示器上的一帧帧二维画面,最终我们看到的图像其实是2D的,显示效果与电视/电影没有本质区别。
为了让电脑游戏告别生硬的2D显示效果,NVIDIA于2009年伊始在CES大展上隆重推出了GeForce 3D Vision技术,其组件包括:液晶分时无线眼镜、高功率红外发射器、120Hz高刷新率显示器、配套驱动、软件、游戏优化等一整套完整的解决方案。为广大游戏玩家献上真正具有立体感、距离感的游戏,给人产生一种跃然纸上、栩栩如生般的立体3D游戏。
不过,3D Vision产品发布之后,对于用户来说仅仅是一款叫好不叫座的产品,因为要想体验到3D Vision效果,必须具备三个条件:
1、必须使用NVIDIA Geforce 8以上显卡产品
2、必须拥有一台刷新率为120Hz的显示器
3、必须购买NVIDIA的3D Vision眼镜
使用NVIDIA的显卡不用说,但是市面上刷新率为120Hz的液晶显示器非常稀少,动辄3、4千元,甚至更高,而且尺寸仅为22寸分辨率只有1680x1050(前几天才刚发布一款1080p的120Hz显示器);而一套NVIDIA的3D Vision眼睛也价值不菲,中国大陆地区零售价格竟然高达1399元,这样的成本对于一个普通用户是完全无法接受的,况且仅仅是为了实现玩游戏时的3D效果!
为了普及3D Vision技术,让普通N卡用户也能体验到真正的立体游戏,NVIDIA从下半年开始,在驱动中开放了基于红蓝滤光技术的3D Vision,用户只要使用NVIDIA显卡,和一个成本几毛钱的纸质红蓝眼镜即可,无需价格昂贵的120Hz显示器和液晶分时眼镜。
从笔者整体的使用感受中来看,3D立体效果还是非常明显的,唯一的缺点就是偏色比较严重,毕竟这仅仅是通过对两种颜色的过滤实现的效果,而计算机实际显示的颜色值非常高,整体来说是在可以接受的范围内。当然,免费的东西你也不用抱太大的希望,如果你想获得非常好的的3D视觉体验效果,建议还是购买NVIDIA提供的3D Vision Glasses。不管怎么说,不用花一分钱,用户可以对显卡有一个新玩法也不错。
NVIDIA的3D Vision驱动中加入了数百款主流游戏大作的支持,一些新的游戏甚至能够直接支持3D Vision技术,兼容性和效果自然更加完美。不管怎么说,这项免费的、好玩的技术都非常值得一试。
写了这么多,无非是想要告诉大家,不要一味的关心显卡的游戏性能,因为目前的市场格局是,同价位的显卡性能其实相差不多。10%以内的性能差异、60和70帧的FPS差别,在游戏中几乎是感觉不到的,真正能够大幅影响游戏体验的,正是性能之外的附加技术!
比如,《BattleForge》、《STALKER:COP》和《DIRT2》这三款最新的DX11游戏,在DX10/DX9模式下同级N卡和A卡的性能不相上下,但A卡在DX11模式下前两款游戏的速度能瞬间提升20%左右,第三款游戏虽然速度下降了,但画面更加出色。
再比如,《雪域危机》、《镜之边缘》和《蝙蝠侠》这三款物理游戏,如果不开PhysX的话,同级N卡和A卡性能差别也不是很大,但N卡支持PhysX,可以带来很多额外的特效,此时N卡的性能便遥遥领先于A卡。
很多游戏玩家认为DX11是大势所趋,DX10显卡不但体验不到最新的特效而且性能会跟不上,所以购买HD5000很划算,买N卡的话很快将会被淘汰。但谁又能否认物理加速不是趋势呢,购买N卡现阶段游戏绝对够用,今后升级显卡之后淘汰的N卡还能做物理加速卡使用……总之公说公有理婆说婆有理。
NVIDIA的官方技术宣传
此外,N卡用户还可以玩玩视频转码加速、体验3D立体效果,这都是N卡的附加值;A卡当然也有低功耗、三屏游戏等附加值,不过仅限HD5000系列,HD4000就没有太多的亮点了。
显卡的附加值如此众多,其实用性到底如何,相信不同玩家在心里各有一套衡量标准,这是芯片厂商或者文章编辑无法强加于人的。所以,最终哪些技术更受欢迎呢?还是您说了算,请大家有空的话投上宝贵的一票,并在评论中发表高见……