化干戈为玉帛!A+N混交物理加速大测试
3D游戏的每次发展升级,都可以说是图形图像软硬件技术进步的功劳。3DFX VOODOO的横空出世为我们带来了众多至今堪称经典的“真”3D渲染游戏;Matrox G400的发布让我们首度领略了Bump Maping制造的华丽世界;3DFX VSA-100的最后辉煌把人们带离了满是锯齿的世界,让FSAA深入人心;NVIDIA GeForce256革命性的T&L引擎为我们重新定义了显卡,它叫GPU(当然,AMD(ATI)叫它VPU);NVIDIA GeForce3符合DX8的Pixel Shader/Vertex Shader设计,重新定义了神奇的游戏世界;ATI Radeon9700配合DX9空前的可编程性,让游戏画面愈发真实生动;NVIDIA GeForce6800用D9C/HDR为游戏世界涂上一抹最灿烂的色彩;NVIDIA GeForce8800彻底革新了图形引擎设计思维,用DX10证明了原来游戏和真实差距并不遥远!
下一代游戏革命应该由谁引发?被抱以厚望的Ray Tracing以及Global Illumination看似真的可以让游戏画面提升为电影级,几大图形核心厂商也都全力投入,甚至连久不碰独立显卡市场的intel都招兵买马,意欲再展宏图!然而,业内人士最近流露出来的信息,给人们乐观的预期泼了冷水,RT和GI是很好,但惊人的计算量不会让它们太快进入玩家的视线,这些技术的全面导入甚至排期至2010年后。其实看惯了图形技术的发展,我们大可换一条思路想问题,除了图像表现外游戏就没有其它改进的空间了么?像白痴一样的撞到你枪口上的敌人和原子弹都炸不烂的砖墙,这些在游戏中司空见惯的场景正给了游戏一次脱离图像进步而革命的契机!AI技术和物理加速技术中,物理加速技术又是要求最为迫切,关注度最高的方面。
一场由物理加速引发的游戏革命已经轰轰烈烈的展开!没了微软这个主导游戏图形标准豪强的“搅和”,全部是硬件厂商推动,这场革命进行的激烈程度更强,精彩程度也更高,颇引人入胜!
主导的硬件厂商其实还是我们熟悉的宿命般对决的伟大的AMD(ATI)和NVIDIA!
从90年代开发出来的“布娃娃”物理系统开始,已经有无数的大或小知名或不知名的厂商提出过物理引擎的概念了,但第一个提出无理加速概念的还是已归入NVIDIA门下的AGEIA。何为XX加速?说简单点就是不依靠或者很少依靠CPU而采用专属硬件来处理专属运算,包括我们日常叫习惯的显卡,全称也是图形加速卡(Graphics Accelerator)。AGEIA不但拥有PhysX物理引擎,更拥有独立的硬件加速板卡产品,提供了全套的物理应用解决方案。但遗憾的是,在这个大者恒大的商业环境下,想靠一个优秀点子发展壮大的机会太过渺茫了,努力多年的PhysX技术也仅在数量有限的游戏中应用,最终被更加具有号召力的NVIDIA收购。但收购并不代表着结束,凤凰涅磐重生,AGEIA壮丽的物理加速梦想借着NVIDIA有利的肩膀振翅腾空了!
蛋糕从来不是一个人分,物理加速这块无人触及的美味蛋糕自然也不是AGEIA一家独享。前面提及的“布娃娃”系统以及早就声名远播的HAVOK都是手持刀叉来者不善,这其中又以HAVOK的影响力最大。虽然不具备独有的硬件加速设备,但良好的开发环境和较长的游戏合作历史,都让更多的游戏选择了HAVOK而不是AGEIA来实现物理效果。现在,行业大佬Intel又将HAVOK收入囊中,为自己的CPU事业甚至是可期的GPU事业再次注入加速燃料!
两大物理引擎技术的背后,现在分别站着两位行业顶尖高手,而一直游移于CPU与GPU行业老二位置的AMD(ATI)也绝不希望错过这道大餐!不过,在AGEIA和HAVOK被收购后,AMD(ATI)显然无从下手,自身独立开发一套系统对于这个老牌硬件厂商而言似乎难度又太高,考虑到软件厂商的支持度问题就更显飘渺。于是乎,AMD(ATI)干脆一不做二不休的选择了老对手intel的HAVOK作为目前自家的物理引擎技术。
之所以如此,一半出自无奈,一半出于AMD(ATI)的私心。无奈的是AMD(ATI)手中无粮,用谁家的都是在帮对手做生意,只能两害相权,取其轻者;私心的是HAVOK从一开始就基于CPU加速技术,而通过简单的代码转换,也完全具有GPU加速的良好前景,付出不多见效快,正合AMD(ATI)横跨CPU、GPU领域的独特供应商身份。而AGEIA从一开始就基于专用硬件加速平台,被NVIDIA收编后更是全面转向CUDA平台,虽然NVIDIA口口声声说遵循开放原则,CPU也可以运行,但要发挥非常好的效能还是在NVIDIA自家的GPU上,要让非GeForce体系(专业领域称为TESLA平台)的硬件支持其难度和投入都不小。
首先发力的是独霸显卡市场2年之久的NVIDIA,在收购AGEIA后的不长时间,凭借自身拥有出色的驱动团队和成熟的CUDA开发环境,很快将AGEIA物理加速技术全面导入到GPU上,让自家全线GeForce8/9/GT200系列显卡都成为了PhysX物理加速卡!
首款物理加速驱动是GeForce 177.39+PhysX 8.06.12版,一经发布就引起了强烈的反响,尤其是在采用AGEIA物理引擎的DX10基准测试软件3DMARK VANTAGE中,CPU成绩翻倍的提高,总成绩也提高几成。拥有GeForce显卡的用户高呼万岁,而RADEON显卡用户则大呼作弊,以至于FutureMark公司不得不清除带有PhysX驱动的成绩上传才算作罢。不过在同样支持AGEIA引擎的游戏中,确实带来的不俗的性能提升,远比之前NVIDIA宣传CUDA时用的那些Folding@home之类的演示对玩家有吸引的多!
反观AMD(ATI)阵营,虽说口头承诺支持HAVOK引擎,不过引擎的程序改写以及AMD屡遭诟病的驱动团队,最关键的是没有完整的GPGPU开发环境,都大大延误了RADEON系列提供HAVOK引擎硬件加速的时间点,虽说内建HAVOK的游戏众多,但依然只能靠CPU处理。
不过也正是这样尴尬的状况,才催生了本文的诞生!AMD(ATI)显卡不支持物理加速就让它不支持好了,专心负责好3D渲染把本职工作做好我们就很满意,物理加速的任务(PhysX引擎)我们就丢给多面手NVIDIA显卡去完成,看看这样前所未有的A+N超级多卡系统到底有几分功力!
堆叠文字的分析了那么多,笔者也知道读者的辛苦,所以废话不再,切入正题,开始我们的壮丽的混交测试旅程!
按惯例,首先介绍一下测试平台:
● 测试系统配置
PCPOP.COM泡泡网评测室 | |
硬件系统配置 | |
Intel XEON X3210(QUAD CORE) 2.13GHz | |
主 板 | 双敏AK42DF(P35+ICH9) |
显 卡 | HD4850 HD3850 8500GT 8500GT-DDR2 9500GT 9600GT 9600GSO 9800GT 8800GTX |
内 存 | OCZ DDR2 PC2-8500 Reaper HPC CrossFire Certified Edition |
硬 盘 | Seagate 7200.10 320G SATA |
电 源 | TruePower Trio 650W |
软件系统配置 | |
操作系统 | Windows XP SP2 |
DirectX | 9.0C |
显示驱动 | GeForce 177.83 with PhysX 8.08.01 for NVIDIA Catalyst 8.8 for AMD(ATI) |
之所以选择这样的配置,首先是排除CPU带来的瓶颈,一颗酷睿4核心处理器应该完全可以担当这一重任。而选择一张基于P35+ICH9的双敏AK42DF主板也是考虑到目前最广泛的用户群体,虽然现在P45拥有双PCI-E 2.0 X8的接口,甚至于X48的双X16接口,但这与用户普遍的配置重合度不高。而正是P35+ICH9的PCI-E X16+X4的组合才是目前最广泛的,具有典型代表性。
至于显卡,我们尽量选用最能代表目前主流的热销型号,尤其是注意选择NVIDIA产品中不同流处理器数量的产品搭配,基本涵盖了除GT200核心以外全部规格的产品,而且还加入了采用GDDR2显存规格的产品进行对比。由于笔者手边碰巧没有9800GTX,所以128 SPs的产品用老当益壮的8800GTX顶替。AMD(ATI)部分则选择了目前最热门的HD4850和HD3850,而测试中尤其以HD3850为重,目的是想突出物理加速在实际应用中到底能带来多少性能收益。
驱动方面,尽量选用各自最新版本,限于测试周期,可能到读者见文时更新的驱动也已经发布,如果有重大性能或功能升级,我们也将结合最新驱动重新来过!
测试方式遵循此前在预告文章里网友的呼吁,首先测试无物理加速模式下的速度,然后用HD3850作为主卡,搭配不同的NVIDIA显卡做物理测试,再单独用NVIDIA各型显卡单独测试,以观效果。同时希望在本篇文章中网友能继续依然踊跃留言,提出各种测试要求,如果有合理建议,我们也会进行补遗测试以飨读者。
在测试软件方面,预告文章中已经有所提及,其中一些是NVIDIA近期发布的CUDA应用体验大礼包中的资源。由于AMD(ATI)借HD4850强势回归,又将HD3850不惜成本的砸向499的物流性价位,NVIDIA除了过分花瓶外的GTX280/GTX260外,并无太好的产品对应,于是CUDA应用尤其是PhysX物理加速应用就成了NVIDIA近期宣传的重点,放出了大量的资源供玩家品评,这也大大方便了笔者的测试,真的要说一声多谢。
其实组建AMD(ATI)+NVIDIA混合多卡系统并不复杂,只不过门派清晰壁垒森严的两家产品从一开始就打消了人们混搭使用它们的想法,当然,没有物理加速这样的全新应用概念,也不会有我们今天这样大胆想法的诞生。
既然要用HD3850作为3D渲染主显卡,首先安装它以及相应驱动是必然的。再确定硬件和驱动安装正确正常工作后,我们再安装作为物理加速卡使用的NVIDIA显卡,同样确定安装正确后,只需进行一点小小的点石成金,我们的A+N超级混合多卡系统就宣告完成。我们在“设备管理器”中,在GPU-Z中,在Rivatuner中都能验看到两张显卡是否同时运作,甚至AMD(ATI)和NVIDIA的控制面板和快捷方式都可同时查看!它们和谐相处,泰然自若。
“点石成金术”其实非常简单,只需在“显示属性”中选中NVIDIA显卡,将下面的“将Windows桌面扩展到该显示器上”打上选钩,一切就这样成了,幻化神奇仅仅在这一个对钩上。
此时我们进入到NVIDIA的PhysX物理加速控制面板“PhysX Properties”中,虽然上面显示的内容是还是“No Acceleration”,但这仅仅是NVIDIA不愿放下身价“配合”AMD(ATI)的假象而已,后续的测试也将证明PhysX物理加速确实已经无缝的融入到了这一系统!
我们首先运用最直观的PhysX物理加速检测程序FLUIDMARK来进行测试。FLUIDMARK通过发射数量及其庞大的粒子碰撞球体,并在碰撞后让粒子呈现一种泥浆状态来演示物理加速效果。其中涉及到粒子加速、重力学加速、碰撞检测加速、流体加速等多个方面的物理加速效果,可以说比较全面的反映了系统性能。
FLUIDMARK测试完成后会给出直观的测试分数,和帧速率统计,并在测试过程中同步显示发射的粒子数量、实时帧速率、测试进度,并且在测试过程中和测试结果中都会给出是否为硬件加速的判断,非常直观易懂。
首先是无硬件加速的成绩。在测试的初期阶段,帧速率还能维持在流畅,但当粒子数量不断增多后,速度逐渐降低,最后的测试成绩也反映了这一情况。
8500GT+HD3850
8500GT-GDDR2+HD3850
9500GT+HD3850
9600GSO+HD3850
9600GT+HD3850
9800GT+HD3850
8800GTX+HD3850
接下来依次是HD3850配合不同NVIDIA显卡的性能表现。从最终的成绩看,混交系统确实成功开启了物理硬件加速,画面运行流畅度也代为提升,而且随着流处理器的变化,其性能表现也有相应的变化。同时,通过对8500GT-GDDR2版本的测试,证明显存带宽并不会严重影响物理加速的效果,至少在8500GT上是如此。
接下来进行独立NVIDIA显卡的FLUIDMARK测试。
8500GT
9500GT
9600GSO
9600GT
9800GT
8800GTX
测试结果出现了戏剧性的变化。流处理器较多的N卡在进行独立测试时,表现出了比混交系统更强大的性能,而像8500GT这样的显卡却表现的不如混交系统。分析其原因,由于FLUIDMARK偏重表现物理效果,所以纯粹的画面渲染负担并不高,流处理器较多的显卡在进行物理运算时还可以分配出足够的资源做图形运算,使得整体成绩提高。而8500GT这种本身硬件资源并不充裕的显卡,要负责复杂物理运算的同时还要进行图形运算,自然力不从心。
不过,搭配HD3850显卡时,所有的NVIDIA显卡应该都是全力负责物理运算,整体成绩不应该比NVIDIA显卡独立测试的时候低,但是事实并非如此。笔者姑且大胆猜测三种可能,其一是HD3850的图形运算能力制约了NVIDIA物理性能的发挥,速度上限受制于图形渲染,即木桶原理;其二是由于NVIDIA显卡当作物理加速卡时运作在PCI-E 4X的界面下,影响了性能的发挥;其三是由于混交系统的组建并非AMD(ATI)和NVIDIA当初所预期,所以在软硬件配合上都未能达到默契的程度,最终影响了性能的表现。不过考虑到随着流处理器的增加,混交系统的成绩也基本呈线性增长,以及AGEIA的物理加速卡只不过是PCI界面,带宽远比PCI-E X4低,仔细分析起来,第三种可能性更具说服力。
不过A+N的混交系统初战告捷,证明确实有效的结论还是鼓舞了我们继续摸索下去的信心!
人的探索精神永远是最宝贵的,当然,现在很多时候他们说这叫恶搞,心态膨胀,不管怎么讲,我们都进行了一个更加有趣的测试环节。就是在混交和独立两种状况下,看看系统到底能硬件加速几个FLUIDMARK,结论有点惊人!
在混交模式下,8500GT和9500GT只能运行1个FLUIDMARK测试,再多也只能硬件加速其中一个,而其它的只能运行在软件加速模式;9600GSO情况稍好,可以同时硬件加速2个;9600GT更进一步,同步加速3个不成问题;9800GT比较出人意料,也只能同步加速2个;8800GTX没有辜负128 SP的盛名,同步加速数量达到4个!
独立模式下情况有所变化,8500GT、9500GT、9600GSO都只能加速1个FLUIDMARK;9600GT的加速数量下降到2个;8800GTX也未能幸免,同样减少1个只能做3个同步加速;而神奇的9800GT似乎找回了状态,与混交模式相同,还是可以同步加速2个。
这样的结论虽然很奇怪,笔者也摸不着头脑,不过至少证实了混交模式下NVIDIA显卡的运算资源还是比独立模式下更多的投入到了物理运算中,单个FLUIDMARK测试成绩未必提升。而且NVIDIA在独立运行多个硬件加速的FLUIDMARK后的成绩之合基本等同只运行1个的成绩,而一旦超出硬件允许加速的最大同步数,启用软件加速后,成绩直线下降,即使是硬件加速的程序性能也非常之低!
其中还有一点奇怪,流处理器数量更多的9600GSO和9800GT的同步运行数量竟然不及9600GT,这基本上超越了笔者的认知,分析不出原因,不过这让笔者联想到一点,就是曾经传言的9600GT所采用的G94核心的流处理器效率被NVIDIA重新调校过,效能更高。而9600GSO和9800GT无论是96SP还是112SP,都采用了G92核心。
如果仅仅看FLUIDMARK的测试结果,读者希望购买一块NVIDIA显卡充当物理加速卡的话,9600GT似乎是更明智的选择。
如果说16SP的8500GT可以硬件加速一个FLUIDMARK的话,那128SP的8800GTX只能加速4个似乎不合道理,而4同步这一问题也让笔者意识到是否是因为笔者采用的4核CPU的限制,当然,目前桌面系统还没有比4核心更多的CPU出现,提高的可能性没有,但是笔者可以降低到双核心系统看看8800GTX的表现。
在E4300双核心系统下,神奇没有发生,8800GTX还是照常同步加速了4个FLUIDMARK。看来要让更多流处理器的NVIDIA显卡发挥出更强大的性能还是要仰仗NVIDIA不断更新的驱动啊,哪怕他是连续几个月的BETA版!
由于FLUIDMARK最直观的测试过程和成绩表现,或者说这是个懒人用的测试程序,笔者准备要榨干它最后一滴油水!
我们都知道不管是AMD(ATI)还是NVIDIA,它们利用显卡进行的非图形运算都是基于核心内部的流处理器部分,也就说性能表现全仰仗流处理器的运算能力,而NVIDIA从GeForce8开始引入了流处理器/核心异步频率概念,即两部分的频率可以独立调节,笔者希望证实单独调节流处理器频率是否有助于物理加速部分的应用。
由于笔者在进行这项测试的时候系统安装卸载驱动程序次数过多,可能引起了系统混乱,造成Rivatuner不能调节频率,故而转入到重新安装的VISTA SP1中进行测试,测试对象是独立运作的9600GSO显卡。
笔者分别独立拉高流处理器频率至1625MHz,拉高核心频率至650MHz,以及联动下同步将核心和流处理器频率拉高至650/1625MHz。测试结果并非笔者的想当然,看来流处理器也不是CUDA运算的全部,分析原因,运算部件的部分单元以及一些cache部分还在核心中,以及通过TMU等部分读取的数据速率都决定了只拉升流处理器并不能得到满意的结果,而同步提升才是明智之举!
当然,在VISTA系统下的测试成绩和XP下的有些许出入,两者并不具备可比性,仅仅是为了证明频率对于物理加速的影响幅度。
众多测试中最吸引笔者的是韩国出品的跳舞类网游《MSTAR》,其精美的人物造型是最大的亮点,笔者自然不能免俗。如同《劲舞团》的游戏方式,再结合靓丽的俊男美女造型,相信这款网游一旦引入国内,必将大受追捧。不过在这之前,国内发行版本应该将一些过分暴露的衣衫进行修改才是,否则估计很难通过审查……至少把衣服摆动的阻尼值提高一些,形变太大的衣服虽然养眼,但有害身心发展。
《MSTAR》采用UT3引擎作为基础,而由于UT3从AGEIA时代就已经加入了对PhysX引擎的支持,自然使用本次测试。笔者这里才用了带测试功能的DEMO版。《MSTAR》针对烟雾加速、头发加速、布料加速等物理加速运用提供了很好的测试环境。
同样规矩,先看无物理加速状态下的测试成绩。在DEMO运行的画质模式下,HD3850显然不可能成为性能的瓶颈,而这样的成绩表现只能“怪罪”于纷繁的物理效果。
接下来是混交模式下的性能表现。
基本上除了8500GT的表现比较弱势意外,其它NVIDIA显卡搭配HD3850基本都维持了均一的成绩,性能差距用测试误差解释更为合理。分析其中原因,可能是游戏设置了最高的60fps的帧速率上限,也可能是HD3850本身的3D渲染能力限制了整体性能的发挥。当然,最为可能的还是驱动配合在这样“怪异”的混交系统下软硬件配合不协调的结果。不过,总体而言相对于软加速模式,性能提升的幅度都是惊人的!
笔者也再次测试的8500GT-GDDR2版本的性能差距,显然多少还是有一些,不过总体性能差距并不明显,看来脱离了纯粹的测试软件后,在实际游戏中显存带宽对物理加速的影响并没想象中明显。
同样,混交后是NVIDIA独立的表演。
与FLUIDMARK测试结果不同的是,这次由于《MSTAR》的渲染量明显增加,在进行3D渲染的同时额外负担物理加速,使得参测的NVIDIA全线显卡都出现了相较混交下的性能下降,8500GT由于工作负荷过大,甚至出现了性能表现不如软加速的情况!而除了9500GT性能表现较弱外,9600GSO、9600GT、9800GT、8800GTX的表现基本相近,并无太大差别,这与其流处理器数量并不成比例,看来结论还只能归罪于NVIDIA的驱动开发还不够完善。
笔者在测试中还发现了一个有趣的现象,在用运算能力较弱的8500GT独立测试时,画面一直贯穿着布料或者头发的异常形变,结合到笔者曾经的工作环境(MAYA动画制作),这种情况正是由于实时物理演算时处理能力不足造成的。由于这些穿帮镜头造成过分暴露的画面,笔者虽然截图但也就不放出了,有兴趣或者恶趣味的读者大可自行测试……
题后话,笔者在进行测试到一半的时候,从NVIDIA公司内部又获得了最新版本的测试DEMO,据说除去了些许BUG,并且运行画面稍有变动,不过测试流程基本原样保留。但遗憾的是新版DEMO只能在独立NVIDIA显卡下才可以运行,混交系统下报错退出。笔者的好奇心还是让笔者在独立NVIDIA显卡系统下进行了简单测试,发现同一张显卡在新版中的成绩有较大幅度下降,不知道这是不是新的“BUG”,呵呵。
测试进行到这里笔者拆装显卡的次数已经无数,驱动装卸次数更是无从统计,不过为了广大读者第一时间获得有用信息,笔者还是点燃了一只中南海香烟继续着枯燥的测试。
接下来测试的是国内目标软件出品的网游《铁甲突击MKZ》,应该说在最新技术的采用上目标软件让国个人骄傲了一回!
同样的规矩,无硬件物理加速成绩现行放出。遗憾的讲,即使在4核心酷睿处理器的推动下,测试进行的还是很艰难,最高帧速不过10fps,平均成绩只有个位数,除了惨不忍睹外没有更贴切的词汇来形容。笔者相信目标软件在将《MKZ》推向市场的时候应该在设置项目中提供PhysX物理加速开关,否则对硬件要求如此高的网游普及起来非常具有难度。
混交测试成绩接着放出。
《MKZ》的测试成绩终于让搭配不同NVIDIA显卡的混交系统分出了高下,也体现出了多流处理器带来的运算能力提升!除了性能做若的8500GT外,其它混交系统的成绩都比较令人满意,其中的9500GT与其它显卡拉开了较大差距,但也明显高于8500GT。而9600GSO、9600GT、9800GT、8800GTX性能表现一次递进,不过相邻显卡之间的表现还是差距不够明显。
NVIDIA独立显卡系统的成绩表现。
NVIDIA独立显卡的表现就显得比较无序了。虽然也和混交系统类似表现出了梯次分明的特点,但其中一些性能的升降还是没有明显规律。基本上9600GSO、9600GT、9800GT、8800GTX的成绩和混交系统下维持一致,没有明显变化。而9500GT则大幅下挫,看来复杂的3D渲染工作已经让32 SPs的它显出疲态了。而神奇的是,本以为成绩会大幅下降的8500GT却也表现出了和混交系统几乎一致的性能,让人惊喜!
后记,在《MKZ》的测试过程中,每次运行时的场景画面都不尽相同,重点就是道具在被破坏后所标出来的形式和运动轨迹等,其中尤其以打烂布料、打碎玻璃、轰爆两辆悍马为明显。其实正也正是物理特效运用的魅力所在,让你的每一次游戏体验都不尽相同,甚至于利用这些不同而拥有多种的游戏方式。
这与非物理引擎所表现的物理效果截然不同,在无物理引擎参与的情况下,任何的物理效果其实都是脚本编写好的,无论你怎样变换形式的去“蹂躏”它,只要你触发了这个脚本,它都会按照脚本规定好了的方式演进,每次都一样。而物理引擎是根据初始化的数值以及物体真实的碰撞、爆破、飞行等相互作用来每次重新计算,诸如扰乱场、风场、重力场、阻尼这些参数的初始值不尽相同,自然每次的演算效果也就不同,带给玩家更丰富的体验!
《Ghost Recon Advanced Warfighter 2》也是在AGEIA阶段就加入了物理引擎的游戏之一,甚至在主页面中有一个独立的“AGEIA ISLAND”的单独场景供玩家体验物理加速效果。
游戏中表现了大量的风场动力学效果和爆炸效果,只不过游戏难度颇高,笔者在进行测试时没挨几颗子弹就倒地了,也使得笔者只能选取“AGEIA ISLAND”场景中最开始阶段的气瓶爆炸部分作为测试点。
《Ghost Recon Advanced Warfighter 2》比较特殊的是,只要当系统内出现可供物理加速的硬件设备时,在设置中才可以选择物理特效等级,而“AGEIA ISLAND”场景也才能进入,故而无法获得软加速的成绩,只能提供混交模式和独立模式两套成绩。
最开始放出的还是混合模式下的成绩。
基本上在笔者测试的有限空间里,混交系统的性能表现非常均一,即使有成绩上的细微差别也基本上可以看作测试误差,可能是因为《Ghost Recon Advanced Warfighter 2》中的物理运算还不够复杂吧。
NVIDIA独立显卡测试成绩。
终于看到了写效果,不过依然是8500GT和9500GT表现出了明显的性能下降,而9600GSO、9600GT、9800GT、8800GTX基本没有明显的性能差别,且与混合模式下的测试成绩非常类似,看来《Ghost Recon Advanced Warfighter 2》中的物理运算难度对于这些显卡而言没有太大难度,即使同时担负物理运算和图形渲染都应付自如。
《Warmonger》也是NVIDIA大礼包中的测试程序,看来对PhysX物理加速应该是进行过充分的优化。
虽然《Warmonger》的图像效果不是所有测试中最好的,但它的物理设计应该说是最让笔者满意的,场景中几乎一切道具都可破坏。大到整面砖墙,小到地面上的木片,都有相应的物理效果,而其中除了没有头发加速的效果外,其余物理效果元素基本都囊括了,很是全面。其中被击毙的敌人也应用了类似“布娃娃”的系统,“死相”显得比较自然,实体会贴附在其周围的环境中,而且如果继续向尸体射击,它还会继续按照物理规律做出相应动作,虽然真实度大大增加,但也带来了些许血腥味!
笔者测试时选用了一个包括布料运算、烟雾元算、粒子元算、爆破运算、破碎运算的场景,希望于能较全面的验证系统性能。
首先带来的还是软件运算的效果。
一进入游戏速度就非常缓慢,帧速率基本都是在个位数上跳动,不具备可玩性,不过所有的物理运算效果还都有保留。不过这样的速度下估计没有任何玩家愿意体验。
混交系统的表现就比较抢眼。
混交系统下8500GT依然垫底,而9500GT、9600GSO、9600GT表现出了相近的性能,性能差距基本可以认为是测试误差所致。
NVIDIA独立显卡测试中同样的情况再次上演。
所有NVIDIA独立显卡都较混交模式下性能有明显下降,不过排名基本遵照混交系统,此时8500GT基本不具备可玩性了。
《Unreal Tournament 3》的测试是笔者本次测试中比较遗憾的一个环节,仅仅跑了HD3850+9600GT的混交测试后,由于测试过程中装卸驱动次数过多,《Unreal Tournament 3》终于崩溃了,即使笔者卸载重新安装也于事无补,且限于时间,笔者也无精力重新安装系统来补救,也只能让读者留有遗憾,不过如果读者有需求笔者自当在后续补遗测试中将UT3全额补齐!
《Unreal Tournament 3》作为目前支持PhysX物理引擎的最知名作品,其影响力不仅仅局限在自己,包括采用了UT3引擎的一系列大作,诸如《彩虹6号:维加斯》、《生化奇兵》、《荣誉勋章:空降兵》、《战争机器》、《前线:战争燃料》、《最后的幸存者》,以及前面提到的《MSTAR》。可以讲这些知名游戏在推动PhysX物理引擎普及中都会起到推波助澜的作用。
而UT3引擎也早在AGEIA时代就与其合作,专门推出了物理加速体验场景,NVIDIA收购AGEIA后更是发扬这一传统,继续推出新版物理体验地图,并连同前作一起随大礼包提供下载。
在三个物理体验地图中,笔者选择了Lighthouse_PhysX地图进行测试(其实行选择全部3个,但崩溃的程序让笔者无能为力)。也仅仅进行了HD3850+9600GT和软加速的测试。
测试结果并没有笔者之前看到的大,当然也可能和笔者的测试有关。但是混交系统还是有不错的性能提升。
题外话,在软加速模式中,笔者感觉跑破效果后碎片的数量相对较少,而且碎片在落地一段时间后就自动消失了,而有硬件加速的环境下并未发生类似情况,不知是实际情况真正如此还是笔者的主观误判。另外,不管是有无硬件物理加速,当场景破坏到一定程度的时候,游戏帧速率都将明显下降,这应该和场景多出许多需要额外渲染的物体有关,HD3850的图形渲染能力已经不足以应付了。此外,UT3虽然场景制作华丽,但可物理破坏的的地方并不多,而且让玩家一眼就能辨认出那些是可破坏的部分,有点“我在这里,来打烂我把!”的意思,对于热衷于爆破的“破坏王”级玩家稍嫌不过瘾。
虽然测试没能进行下去,不过笔者在VISTA系统中还是抓紧时间体验了一把UT3的全部物理场景。包括前面提到的Lighthouse_PhysX和Heatray_PhysX、Tornado_PhysX。
全新的物理效果加入确实让游戏玩起来更有乐趣,游戏方式也变化多样起来。到处飘洒的雪花,让敌人无处可藏的可破坏墙壁,以及不小心就被砸到的卷携在龙卷风中的大号水泥管!
在NVIDIA的PhysX加速支持列表中赫然在列了《Mass Effect》,笔者也辛苦的下载并安装了游戏,但出人意料的情况还是发生了。
游戏开头冗长的英文对白已让笔者有些不耐烦,毕竟是用来跑测试而不是欣赏游戏,但是真正进入游戏环节后笔者经过反复换卡测试,竟然分毫察觉不出有无硬件物理加速的变化,不论是软件加速还是混交加速更或者是NVIDIA独立显卡加速,游戏帧速率始终维持在一个很小的空间内波动,笔者寄予厚望的《Mass Effect》就这样灰溜溜的推出本次测试舞台。笔者下载游戏的时间都远长于游戏的测试时间,真是辛酸泪无处投啊...
《Great KULU》也是在NVIDIA大礼包中提供的测试软件。其内容就是一个身似肉虫的怪物在哪里“波动”(其身体的变化形式笔者一时难以找出合适的形容词),而玩家有一只光电枪可以刺激肉虫的身体,让它“波动”的更复杂。
本以为作为NVIDIA专门演示CUDA应用大礼包中的成员,其物理演示效果应该足够出色,至少应该维持在可分辨软/硬物理加速的 程度,但遗憾的是,和《Mass Effect》一样,不管是软件加速、混合加速、NVIDIA独显加速其帧速率均维持不变,甚至于从8500GT 一直换到8800GTX差别都极小,只有8500GT单独运行的时候性能有较大幅度下滑,其余都是一样,颇让笔者失望。笔者反复检查系统 设置和游戏设置,也没发现有任何不妥之处。
后记,遗憾,希望。
任何事物都不会完美,正如本次测试。连续的更换显卡和装卸驱动导致的Rivatuner异常以及UT3的崩溃都是始料未及的,以及没有时间换用P45、X48这样的双高速PCI-E插槽的主板验证笔者的一些想法。
遗憾的还有未能获得GT200核心的产品进行全面的产品测试,而笔者听言NVIDIA PSG工程师的说法,GT200在CUDA应用上的表现会远超GeForce8/9系列,不仅仅是因为流处理器的增加,而是专门为非图形运算针对性的优化设计,可惜也无从验证了。
遗憾于时间所迫,没有机会用HD4850全面搭配NVIDIA显卡做混合双卡系统测试,看看在3D渲染主卡性能获得大幅提高后,9600GSO、9600GT、9800GT、8800GTX的物理加速性能表现是否能立分高下。
还遗憾于NVIDIA CUDA体验大礼包中的《Badaboom》视频转换软件未能测试,笔者多次发出注册码申请,但始终没有收到回音,也无怨一探混交模式下非PhysX物理加速的CUDA应用是否可行。
最遗憾的更是目前A+N混合双卡系统只能在Windows XP系统下运作,VISTA系统下由于特殊的驱动模型,并不能允许两个WDDM的显卡驱动并存,故而无从谈及混交支持。不过笔者亦听说与VISTA有近亲关系的Windows 7允许不同的显卡驱动共存,而笔者也打算一试,或者MS能大发慈悲的发布一个补丁解决VISTA的问题,至少笔者可以方便的利用3DMARK VANTAGE来检测效果。笔者强烈希望读者在看完本文后,留言指教笔者如何在VISTA下安装两款显卡的驱动技巧,或者进行讨论,让更多的人参与到解决问题的行列中来,毕竟这关系到玩家的切身利益。
笔者也希望AMD(ATI)承诺过的HAVOK物理硬件加速技术能够快些出现,这样A+N的混交系统的使用范围会更加广阔。也许同一款游戏支持两个物理引擎,谁做的好我们就用谁的,这才是投资的最大回报。笔者也附出HAVOK和PhysX物理引擎游戏支持列表,希望读者在看完本文后能有更全面的软件资讯掌握。
笔者还希望不论是AMD(ATI)还是NVIDIA,可以将物理加速概念抑制到专业图形制作领域,让那些MAYA、3DMAX的用户们也体验 到昂贵的专业图形卡不仅仅只能做加速线框等操作,让繁杂的物理运算摆脱本已资源枯竭的CPU。
笔者更希望NVIDIA在得知这个消息后不要屏蔽掉混交的道路,应该大度的支持这种做法,毕竟作为物理加速卡当前情况下也还是要购买NVIDIA的产品,更何况这也是发扬PhysX和CUDA的大好机会,何乐而不为?做一些让玩家真正快乐的事情其实很简单。
当然,这一切只是刚刚开始,曾经的不可能今朝已经变为现实,而且幻化出了更强大的性能,以上的种种遗憾笔者也相信在不久的将来都会一一解决,毕竟所有的软硬件厂商都在宣传自己为客户着想,我们正看着他们的实际行动!
最后,笔者要说:“和谐的世界很美好!”<