迈进55nm新纪元!9800GTXPlus权威测试
2006年11月,G80的面世宣布了DX9时代的结束,显卡迎来了全新的DX10时代。并且,显卡的渲染方式从根本上得以改变,传统的管线渲染架构被遗弃,而换来全新的统一渲染架构、SM4.0的支持、超标量大规模的流处理器等,这也正是DX10之所以在正式走入人们生活之前,就备受期待的原因。
DX10将人们在电脑上的视觉感受真正意义上带进了电影画质时代,我们在游戏当中见到的每一块岩石、每一片树叶、每一缕光束乃至每一滴水,都将更加接近我们用双眼在现实中所感知的一切。游戏的过程将更加接近于某种真实的体验,而不是各种卡通状物件的预设和排列组合。游戏的创造者们将有更广阔的空间来展示他们的创意和想法。
G80虽然性能强大,但不过是DX10的雏形。显卡的发展仍然以两倍于摩尔定律的速度高速前进着。G80推出之后半年,NVIDIA改进了G80核心的工艺,推出了性能王者8800Ultra;去年,NVIDIA推出了首款采用G92核心的8800GT,DX10进入了青壮年时期;而上个月,NVIDIA再度更新旗舰,推出了采用第二代统一架构的GTX 200系列产品。
现在,基于G8x核心的产品已经被历史残酷的遗弃,自从首款Geforce 9显卡9600GT诞生以来,NV的产品线就正式跨入了Geforce 9时代。虽然说现在NVIDIA已经发布了GTX 200系列产品,但从市场定位上来看,其只是例行保住王者地位而已,并不对当今的Geforce 9系列产品构成任何威胁,关于这一点我们稍后会讲到。
如果说G80是DX10的雏形,那么G92就是见证了DX10成熟的一代重要核心。相对于G80来说,G92核心有着多个项目的改进,包括制程工艺的提升、引入高清视频解码单元、完美支持HDMI与DisplayPort接口以及采用PCI-E 2.0技术等等。
● 制程工艺提升 65nm成就7.54亿晶体管
G80采用了90nm的制程工艺,虽然只是拥有6.81亿的晶体管,但是其核心面积就高达482mm²,其功耗和发热量也相当惊人,甚至需要双6Pin的外接供电,以保证显卡的稳定运行。
而G92核心采用了65nm的工艺,核心晶体管数量增加到了7.54亿,这时候核心面积仅为289mm²,相对于G80来说大幅度减小,切功耗、发热量都有很大的降低,仅仅需要单6Pin的外接供电支持,设计功耗也从G80核心的8800GTX降到了140W。
● 优化PC深入人心 高端显卡也需硬件解码
G80刚刚发布的时候,由于产品研发的太早,并且NVIDIA认为买高端显卡的用户,主机CPU配置也不会太低,所以没有在G80核心上加入高清硬件解码单元,使用G80显卡的用户播放高清视频就只能通过CPU硬扛。但现在,随着优化PC概念的逐渐深入人心,人们即使买高端显卡,也不一定会买高端CPU,所以在高、中、低端全线产品上加入高清解码单元也成了必须,所以NVIDIA在G92核心上加入了之前8500/8600等中、低端显卡才拥有的PureVideo HD高清视频解码单元。
同时,G92核心还可以支持HDMI、DisplayPort最新的高清数字输出接口,也支持了HDCP高带宽数字内容保护技术,并且是无前列的加入了双流解码技术,即用户可以用同一块显卡在同一个时间解码两部HDTV视频。
● 采用PCI-E 2.0标准 显卡接口带宽翻倍
G92核心还有一个特点就是采用PCI-E 2.0接口,支持PCI-E 2.0的每个PCI-E通道传输率都高达300M/S,采用PCI-E x16接口的显卡总接口带宽就高达300×16=8GB/S,而之前G80时代,PCI-E 1.0的每个通道传输率仅为150M/S。
可以看出,G92核心相对于G80核心来说,完完全全不仅仅是型号上的提升,虽然架构上没有大的改变,但是硬件规模以及一些功能方面,有着大幅度的升级。也正因为如此,基于G92核心的精简版产品8800GT在部分游戏中就足以与G80王者8800GTX媲美,而采用完全版G92核心的9800GTX更是成功的夺得了8800GTX所在的王者宝座。
G92核心发布之后,先后推出了基于该核心的8800GT、8800GTS 512M、8800GS,紧接着又推出了9800GTX、9600GSO等产品,据说还会推出9800GT,NV已经完完全全从GF8过渡到了GF9时代。
实际上,后来推出的两款基于G92核心的显卡,只是NVIDIA的更名策略。9800GTX和8800GTS 512M的硬件规格完全一致,都是采用了128SP的完整版G92核心。而9600GSO是8800GS改名而来,对流处理器规模以及显存控制器进行了删减,拥有96个流处理器和192Bit的显存位宽。有消息称今后推出的9800GT将会是8800GT的更名版。
现在,NVIDIA又非常低调的推出了新产品9800GTX的增强版——9800GTX Plus,也就是我们平常所说的9800GTX+。最新推出的9800GTX Plus主要是对G92核心的工艺进行了改进,从之前的65nm工艺提升到了55nm工艺。
在同样的晶体管数量下,工艺的改进最明显的就是带来了更小的芯片面积,从上面的图片中我们可以看出,新推出的9800GTX Plus核心面积确实要比老版的9800GTX小不少。更小的核心面积也就意味着发热量与功耗都会更低,有利于显卡工作在更高的频率上;同时,新工艺还可以带来成本上的降低,可谓是一举多得。
显卡是为了图形渲染而诞生,一直以来只能处理图形方面的计算。但现在只能处理图形渲染的显卡已经一去不复返,显卡强大硬件规模的触角已经开始伸向其他的计算领域。
● CUDA显威力 并行计算时代来临
大家都知道,显卡的硬件规模远远要比CPU更加复杂,早在多年前就有人构想利用显卡强大的硬件规模实现其他方面的计算,但是一直没有大规模的实现。而现在NVIDIA开发了CUDA编程环境,任何用户都可以通过CUDA开发包,开发出利用显卡来计算的程序。
简单的说,CUDA就是显卡处理通用计算的一个接口,曾经只能执行图形渲染的GPU终于可以处理其他方面的计算。并且,显卡进行通用计算还有一个最大的优势,那就是并行计算。我们先来看看什么是串行计算,什么又是并行计算:
串行计算是指在单个中央处理器单元上对数据进行处理,并行计算是相对于串行计算来说的,其在时间和空间上都比串行计算效率更高,时间上的并行就是指流水线技术,而空间上的并行则是指用多个处理器并发的执行计算。
CPU就是串行计算的代表,当然我们也看到其向并行计算发展的趋势,比如目前的双核、四核CPU。但是,CPU永远也无法跟上显卡的发展速度,9800GTX Plus拥有128个流处理器,也就是相当于128核同时并发性的计算,可以想象其计算能力有多强大。
当然,并不是说CPU就完全没用,今后的PC主要还是CPU与GPU搭配使用,CPU+GPU的计算就是我们所谓的异构计算。
● 付出终得回报 9800GTX Plus支持物理加速
从GeForce 7/X1000系列开始,GPU物理加速就成为了两大芯片厂商的口头禅,双方隔三差五的通过小Demo或者小视频来展示GPU处理物理运算能有多么强大。但是直到今天,还没有哪款游戏大量使用GPU进行物理运算,只有一部分游戏使用了CPU或者物理加速卡进行物理加速。
现在,NVIDIA收购了物理加速卡厂商Ageia,借助CUDA使Ageia的PhysX技术在短短一个月之间,就成功移植到了NVIDIA GPU上。也就是说,现在实现物理加速已经不再需要单独的物理加速卡,你只是需要购买NVIDIA的GPU就可以实现。
9800GTX Plus可以单独进行物理加速能力测试(CPU得分)
不过,基于Geforce GPU物理加速的驱动在前段时间才刚刚推出,也就是版本号为177.39的ForceWare驱动。同时,NVIDIA还发布了单独的GPU物理加速驱动PhysX driver version 8.06.12,这两款驱动都是随着9800GTX Plus同时面世的,所以从时间上来说,9800GTX Plus成了第一款正式支持GPU物理加速的显卡。当然,支持CUDA的Geforce 8、9系列显卡都可以支持GPU物理加速。
前面我们说到了一些9800GTX Plus的历史以及特性,下面我们回到产品上来看看9800GTX Plus的市场定位。
上个月中旬,NVIDIA发布了GTX 200系列显卡,包括两款产品——GTX 280与GTX 260。不过这两款产品定位都太过高端,GTX280零售价格高达4999元人民币,而GTX260的零售价格也高达2999元人民币,显然这两款产品的定位都是发烧友级别的用户,NVIDIA也仅仅是更新旗舰,中端市场依旧靠Geforce 9系列显卡来支撑。
就在GTX 200系列显卡发布之后一周,AMD就发布了基于RV770核心的HD4850显卡,定位在千元级市场,主要为了取代HD3850和HD3870的位置。市场上的HD4850显卡平均价格在1400元左右,而性能几乎可以达到RV670(HD3850)的两倍,凭借着超强的性能以及超低的价格,HD4850在发布短短的两三周时间里,就已经受到了广大用户的关注,销量也是直线上升。
实际上,HD4850成功的另一个原因就是,基于65nm G92核心的9800GTX性能并不是HD4850的对手,除了9800GTX,NV的产品线上就只有双核心的9800GX2、旗舰级的GTX 280与GTX 260了,显然AMD钻到了9800GTX与GTX 260之间的这个空档。
现在,9800GTX Plus的推出,正好填补了NVIDIA中高端产品线的空缺,官方零售价格仅为1599元,而之前老版本的9800GTX零售价格下调到1399元。可以看出,9800GTX Plus就是专门针对HD4850而生。这两款产品必将在中端市场上互相残杀,这也是我们今天讨论的主题。
● 不被忽悠 小编告诉你如何识别9800GTX Plus
如今市场上已经有个别品牌的9800GTX Plus上市开卖,不过很多网友并不知道如何区分9800GTX与9800GTX Plus,实际上方法十分简单,大家注意看下面两张照片:
从上面两张图片可以看出,采用65nm工艺的9800GTX核心大小明显要比55nm工艺的9800GTX Plus大一些,不过如果你购买时没有参照物也完全没有关系,仔细看核心上的编号,采用65nm工艺的9800GTX编号上有G92-420-A2字样,而55nm工艺的9800GTX Plus是没有这一行字的,非常好区别。
前面我们说到,9800GTX Plus实际上就是9800GTX的增强版,主要是核心工艺上从65nm提升到了55nm,更新的工艺可以使得显卡工作在更高的频率上,果然9800GTX Plus在频率上相对9800GTX有了大幅度的提升,请看下表:
从表中的数据我们可以看出,55nm工艺的9800GTX Plus默认频率就高达738/1836/2200MHz,而采用65nm工艺的9800GTX默认频率为675/1690/2200MHz,核心频率提高了9.3%,Shader频率提高了8.6%。并且,在这个频率上应该还有不小的超频空间。
下面我们来看一下9800GTX Plus的做工与用料:
9800GTX Plus延续了NVIDIA中、高端显卡一贯的作风,采用黑色PCB,主要基调也是纯黑色,散热器上有一个不完整的NVIDIA Logo,似乎象征着某种神秘。
显卡采用涡轮式散热器,整个散热器采用铜铝结合的材质,与GPU直接接触的部分采用纯铜材质,更加有利于GPU上的热量及时导出。
核心方面不用多说,显存采用Hynix推出的0.8ns GDDR3显存颗粒,共8颗显存组成了512MB/256Bit的显存规格,默认显存频率高达2200MHz。
显卡供电部分采用了分体式供电设计,核心采用4相供电,显存部分采用两相供电。并且拥有双6Pin的外接供电接口。除了为供电输入滤波的一颗电容采用日系三洋SVP固态聚合物电容之外,核心和显存供电全部采用日本化工PS系列高品质固态聚合物电容,且全部采用封闭式陶瓷电感。
9800GTX Plus仍然保持了双DVI+S-Video的接口设计,不过可以支持Dual-Link输出,并且可以完美支持HDCP协议,可以通过转接的方式支持HDMI高清输出。
由于9800GTX与9800GTX Plus有着不可分割的关系,相信很多网友都想看看这两款显卡到底有没有什么区别,所以我们这次采用了两款显卡对比赏析的方式进行比较。
注:显卡散热器上有Logo的是七彩虹推出的9800GTX,另一块则自然是NVIDIA公版的9800GTX Plus。
可以看出,9800GTX Plus与9800GTX完全是基于同一款PCB设计,显卡整体布局、用料几乎完全一样,看来仅仅是核心大小有所区别。
实际上,NVIDIA这样做也是最节省成本的做法,9800GTX Plus可以直接用在之前9800GTX的PCB上,这样就不用重新为新核心设计PCB,节省了很大一部分费用,有利于控制显卡的上市价格。
● 测试平台配置
PCPOP.COM评测室 | |
硬件系统配置 | |
Intel QX9770 四核心, 3.2GHz, L2=12MB | |
主 板 | ASUS X48 |
显 卡 | |
内 存 | CORSAIR Dominator TWIN2X2048-10000C5DF DDR2-800(4-4-4-12)×2 |
硬 盘 | 西数3200AAKS 32 |
电 源 | 海盗船 1000W |
软件系统配置 | |
Windows vista Unimate 32Bit SP1 | |
DirectX | 10.1 |
显示驱动 | NVIDIA Forceware 177.39Beta |
为了能充分发挥显卡的潜力,我们采用了优异的Intel 四核心QX9770 CPU,搭配华硕的X48主板、4GB DDR800内存;操作系统采用了Windows Vista SP1正式版。9800GTX Plus与9800GTX都采用ForceWare 177.39Beta,可以支持物理加速,HD4850采用催化剂8.6驱动。
● 参测显卡
为了能更加直观的体现出9800GTX Plus的性能,本次我们还加入了9800GTX、HD4850进行参照测试。参测显卡全部为公版设计、公版频率的产品。
参照测试显卡之一:七彩虹9800GTX CH版;公版设计公版频率
特别感谢所有提供测试硬件的厂商!
● 测试项目
目前搭配千元以上显卡的玩家多数都选择22寸宽或则24寸宽LCD,所以我们选定分辨率为1680×1050(22寸宽)和1920×1200(24寸宽),并开启4AA16AF,以接近这部分用户的实际使用环境。
测试程序覆盖了理论测试程序3DMark、DX9C游戏和DX10游戏,值得说明的一点是仅仅是测试demo而非可玩游戏的程序我们并没有选用,比如《鱼雷骑士》和《狂野西部》。
●DX9C理论性能测试:3DMark06
3DMark06作为DX9C权威的理论测试工具,包括了两个SM2.0测试和两个SM3.0测试场景,基本上达到了DX9C的画面最高境界,其测试结果对于很多主流游戏都有参考价值。但是如今3DMark06已经难不倒高端显卡了,高端显卡在3DMark06中难分高下,所以我们只能最大程度的提高它对系统的要求,比如说提高分辨率开启抗锯齿等。所以我们选定了在1920×1200 4AA16AF下测试其总分和SM3.0成绩。
在基准测试软件3DMark 06中,由于A卡一直以来表现就非常不错,在本次测试中依然领先。不过可以看出新的9800GTX Plus得分已经远远领先于65nm版本的9800GTX。
●DX10理论性能测试:3DMark Vantage
3DMark Vantage已经在四月底正式发布,全新的引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨,号称“显卡危机”的Crysis也不得不甘拜下风。
3DMark Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级),只有在这四种模式下才能跑出总分,如果自定义模式就只能得到子项目分数了。我们为这次的对决选择了Extreme和High两种模式。
大家知道,如果使用ForceWare 177.39驱动程序搭配PhysX 8.06.12驱动程序的话,可以让GPU进行物理加速,这样虽然会大幅度提升3DMark Vantage的CPU子项目得分,但是对总分并没有什么影响。所以,我们本次测试虽然采用了ForceWare 177.39版驱动程序,但并没有安装NVIDIA PhysX物理驱动,在本文的后面会单独对GPU 物理加速进行测试。
可以看出9800GTX+和HD4850是各有所长,在不同的模式里面表现有所差异,整体性能处在同一档次,差距都不是很大。
●DX9C游戏性能测试:《超级房车:起点》
它来自于2007年最受欢迎的赛车类游戏DiRT的制作者。GRID是一款快节奏的,拥有众多精美场景和广阔视野的赛车类游戏。强化的EGO游戏引擎,让游戏中的碰撞、损坏等更加真实:物理模型将可以保证游戏中车辆的碰撞、损坏和解体等将更加贴近于好莱坞大片中的效果。
画面设置:先开启Ultra画面等级,使所有特效达到最高,再改变分辨率,开启4×AA。
测试方法:进入游戏后测试第一段直道的平均速度,方向键锁定前方,保证所过场景一致。
在《超级房车:起点》这款游戏中,AMD的HD4850凭借着800个流处理器的优势,领先9800GTX Plus与9800GTX,不过这款游戏本身就比较依赖流处理器数量。整体来说,这三款显卡在超高的分辨率下,都能够很流畅的运行这款游戏。
●DX9C游戏性能测试:《使命召唤4》
虽然使命召唤4的场景已不再是二战,但它依然保持了和使命召唤2/3系列相近的画面风格,相信老玩家在游戏中一定会有亲切感,战斗中的爆炸、烟雾效果更加逼真,物理效果也加强了游戏的真实感。
画面设置:使命召唤4引擎对显卡的要求中等,中高端显卡特效全开并且开AA都能有不低的FPS,因此我们只测打开AA时的性能。
测试方法:游戏有一段固定的爆炸场景,FPS比较稳定,也符合游戏实际运行时的情形,用Fraps统计这个过程的FPS,作为最终成绩。
本来《使命召唤4》这款游戏对显存要求不高,但是在开全屏抗锯齿的情况下,对显存频率就有很大的依赖。9800GTX Plus虽然核心频率有大幅度提高,但是显存频率依然没变,所以性能提升幅度不大。
●DX9C游戏性能测试:《帝国时代3:亚洲王朝》
其画面风格一如既往的华丽无比,虽然游戏引擎比较老,但通过精妙的色彩搭配和美术设计,《帝国3》比起DX10 RTS大作《英雄连》和《冲突世界》都是不落下风。
画面设置:帝国3的最新资料片也使用了原来的游戏引擎,画面风格没有任何变化,系统需求也是照旧,对于如今的显卡来说特效全开并且打开抗锯齿运行游戏没有任何难度。起“边缘光滑”开启至“高”就是4AA。
测试方法:及时战略游戏如果没有专用测试程序,就很难在游戏中公平的测试,所以我们选用了游戏即时演算的主界面统计帧数,也能客观的反映出各卡在该游戏中的差距。
《帝国时代3》虽然引擎老旧,但华丽的界面仍然可以作为参考显卡DX9性能的一个项目,从测试得分上看,9800GTX Plus终于在这款游戏中发挥了自己高频率的优势,在1920×1200并且开启4AA的情况下,帧数都接近100FPS,而HD4850在最高特效下只有74FPS的成绩。
●DX9C游戏性能测试:《半条命2:第二章》
《半条命2:第二章》作为《半条命2:第一章》的续集,引擎在HDR和室外场景的渲染方面有所增强,树叶渲染上将采用Alpha覆盖技术,提供更好的树叶细节和反锯齿效果。此外还引入全新的粒子系统,将提供动态软阴影效果。物理引擎也经过重新设计,提供大场景大范围的物理效果。
画面设置:《第二章》还是原来的Source引擎,虽然做了一些改进,但对显卡的要求并没有提高,所以我们测试时特效全开最高,并且打开游戏自带的AA和AF。
测试方法:游戏支持命令录制demo供测试,我们录制的demo覆盖了室内室外场景。
在《半条命2》是所有游戏中唯一打上了ATI Logo的游戏,性能相对于9800GTX Plus来说有优势,这完全是在我们的预料之中。不过可以看出,55nm工艺的9800GTX Plus相对于9800GTX的性能提升幅度还是非常可观的。
●DX9C游戏性能测试:《优品飞车11》
《优品飞车11:街道争霸》是一款真正可以激发你肾上腺素的赛车游戏,给玩家带来令人难忘的高细节的照片品质的图像,更有代入感,它将Autosculpt技术提升到了新的高度。
画面设置:游戏最高只支持到1920×1200,我们将所有效果开启至最高并设置4AA16AF。
测试方法:和《超级房车》一样取游戏开始的一段直道作为测试场景。
在《优品飞车11》的测试中,由于在低分辨率下帧数太高,不能达到对比效果。我们直接采用了1920×1200分辨率,并且开启4AA16AF特效。开启AA和AF特效之后由于主要依赖显存带宽,而9800GTX Plus与9800GTX显存频率没变,所以性能提升幅度不大。
●OpenGL游戏性能测试:《雷神战争》
《敌占区:雷神战争》作为QUAKE系列游戏的最新作,由于引擎源自Doom 3,但比DOOM3在很多方面都有所加强,最引入注目的MegaTexture技术的首次使用。简单而言,MegaTexture就是一张超大的贴图。在《敌占区:雷神战争》中每张MegaTexture容量达到了3GB(类似ClipTexture,并非全场景的动态贴图),在得到更好效果的同时,对显存容量的要求也更高。除此之外,引擎还引入了视差映射、凸凹紋理映射、法向映射和Specular Highlighting、软粒子等目前流行的显示技术。
画面设置:毕竟是源于老迈的DOOM3架构,引擎无论如何改进,对配置的要求也不可能出现翻天覆地的变化,自然是特效全开,并开启游戏内置的4AA16AF。
测试方法:我们自行录制了一段多人对战Demo,调用游戏内置的控制台命令行播放录像,然后就可以得到比较准确的全程FPS。第一次回放Demo时由于Loading的原因成绩较低,所以取第二次的成绩为最终结果。
《雷神战争》一直都是我们考究显卡OPenGL性能的一款游戏,而N卡在OpenGL游戏中一直表现都不错,虽然这次HD4850的OpenGL性能已经有了不小的提升,但是仍然不敌9800GTX Plus。
●DX10游戏性能测试:《孤岛危机》
Crysis(孤岛危机)无疑是现阶段对电脑配置要求最高的PC游戏大作。Crysis的游戏画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。
画面设置:游戏版本为V1.2,开启最强DX10效果(Very High),即便是许多高端显卡也只能在低分辨率看幻灯片,所以我们选择了1920×1200,分别开启最强DX10效果(Very High)和最强DX9效果(High)。
测试方法:Crysis内置了CPU和GPU两个测试程序,我们使用GPU测试程序,这个程序会自动切换地图内的全岛风景,得到稳定的平均FPS值。
显卡杀手《孤岛危机》已经成了当今显卡必测的一个项目,同时这也是NVIDIA Thy Way阵营中的一款游戏。从这款游戏的测试结果来看,不管是在DX9模式还是DX10模式,9800GTX Plus都小幅度领先于HD4850。
●DX10游戏性能测试:《失落星球》
《失落星球》无论DX10还是DX9版本,画面都非常出色,但除了绚丽的画面之外,游戏本身也是可圈可点。
画面设置:游戏版本为V1.03,将所有特效全开最高,可以使画面颜色达到64位。
测试方法:游戏自带测试程序,该程序会将游戏任务第一关的所有场景快速跑一遍,然后得到Snow和Cave两种模式下的平均FPS,测试结果取FPS较低的Snow成绩。
《失落星球》是第一款真正意义上的DX10游戏,在全球拥有不少玩家,所以我们也对这三款显卡在这款游戏中的性能进行了测试。从测试的结果中可以看出,9800GTX Plus在各种模式下都领先HD4850,并且优势非常明显。
DX10游戏性能测试:《英雄连:抵抗前线》
与原来的DX9版相比,《英雄连:抵抗前线》已经是DX10版本。Shader Quality在High基础上新增DX10选项,Terrain Detail(地形细节)在High基础上新增Ultra选项。DX9版抗锯齿只有Enable和Disable两项,DX10版能够完全支持N卡的CSAA抗锯齿技术,并且支持N卡和A卡的8xMSAA。
画面设置:把所有的效果都调最高,能High的就High,能Ultra的就Ultra,抗锯齿设定为None或者4x。
测试方法:游戏自带性能测试程序,它是把任务版第二关的两个过场动画拼接在了一起,测试完之后会给出平均FPS、最大FPS和最小FPS,我们只取平均FPS做对比。
在DX10游戏《英雄连》测试中,9800GTX Plus依然保持着领先的优势,特别是在分辨率比较低的时候,这种优势格外明显。不过令人兴奋的是,这三款显卡在1920分辨率下,开启4倍抗锯齿都能获得近40FPS的成绩,无论怎样都可以流畅运行游戏。
●DX10游戏性能测试:《刺客信条》
老牌游戏厂商育碧不失时机的将横跨数个平台的超级大作《刺客信条》搬上了PC平台,这款结合了古代和现代场景的科幻动作游戏早已在游戏机平台聚集了强大的人气。育碧表示《刺客信条》的DX9画面和DX10画面没有本质区别。育碧之所以为其选用DX10 API,仅是单纯为了调用Shader Model 4.0技术,从而大幅提升游戏渲染效率。
《刺客信条》是目前唯一一款DX10.1游戏,可惜因为某种不可告人的原因,在最新的补丁中官方去掉了对DX10.1的支持,这就让A卡遗憾不已。不过A卡用户可以不打这个补丁,感受下DX10.1带来的新特效。在我们的测试中为了保证特效一致,打上了最新补丁不开DX10.1。
画面设置:将所有特效全开最高,游戏最多支持8×AA,但是当分辨率达到1920×1200及以上就无法开启抗锯齿,所以我们选择了1680×1050 8×AA,更高的分辨率没有AA的模式。
测试方法:游戏通过训练关后会进入一个城镇,我们不对其进行任何操作,直接读取屏幕上稳定的帧数。
《刺客信条》这款游戏比较依赖Shader数量,拥有800个流处理器的HD4850在低分辨率下领先幅度较大。但是当分辨率提升到1920×1200之后,9800GTX Plus迎头赶上,甚至连低频的9800GTX的得分也和HD4850接近。
●DX10游戏性能测试:《冲突世界》
《冲突世界》采用了自行研发的MassTech引擎,支持多种当前的主流显示特效,如容积云,景深效果,软阴影等,光照系统也表现出色,尤其是半透明的容积云特效营造出了十分逼真的户外场景,物理加速结合体积光照渲染出了最逼真的爆炸效果。
画面设置:游戏自带的画面设置多达44个选项,内置的Very High模式并不能把所有选项都调最高,需要手动将其设定为Very Long和1024。
测试方法:《冲突世界》和《英雄连》类似,也是选择了一段非常华丽的过场动画作为测试程序,最终得出最大、最小和平均FPS,测试结果非常精确。
在这款游戏中,9800GTX Plus与HD4850基本上是各有千秋,在不开AA的情况下,9800GTX Plus明显,而当开启AA之后,HD4850又反败为胜。
●DX10游戏性能测试:《生化奇兵》
早在游戏Demo版发布之前,BIOSHOCK就已经声名远扬,著名游戏杂志Gameinformer在较早的时候对其进行了完整测试,并给出了惊人的满分10分,将几乎所有的溢美之词都献给了这款游戏,称之为难得一见的史诗性大作。
画面设置:《生化奇兵》的画面设置项目并不复杂,DX10特效只有一项,而且游戏不支持抗锯齿(虽然可以驱动强制开启AA,但DX10和部分阴影会失效),所以我们的测试模式就是特效全开,但不开AA和AF。
测试方法:《生化奇兵》并不像其他几款DX10游戏那样自带测试程序,所以我们只能用Fraps来记录游戏运行的实时FPS,测试场景选取了第一关动态海面作为户外模式获得成绩。
《生化奇兵》也是一款The Way游戏,在这款游戏中对N卡的优化还是比较明显的,即使是低频版本的9800GTX也能小幅度领先HD4850,9800GTX Plus领先的幅度就非常明显了。
●DX10游戏性能测试:《地狱门:伦敦》
《地狱门:伦敦》包含不少DX10特效:有物理性的容积烟雾,能够跟周围外力产生互动;GPU模拟的雨滴效果,每一个雨点将受到方向光源的打光;以及一种称之为 fancy soft shadows的阴影技术,可以根据光源跟物体的距离调节所产生阴影的柔和程度。此外《地狱门:伦敦》还采用最新的Havok FX引擎 ,该引擎将利用GPU资源来进行物理模拟计算。
画面设置:游戏对N卡和A卡的支持程度并不相同,比如使用抗锯齿后N卡和A卡能够开启的特效等级就不尽相同,我们只好取消抗锯齿设置,以求统一画面设置。
测试方法:以游戏训练关的初始场景读取稳定帧数。
在《地狱门:伦敦》测试中,65nm版本的9800GTX没有能够打败HD4850,但是55nm的G92核心提升了频率之后,十分轻松的将HD4850压在了脚下,相对于9800GTX的性能提升非常明显。
● 性能对比:9800GTX+ PK HD4850
如果单独从某个游戏或者应用程序上来评论显卡的性能,确实显得很苍白无力,因为各种因素各个显卡在不同的游戏里表现也不同。所以我们的测试项目基本上覆盖了目前所有的主流游戏以及基准测试软件。上面这个表中,我们可以看到9800GTX Plus与HD4850在单个项目中的差距幅度,并且最后计算出平均值。根据计算得到9800GTX Plus比HD4850平均性能高出4.46%。
● 性能对比:9800GTX+ PK 9800GTX
由于9800GTX Plus实际上就是9800GTX的55nm版本,所以这两款显卡有着不可分割的关系。那么55nm工艺到底带来了多大的性能提升,上表已经给予了非常直观的体现。经过多个游戏的测试得出,9800GTX Plus平均性能高于9800GTX达11%。
前面我们说到,9800GTX Plus拥有一大特性就是使用GPU进行物理加速。NVIDIA使用其自家开发的CUDA开发环境,将Ageia的物理加速技术融入了Geforce 系列显卡中,也就是说通过Geforce显卡中的Shader单元进行物理运算。那么到底能有多大的性能提升呢?下面我们来对其进行简单的测试。
我们知道,Futuremark前段时间刚刚推出的3DMark Vantage就可以支持物理加速运算,并且可以从单独的测试成绩中体现其性能。在3DMark Vantage中,从CPU得分以及CPU Test 2得分中可以大概看到物理加速的性能。当然,驱动程序需要安装177.39Beta+NVIDIA PhysX v8.06.12,我们先来看一下:
9800GTX Plus安装物理加速驱动后,CPU得分高达36234分,Test 2得分高达130.11(点击放大查看)
上表是我们采用9800GTX Plus、Ageia PhysX物理卡以及CPU软件加速的性能对比表。我们分别在Extreme和High模式下进行了测试,大家可以看出,不管是在哪一种模式下,3DMark Vantage的总分都没有太大变化,而CPU得分有着非常大的区别。如果使用9800GTX Plus GPU进行物理加速,CPU得分的都在36000分以上,而使用Ageia PPU物理卡和CPU软件加速都只有10000多分。可见9800GTX Plus物理加速确实已经生效可用。
●物理加速测试:Unreal Tournament 3《虚幻3》它不仅仅是一款游戏,各大平台上采用虚幻3引擎的游戏已经有近百款之多。在PC平台,受到高度评价的《生化奇兵》就是基于虚幻3引擎开发,还有《彩虹六号:维加斯2》和《荣誉勋章:空降神兵》、《战争机器》等大手笔。
不过我们本次的测试和以往有点不太一样,本次我们主要是测试9800GTX Plus在本游戏中物理加速场景的性能。这也是9800GTX Plus非常重要的一个特性。
画面设置:为了考究显卡在极限状态下的实力,在测试时我们采用了1920×1200的超高分辨率,并且开启了全屏抗锯齿。场景选择的是NVIDIA专门提供的带有华丽物理特效的地图(需单独安装)。
测试方法:系统安装ForceWare 177.39 Beta+NVIDIA PhysX v8.06.12版驱动,使用HeatRay PhysX场景,开启硬件物理加速,并且与CPU渲染、物理卡渲染与9800GTX Plus渲染做对比。
结果非常明显,从结果可以看出在不开启硬件物理加速(CPU渲染)时,仅仅能得到30.6FPS的帧率,并且在测试过程中我们还发现这种状态下根本很多物理效果都没有出现;当使用Ageia物理卡进行加速时,虽然可以看到大部分的物理效果,但是帧率并不算高,平均帧率保持在42FPS左右;而使用9800GTX Plus进行物理加速渲染时,帧数高达52.747FPS,性能比Ageia提供的物理卡还要强。很显然,物理加速虽然算的上是NVIDIA为我们提供的一个免费礼物,但性能一点也不亚于单独的物理子卡,这完全得益于G92核心强大的计算能力。
由斯坦福大学发起,旨在通过分布式运算研究各种疾病蛋白质折叠原理的Folding@home计划,早在2006年就曾经推出过显卡用客户端,但仅限A卡。今年早些时候的第二代GPU通用计算客户端仍然仅支持HD2000和3000系列,N卡一直无缘这项可以说是全球最普及的显卡通用计算应用。
前段时间,NVIDIA在全球媒体日大会上透露,Geforce GPU很快就可以支持分布式计算,并且在会上使用GTX 280演示了用Geforce GPU计算Folding@home蛋白质折叠项目。很快,上个月斯坦福官方放出了支持Geforce GPU的Folding@home客户端,正式宣布NVIDIA也加入了分布式计算阵营。
经过我们的测试,9800GTX Plus可以非常完美的支持Folding@home蛋白质折叠运算,并且性能很不错。平均可以在一天内模拟283ns的蛋白质折叠,而HD3870这个性能大约只有170ns/Day,PS3仅仅能达到100ns/Day。
事实上,所有支持CUDA的显卡都可以使用该客户端为科学计算出一份力量。NVIDIA表示,目前全球有7000万块CUDA显卡(GeForce 8及以上,包括Quadro和Tesla系列),平均拥有100GFLOPS的浮点运算能力。如果这其中有0.1%参与Folding@Home,就能够为该计划带来7PFLOPS的运算能力,远远高于全世界最强大的超级计算机。
如果你是NVIDIA Geforce 8以上显卡的用户,可以安装174.55或者更新的版本驱动程序,再通过上面的链接下载客户端安装运行,就可以在你电脑空闲的时候为科学计算做贡献了,使用非常简单。
NVIDIA联合Elemetal制作了名为BadaBOOM Media Converter的视频转换工具,可以将众多的视频格式转换成直接能在PSP、iPhone等流行手持数码设备上播放的视频格式。软件基于CUDA开发,最大限度的利用GPU加速。
NVIDIA表示,BadaBoom使用GPU进行视频转换,其效率可以达到CPU的数倍甚至数十倍以上。前几天我们在GTX 280的首发测试中,对其进行了测试,将NV利用Autodesk MAYA软件制作的首部动画《The Plush Life》转换成能成iPhone标准的视频,使用GTX 280进行编码,整个过程仅仅用了22秒,而使用当今最优异的四核心CPU进行软件编码,整个过程用了110秒。
使用BadaBOOM Media Converter转换的视频可完美在iPhone上播放
可以看出,使用GTX 280 GPU进行视频编码,效率十分可观。但在那时BadaBOOM还根本不能支持9800GTX Plus。近日,Elemetal推出了的新版本的BadaBOOM,可以兼容9800GTX Plus以及更多支持CUDA的显卡,正好我们也对9800GTX Plus视频编码效能进行了测试。
这次测试与上次GTX 280的测试采用了一样的平台,编码测试片源也是NVIDIA制作的首部动画《The Plush Life》,同样将其转换为iPhone所支持的格式。
经测试,使用9800GTX Plus编码这段视频用了刚好30秒,理所当然没有GTX 280快,但是也远远比CPU软件编码快(110秒)。
经过数十款游戏与各种项目的测试之后,相信大家已经对9800GTX Plus这款产品有了比较深的认识。总结起来,不外乎有以下几点:
● DX9游戏测试:HD4850基本全胜
从我们前半部分的游戏测试中不难发现,在DX9游戏测试中,HD4850基本上是全部领先,就连N卡一直占优势的OpenGL游戏《雷神战争》,9800GTX也根本没有领先HD4850。
● DX10游戏测试:9800GTX Plus收复失地
而在DX10游戏中,这种情况被完全改变,似乎所有的游戏都为9800GTX Plus而优化,HD4850唯一领先的仅仅只有两个游戏——《刺客信条》和《冲突世界》。看来,NVIDIA The Way阵营中的合作伙伴,确实在DX10游戏方面,对AMD显卡的优化确实不够。
● HD4850价格更低,9800GTX Plus功能更多
我们再从产品与市场方面来总结,很显然9800GTX Plus正是冲着风头正劲的HD4850而生,两款产品在性能上基本上可以说是打成平手,不同的游戏中,两款显卡的性能表现也有所不同。
从市场定位上来看,9800GTX Plus国内零售价格为1599元,而之前65nm版本的9800GTX 降到1399元;AMD这边,HD4850的零售价格目前是1399元,并且有降价的趋势,毕竟取代RV670也是HD4850显卡的一大任务。虽然说9800GTX Plus价格稍贵,但是其可支持GPU物理加速、视频编码,将来还会有更多更多基于CUDA的应用程序。所以说,在功能上9800GTX Plus无疑领先HD4850,当然HD4850只能走价格制胜这条道路。
总的来说,9800GTX Plus与HD4850必将在中端显卡市场上浴血奋战,两款产品各有千秋,目前HD4850已经大规模铺货,9800GTX Plus立刻要解决的就是供货的问题。根据消息,有好几大AIC厂商都已经拿到了不少55nm工艺的G92核心,准备近期将9800GTX Plus推向市场。那么9800GTX Plus与HD4850到底谁能在这场战争中取胜,我们留给时间去验证吧!<