8600GT接班人!G96核心9500GT全面评测
不知不觉中,DX10走入我们的生活已经快两年了,曾经陪伴我们5年的DX9已经成了昨日的回忆。如今,NVIDIA系列的产品线已经正式迈入了Geforce 9时代,中、高端GF8系列产品已经全部停产,而主流市场上,NVIDIA也于今天正式给我们带来了实质性的产品——9500GT。
说到主流级产品,相信你一定会想到G84核心的8600GT与G86核心的8500GT。这两款产品在去年4月份发布以后,就一直占据着主流市场,成功的抵御了AMD两代主流级产品线——HD2600系列与HD3600系列。从去年4月份到现在,已经接近一年半的时间,G84/G84核心的生命周期之长在NVIDIA产品线历史上都是一个奇迹。
面对AMD正式迈入HD4000系列,上一代中高端的RV670核心产品降到了主流级显卡的价格,去年千元价位上的HD3850、HD3690等产品价格都已经在500元左右徘徊,显然8600GT的性能无法和这些产品匹敌,NVIDIA必须替换掉8600GT,推出新显卡应对新一轮的挑战。
于是,在中、高端的9600GSO、9600GT、9800GT/GTS/GTX以及9800GX2等一系列Geforce 9产品发布之后,NVIDIA终于在今天为我们带来了全新的主流级产品9500GT,这款产品发布也意味着基于G84核心的8600GT正式下岗,DX10主流级显卡第一次改朝换代的到来。
实际上,早在今年1月份,业界就有传出NVIDIA即将推出9500GT的消息,当时我们也给过相关的报道,并且在当时的报道中我们就展示了9500GT所采用的G96核心照片。
早在今年1月份就泄漏的9500GT核心照片
随着时间的推移,关于9500GT的更多详细消息被泄露了出来,后来我们确定9500GT核心将会有55nm工艺和65nm工艺两个版本,而显卡则有GDDR3以及GDDR2版本。当时的消息显示,OEM市场的9500GT主要是采用65nm工艺,零售版会采用55nm工艺,支持PCI-E 2.0、SM4.0、OpenGL 2.1、PureVideo HD、128-bit HDR、16X AA等技术。
与此同时,更是有国内某知名整机厂商给个别媒体派送了OEM版9500GT的样卡,所以早在好几个月之前,就有媒体测试了这款显卡,不过由于采用65nm工艺,且技术规格资料不足,并没有引起大规模的关注。
当NVIDIA正式迈进55nm工艺,推出了首款采用55nm工艺的9800GTX Plus之后,9500GT将会采用55nm工艺的消息得到了进一步的确认。今天我们终于确定了,绝大部分零售市场的9500GT将会采用55nm工艺的产品,当然不排除少部分会采用65nm工艺,但产品的频率完全是根据厂商的设定。
这里留下了一个问题,为什么NVIDIA要拖到今天,才正式发布9500GT呢?实际上很简单,由于基于G84核心的8600GT库存较大,并且产品在主流市场上的评价一直不错,所以NVIDIA一度推出发布时间,不仅让8600GT成功抵御了竞争对手两代产品,还帮助各大合作伙伴清理了库存。如今,8600GT的库存已经基本清理完毕,9500GT自然水到渠成的发布了。
前面我们就说到了,9500GT采用全新的55nm工艺。NVIDIA一直在制程工艺上都十分保守,其竞争对手AMD已经在HD3000时代就引入了55nm工艺,而NVIDIA在前一段时间发布的9800GTX Plus上才正式引入55nm工艺,这样看来9500GT算是NVIDIA第二款采用55nm工艺的显卡,也是第一款将55nm工艺运用到主流级显卡上。
很显然,9500GT是作为8600GT的后继者推向市场,那么我们回头来看看8600GT。相信大家都知道,基于G84核心的8600GT采用的是80nm工艺,而如今9500GT又有65nm工艺版本和55nm工艺版本,看似一次简单的产品更新,却有3次的工艺变革,可见NVIDIA虽然在工艺方面相对保守,但也逐渐开始重视工艺的更新,毕竟新工艺不仅能带来发热量、功耗的降低,更重要的是能带来成本的降低。
G96两种工艺核心大小对比(图片截取自Expreview.com)
上图就是9500GT两种工艺的核心大小对比,可以看出,55nm工艺的G96核心并没有比65nm的小很多,连10%都不到。区分两款核心也非常简单,编号后缀为A1的表示采用65nm工艺,编号后缀为B1的表示采用55nm工艺生产。
8600GT所采用的G84核心,凭借着先进的统一渲染架构、核心/Shader分频设计,成功的抵御了竞争对手两代产品。有人说9500GT(G96)就是8600GT升级了工艺,其他地方没有任何改进,实际上这样的评价并不正确,我们先来看看G96核心的架构。
9500GT采用G96核心,内部研发代号为D9M,和上一代主流级显卡8600GT一样,拥有32个流处理器、128Bit显存控制器、16个纹理单元以及8个Rops单元。
上图是我们从G80核心架构图上“演变”出来的G84核心架构图,全规格的G80核心拥有8个阵列,而上图中展示的G84核心拥有两组阵列。实际上,G84相对于G80来说架构上已经有所升级,主要是纹理寻址单元从G80的每组4个变成了每组8个,所以笔者特地在“演变”这两个字上面加上了引号。
9600GT所采用的G96核心和G84核心一样,拥有两组流处理器阵列,每组阵列中拥有16个流处理器,纹理寻址单元和纹理过滤单元都分别有8个,两组阵列一共有16个纹理单元。
从核心规格上来看,9500GT与8600GT似乎并没有太大的区别,但细心的朋友可以看出,9500GT的晶体管数量为3.14亿个,相对于8600GT拥有的2.89亿个晶体管有了不小的增加,那么多出的这一部分晶体管,到底是做什么用的呢?原来,9500GT相对于8600GT来说,硬件上有一项很大的改进——加入了PCI-E 2.0的支持!
PCI-E 2.0是基于PCI-E 1.1演变而来,其最大的特性就是将PCI-E接口的带宽从250MB/s提升到了500MB/s,当然还有功能上以及扩展性上有了更加广阔的空间,下面是PCI-E 2.0的主要新特性。
● PCI-E 2.0规格的主要新特性如下:
带宽翻倍:每通道数据传输率由原来的单向250MB/s双向500MB/s(PCI-E上下行可以同时传输数据)提高至单向500MB/s双向1GB/s,显卡所用的PCI-E X16 2.0接口带宽就是单向8GB/s双向16GB/s。
功率翻两倍:PCI-E 2.0接口可以直接输出最大225W的电力,是现有PCI-E的75W三倍,可以更好的满足高端显卡需求。
新增“输入输出虚拟化”技术:可以让多台虚拟机共享网卡等PCI-E扩展卡设备。
支持外部PCI-E 2.0扩展卡设备:扩展卡可以通过标准化的线缆接入计算机,而且带宽速度几乎不会损耗,适合高端服务器通过外部接口接入多块各种功能的扩展卡。对于显卡来说,实现外置多路显卡以及图形服务器将会更加容易。
支持代号为“Geneseo”的长期规划。该技术与Intel、IBM等业界巨头合作开发,可让图形处理单元、加密处理单元等协处理器更好地与中央处理器机密相连。对于显卡来说,GPU和CPU整合计划将会拥有更低的延迟、更高的通讯效率。
从我们之前的测试数据来看,PCI-E 2.0相对于PCI-E 1.1的性能提升幅度非常明显,特别是在高端产品以及多GPU产品上,性能提升幅度更是可观。实际上,9500GT之所以在晶体管数量上比8600GT更高,就是因为在硬件上加入了PCI-E 2.0的支持。
PCI-E 2.0相对于PCI-E 1.1来说性能提升明显
值得一提的是,PCI-E 2.0需要主板与显卡的同时支持,目前NVIDIA的G9x核心显卡、AMD的RV635、RV670、RV770等核心显卡都可以完美支持PCI-E 2.0技术,主板方面NVIDIA的750i SLI、780i SLI、Geforce 8200以及AMD的7系列芯片组全部都可以支持PCI-E 2.0技术。
随着蓝光技术的成熟,高清视频逐渐普及,通过显卡硬件解码视频的技术也成了NVIDIA与AMD争夺的对象。在Geforce 6系列的时候,NVIDIA就引入了PureVideo技术,不知不觉中,PureVideo技术已经有了四次更新,我们来简单回顾一下:
第一代PureVideo:GPU负责一半的解码任务
NVIDIA早在GeForce 6时代就开始引入高清视频加速技术——PureVideo,通过集成专用的视频处理模块,让驱动调用GPU资源辅助CPU进行解码,虽然这并非是完整的硬件解码,有一大半还是需要通过软件交给CPU处理,但不论如何PureVideo的出现很大程度的分担了CPU的压力,并且在视频画质上也有一定的改观。
第一代PureVideo具体就是负责H.264影片解码过程中后期输出的Motion CompensATIon(运动补偿)和Deblocking(解码去方块滤波),也就是说前期解码仍然要交给CPU完成。不过这已经能够将不堪重负的CPU获得解放,而且前几年GPU和CPU互相配合足以胜任当时主流HDTV影片的流畅播放。
实际上,在Geforce 7时代,NVIDIA还在PureVideo的基础上加入了对高清视频内容保护的HDCP(通过一颗HDCP芯片支持),不过PureVideo单元相对Geforce 6并没有改变,所以没有单独提出。
第二代PureVideo:完美解码H.264
到了G84/G86时代,NVIDIA对PureVideo进行了升级,可以实现完全硬件解码H.264压缩格式的高清视频,当然HDCP也完美支持。不过由于当初其竞争对手AMD已经加入了VC-1编码视频的完全硬件解码,可以说NV在当时慢了一步。
第三代PureVideo:完美解码VC-1
去年,NVIDIA发布了基于G98核心的8400GS,首次在芯片中加入了VP3引擎,可以实现对VC-1编码视频进行完全硬件解码。这也是NVIDIA首次在高清视频解码技术上与AMD保持一致,没有差距。
第四代PureVideo:双流解码技术
到了9600GT的时候,NVIDIA正式引入了双流解码技术,也就是说可以使用一块显卡同时解码两部高清视频,完美实现蓝光视频中的画中画功能,当然你也可以通过双显示器来欣赏两部高清电影。不过,这一次升级仅仅是软件上的升级。
从另一个方面来说,NVIDIA的PureVideo核心技术可以说是一共有三次大的更新。第一代就是Geforce 6/7系列显卡的PureVideo,采用VP1引擎,负责一半的H.264解码任务;第二代就是G84/G86时代的PureVideo,采用VP2引擎,可以完全硬件解码H.264,不过并不能纯硬件解码VC-1视频;第三代则是G98芯片内置的PureVideo视频单元,集成VP3引擎,完美实现了H.264/VC-1的全硬件解码。
● 双流解码技术:同时硬解两部HDTV
9500GT的解码单元和G84和G86没有太大的区别,仍然是采用了VP2引擎,可以完美支持H.264格式影片的纯硬件解码,在VC-1格式视频解码方面,还有一个步骤需要CPU来处理。
但是,9500GT中的视频解码单元相对于G84/G86来说,还加入了双流解码的功能,也就是上一页中我们说说到的第四代PureVideo,同时解码两部高清视频在9500GT上可以完美实现。
●画质增强技术:色彩更加鲜艳
A卡爱好者一直都在鼓吹ATI的Radeon系列显卡在画质上要比NVIDIA更强,颜色表现也更加完美。当然,这样的说法是很片面的,只能说A卡的颜色配置更加适合东方人的眼球。
新的PureVideo HD给我们带来了这方面的自定义设置,用户可以通过驱动程序,设置自己更加喜欢的颜色配置。同时NVIDIA还在新的PureVideo中加入了动态对比度增强的技术,在播放高清影片时,可自动提高对比度,让细节表现更加完美。
关于动态对比度增强与数字图像增强技术,我们在之前有过比较详细的测试,感兴趣的朋友不妨点击下面的这个链接,看一下这两大技术所带来的实际效果。
http://www.pcpop.com/doc/0/273/273788_4.shtml
另外,新一代的PureVideo还带来了在Aero特效下播放高清视频的功能。想必有很多朋友都遇到过,当播放高清视频的时候,Windows Vista的Aero特效会自动关闭,切换到经典状态,如果你安装了174.xx或者更新版本驱动程序的话,这个问题将会得到解决,9500GT也一样可以支持!
很显然,9500GT在高清视频播放、画质这方面都下了很大的功夫,对于这样的主流级产品来说,很多HTPC用户都会考虑这样的产品,9500GT则为这样的用户做出了充分的准备。
经过多年成倍式增长,GPU的性能已经达到了非常可观的高度,但是显卡却总在玩游戏的时候才被大家想起,难道这么强大的计算能力仅仅是为了满足游戏玩家?显然,GPU已经不满足应用领域的狭隘,利用自身强大的计算能力向传统电脑的核心CPU提出了挑战!
早在多年以前,NVIDIA与ATI就提出了通用计算的概念,也就是使用GPU来进行非图形渲染的计算,依靠GPU强大的计算能力,来取代一些CPU无法完成或者效能太低的计算。如今,NVIDIA推出了业界首套GPU编程语言标准——CUDA,用户可以在CUDA平台下,开发基于GPU运算的应用程序。
有了CUDA之后,从理论上GPU已经可以取代CPU进行任何计算,不过NVIDIA还并没有计划让CPU彻底“下课”,并且还是建议用户选择CPU+GPU这样的方案,也就是串行计算与并行计算一起工作,并提出了一个新的概念——异构计算。简单的说,异构计算就是指CPU+GPU的计算。
大家都知道,目前的GPU计算能力要远远超过CPU,及时最优异的4核心CPU,计算能力也无法和一款很低端的GPU相比。在多种行业中,CUDA已经投入了实际的应用,上图是NVIDIA官方公布的使用GPU模拟CPU计算在各种应用程序中的性能,效率最高达到了CPU计算的149倍。
新发布的9500GT从硬件上完全支持CUDA,也就是说程序员可以通过CUDA,使用9500GT显卡开发应用程序,让9500GT成为整套计算机中的计算中心。
前面我们说到,CUDA几乎可以模拟任何CPU的计算,比如说医疗、地震监测、期货风险分析、生命科学、航空航天、CAD设计等等。但是对于我们普通用户来说,这些应用可能相对较少。而下面三个方面可能是我们经常要接触到的应用。
●9500GT:主流显卡也物理加速
之前的物理加速只能通过软件使用CPU运算,或者通过专门的物理加速芯片PPU计算,但是NVIDIA收购了PPU厂商Ageia之后,将物理加速技术整合到了自家的Geforce系列芯片中,并且完全通过CUDA进行开发。
虽然说9500GT是一款主流级显卡,但由于其完全支持CUDA,也就意味着9500GT可以实现物理加速。很显然NVIDIA已经将物理加速的触觉延伸到了中低端显卡上。根据消息,NVIDIA将会在近两天发布一款新的物理加速驱动,届时所有支持CUDA的显卡(包括Geforce 8/9以及GTX 200系列)都将可以实现GPU物理加速。
●9500GT:完美支持Folding@home
在一些超大的计算项目中,恐怕目前最优异的计算机群也难以满足计算要求,在这种情况下,分布式计算计划应运而生。简单的说分布式计算也就是将计算内容分发给全球的计算机,任何链接到Internet的计算机都可以成为分布式计算的一个客户端,为这些超大的计算项目做出小小的贡献。
分布式计算最大的好处是完全在后台运行,并且并不需要占用太大的资源。客户端在电脑闲置的情况下,自动进行分布式计算,并实时将计算的数据上传到指定的服务器。之前一直都是CPU进行分布式计算,不过由于计算能力不高导致效率很低,后来ATI的显示核心率先支持了分布式计算的Folding@Home项目,如今NVIDIA支持CUDA的显卡也都可以支持该项目。
●9500GT:硬件支持视频转换
视频的编码一直都是CPU的事情,而CUDA的出现让视频编码也完全可以通过GPU来进行计算。
有过相关经历的人就知道,使用CPU进行视频编码是一个非常漫长的过程,几分钟的高清视频可能都需要数小时才能编码完毕,而如今使用GPU进行编码运算,高性能显卡几乎可以实时编码。9500GT也完美支持,后文我们会对9500GT的视频编码性能进行测试,在这里不做过多介绍。
实际上,NVIDIA这次推出9500GT非常低调,并且鼓励合作伙伴推出非公版产品,让用户感到更加具有性价比。目前,绝大部分显卡厂商都已经发布了自有品牌的9500GT显卡。我们一起来看一看:
●翔升
●金鹰
●小影霸
●七彩虹
●微星
●影驰
●铭瑄
●盈通
●昂达
●捷波
●精英
●旌宇
●太阳花
●PNY
●丽台
特别感谢所有为泡泡网提供测试显卡的厂商!
在正式开始评测之前,首先对我们的测试平台、测试模式和测试方法作一简单介绍:
● 测试平台配置
硬件系统配置 | |
Intel E8200 2.66GHz | |
主 板 | ASUS P35 |
显 卡 | 9500GT 256M(730/1825/2200MHz) 9500GT 256M(600/1500/2000MHz) 9500GT 256M(550/1500/1000MHz) HD3650 256MB (725/1600MHz) |
内 存 | Geil DDR2-800 1GB×2 (5-5-5-15-2T) |
硬 盘 | 希捷7200.10 |
电 源 | 海韵 M12 600W |
软件系统配置 | |
操作系统 | Windows vista SP1 32Bit |
DirectX | 10.0 (6.00.6000.16386) |
显示驱动 | Catalyst 8.6WHQL Forceware 177.72Beta |
由于是主流级显卡,所以我们并没有采用太高端的测试平台,这样可以尽可能的保证测试的代表性。CPU采用的是频率为2.66GHz的E8200,搭配2GB内存和P35主板。
测试系统采用Windows Vista SP1,N卡驱动采用NVIDIA专门提供的最新版177.72 Beta版驱动,A卡采用非常稳定的催化剂8.6。
为了使整个测试成绩更加直观,我们不仅对GDDR2和GDDR3显存版本的9500GT进行了测试,并且加入了HD3650以及NVIDIA上一代主流级显卡8600GT的测试成绩,大家可以非常直观的对比出9500GT与其他主流级显卡的性能差距。
●三款9500GT采用三种显存搭配
从上表中可以看出,本次测试我们采用了3款9500GT显卡,他们分别是搭配0.8ns GDDR3显存的翔升9500GT金刚版、搭配1.0ns GDDR3显存的小影霸9500GT以及搭配GDDR2的金鹰9500GT。
由于各大厂商所推出的9500GT产品中,采用纯公版设计的显卡非常少,为了使得测试成绩更加具有代表性,所以本次测试所采用的显卡全部按照厂商设定的频率为准,未加入公版9500GT的性能。
● 测试项目:
3D测试部分:我们主要采用两代基准测试软件3DMark 06和最新发布的3DMark Vantage;游戏方面我们选择了目前主流的DX9/DX10游戏,比如《优品11》、《虚幻3》、《半条命2》、《孤岛危机》、《失落星球》、《生化奇兵》等。多个3D测试项目更加能够准确的展现出9500GT的实际性能。
最新的驱动程序加入了9500GT对CUDA的支持,所以本次测试中CUDA应用也是我们测试的重点。如GPU视频编码、Folding@home蛋白质折叠运算等。
● 3DMark06理论性能测试
3DMark06作为目前权威的综合测试工具,包括了两个SM2.0测试和两个SM3.0测试场景,基本上达到了DX9C的画面最高境界,其测试结果对于很多主流游戏都有参考价值。
在3DMark 06基准测试中,可见高频版的9500GT性能非常强大,默认设置下的成绩超过了6400分。而即使是采用GDDR2显存的低频版本9500GT,也和上一代公版频率的8600GT性能不相上下。
●DX10理论性能测试:3DMark Vantage
3DMark Vantage已经在四月底正式发布,全新的引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨,号称“显卡危机”的Crysis也不得不甘拜下风。
3DMark Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级),只有在这四种模式下才能跑出总分,如果自定义模式就只能得到子项目分数了。由于9500GT算是主流级显卡,所以我们采用入门级的Entry模式进行测试。
3DMark Vantage的测试成绩很有意思,采用GDDR2显存的低频版9500GT性能竟然超过了采用GDDR3显存的8600GT,不过考虑到9500GT的流处理器频率高达1500MHz,这样的测试成绩也并不足以为怪。在这项测试中,频率最高的9500GT得分接近8000,远远领先8600GT以及HD3650。
● 2007年度非常好的游戏——《使命召唤4:现代战争》
由于《使命召唤3》是XBOX360独占游戏,并没有PC版本,因此PC游戏玩家对于使命召唤系列游戏的印象大都停留在《使命召唤2》时代,但经典的《使命召唤2》给玩家带来了不一样的二战游戏体验,因此支持PC版的4代作品备受期待。此次《使命召唤4》全平台出击,自发布以来就好评不断,销量长期霸占榜首!
自从《使命召唤4》宣布以现代战争(Call of Duty 4:Modern Warfare)为游戏主轴,许多好奇的玩家就不断在猜测,注重历史写实的Infinity Ward会把战场移至何处,大部份都以为会是越战或是伊拉克战争。但是为了避开敏感的话题,开发小组选择创作虚构的故事,将战争带领至更多想像之外的国家。此次《使命召唤4》挟著“至今最紧张刺激的FPS游戏”诉求,将战场拉到现在的中东及东欧等区域。
虽然使命召唤4的场景已不再是二战,但它依然保持了和使命召唤2/3系列相近的画面风格,相信老玩家在游戏中一定会有亲切感,战斗中的爆炸、烟雾效果更加逼真,物理效果也加强了游戏的真实感。
● 画面设置和测试方法
使命召唤4引擎对显卡的要求不像DX10游戏那么BT,中端显卡特效全开都能有不低的FPS,这也是它能够迅速普及的原因。所以,我们本次测试在两种分辨率下面,开启全特效进行测试。
测试方法:Demo有一段固定的爆炸场景,FPS比较稳定,也符合游戏实际运行时的情形,用Fraps统计这个过程的FPS,作为最终成绩。
在1680×1050的分辨率并开启4倍抗锯齿的情况下,高频版的9500GT平均帧数接近30FPS,完全可以流畅的运行游戏,而8600GT以及HD3650都不到20FPS,非常卡。到了1920分辨率下,9500GT也有点扛不住,平均帧数只有20桢左右,当然8600GT与HD3650就完全是幻灯片了。
●DX9C游戏性能测试:《帝国时代3:亚洲王朝》
其画面风格一如既往的华丽无比,虽然游戏引擎比较老,但通过精妙的色彩搭配和美术设计,《帝国3》比起DX10 RTS大作《英雄连》和《冲突世界》都是不落下风。
画面设置:帝国3的最新资料片也使用了原来的游戏引擎,画面风格没有任何变化,系统需求也是照旧,对于如今的显卡来说特效全开并且打开抗锯齿运行游戏没有任何难度。起“边缘光滑”开启至“高”就是4AA。
测试方法:及时战略游戏如果没有专用测试程序,就很难在游戏中公平的测试,所以我们选用了游戏即时演算的主界面统计帧数,也能客观的反映出各卡在该游戏中的差距。
帝国三虽然引擎较老,但是凭借着豪华的画质以及超强的可玩性,仍然赢得了一大批忠实的fans。这款游戏对硬件的要求并不算高,8600GT也基本可以在最高特效下流畅运行,不过从上面的对比测试中可以很明显的看出9500GT的性能优势。
●DX9C游戏性能测试:《半条命2:第二章》
《半条命2:第二章》作为《半条命2:第一章》的续集,引擎在HDR和室外场景的渲染方面有所增强,树叶渲染上将采用Alpha覆盖技术,提供更好的树叶细节和反锯齿效果。此外还引入全新的粒子系统,将提供动态软阴影效果。物理引擎也经过重新设计,提供大场景大范围的物理效果。
画面设置:《第二章》还是原来的Source引擎,虽然做了一些改进,但对显卡的要求并没有提高,所以我们测试时特效全开最高,并且打开游戏自带的AA和AF。
测试方法:游戏支持命令录制demo供测试,我们录制的demo覆盖了室内室外场景。
测试的分辨率是目前用户最最主流的分辨率,还好本次几乎所有参测显卡都可以在1440×900分辨率下流畅运行。到了1680分辨率下,8600GT就非常卡了,高频版9500GT仍然能保持40FPS的帧率。
● DX9C最新赛车游戏:《优品飞车11》
如果你已经厌烦了在黑夜里飙车,那么《优品飞车11》一定能再次让你满意,因为这次EA让玩家们在NFS的世界里重见了阳光。不管优品飞车系列怎么改变,不变的就是那些忠实的老玩家还有源源不断的新玩家。
优品飞车几乎每年一次更新,在上一代作品发布的一年后,EA为我们带来了系列的最新作《ProStreet》。告别了连续几代的黑夜,重新迎来了太阳。
● 画面设置和测试方法
在上一代的《优品飞车10》中画面设置是不支持目前主流的宽屏分辨率的。而在新作中这种问题已经得到解决,玩家们的大屏幕显示器不会再次面临英雄无用武之地的尴尬。我们将所有效果开启至最高并分别开关AA和AF。
测试模式:特效全开最高我们选取NEVADA HIGHWAY赛道进行游戏,使用Fraps统计在相同赛道段的平均FPS。
在《优品飞车11》的测试中,采用GDDR3显存的8600GT性能小胜采用GDDR2的9500GT,高频版的9500GT性能就非常好了,领先HD3650与8600GT很多,基本上有10FPS的差距。
第七章/第九节 DX9C游戏性能测试:《虚幻竞技场3》
《虚幻3》它不仅仅是一款游戏,个大平台上采用虚幻3引擎的游戏已经有近百款之多。在PC平台,受到高度评价的《生化奇兵》就是基于虚幻3引擎开发,还有《彩虹六号:维加斯2》和《荣誉勋章:空降神兵》、《战争机器》等大手笔。
画面设置:特效全开,游戏本身不支持AA但是可以通过驱动强制开启以取得抗锯齿效果,所以我们强制了4×AA。
测试方法:使用了第三方开发的测试程序,演算固定的场景和画面帧。
《虚拟竞技场3》的成绩可以说代表着很大一部分游戏的测试成绩,因为个采用《虚幻3》引擎的游戏非常多。在这个游戏中1440×900分辨率下,高频版的9500GT帧率超过40FPS,完全可以非常流畅的运行。及时在1680×1050并开启4倍抗锯齿特效的情况下,仍然可以达到25.6FPS的平均成绩。
● 最强OpenGL游戏——《敌占区:雷神战争》
作为唯一一个仍然坚持开发OpenGL游戏的公司,在目前几乎所有3D游戏都采用了DirectX编写的形势下,id Software公司的每个游戏都能给玩家以惊喜。但是id Software旗下游戏都逃不过“画面出色,游戏性单一”的恶名,代表作《DOOM3》(毁灭战士)更是被人称为“评测用游戏”。id Software的野心是巨大的,他们想要打破这个宿名,于是他们开启了《敌占区:雷神战争》(Enemy Territory:Quake Wars)。
《雷神战争》使用强化过的DOOM3游戏引擎制作,以多人连线对战为主要游戏架构版本,强调超绚丽的视觉效果与真实的物理运算。《雷神战争》以玩家熟悉的第一人称射击游戏方式呈现,不同于《雷神之锤4》之处在于游戏仅限定多人连线的模式,也是《雷神之锤》系列中第二款以多人连线对战为主要游戏架构的版本。
● 画面设置和测试方法
Quake毕竟是源于老迈的DOOM3架构,引擎无论如何改进,对配置的要求也不可能出现翻天覆地的变化,即便是中端显卡也可以特效全开流畅运行。此次测试中端显卡,使用了1440×900和1680×1050两种分辨率、特效全开、并且开启游戏内置的4AA。
我们自行录制了一段多人对战Demo,调用游戏内置的控制台命令行播放录像,然后就可以得到比较准确的全程FPS。第一次回放Demo时由于Loading的原因成绩较低,所以取第二次的成绩为最终结果。
这款游戏是我们本次测试中唯一一款OpenGL游戏,高频版的9500GT在高分辨率下帧率都能超过30FPS,足以流畅运行游戏。而上一代8600GT以及AMD同价位的HD3650就逊色多了,在两个分辨率下都基本不能流畅运行。
● DX10救世主——《孤岛危机》
Crysis(孤岛危机)无疑是关注度最高的PC游戏大作之一,同时它也是对于DX10图形技术应用最深入的游戏,Crysis一经发布,就凭借以假乱真的画面征服了所有游戏玩家,让其它游戏显得暗淡无光!
Crysis的游戏画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏,当然可玩性也值得称赞,至少让我们明白了同样是对抗外星人这种老掉牙的剧情也能做得如此引人入胜……
《孤岛危机》并不能说是《孤岛惊魂》的续作,不过故事同样发生在一个列岛上。故事发生在2019年,一颗巨大的陨石坠落到某列岛上。朝鲜封锁了该列岛,试图对该陨石进行调查,以独家拥有其中可能蕴藏的研究价值。美国对此当然不会袖手旁观,于是排除了三角洲部队,调查在该岛上发生的事件。就在两国为陨石事件而冲突之际,陨石突然打开,从里面出现了外星飞船,外星人的目的是征服世界。外星飞船拥有强大的武器,世界的气候系统因此发生异变,列岛的一部分被完全冰冻了。面对这样的强敌,人类联合起来全力对抗。在游戏过程中,玩家将会在丛林、山脉、城镇以及外星飞船内部战斗。
● 画面设置和测试方法
《Crysis》对系统的苛刻要求绝对超乎您的想象,即便是8800Ultra这种优异显卡,也不敢用VeryHigh模式运行、也不敢上高分辨率。至于128Bit的中低端显卡,我们选择了Medium中等画质1024×768与800×600分辨率进行测试
测试方法:Crysis正式版内置了CPU和GPU两个测试程序,我们使用GPU测试程序,这个程序会自动切换地图内的全岛风景,得到稳定的平均FPS值。
《Crysis》是第一款真正意义上的DX10游戏,也正是由于代表着目前DX10的最高画质,所以也就成了目前显卡测试的必测项目。由于游戏对显卡的要求实在太高,9500GT这样的主流级显卡根本无法再高分辨率下开启高画质运行,所以我们只能在DX9模式下进行测试。从测试的成绩来看,DX9模式下两种分辨率9500GT都能很流畅的运行,不过开启DX10效果的话,肯定会是幻灯片一样的效果。
● 最壮观DX10 RTS游戏——《英雄连》
《英雄连》这款以二战作为题材的RTS游戏一经发布就备受好评,它采用了当时先进的游戏引擎,无论游戏画面还是任务关卡设计都是独具匠心,它最大的特点就是游戏场景会随着战斗的进行不断发生变化,可以被各种手段破坏游戏场景,比如大量的射击爆炸和烟雾效果,而且游戏的环境、道具和人物模型设计非常细腻,就算是把镜头拉近几倍也有非常出色的画面——以至于很多人看了游戏动画之后误以为是款FPS游戏、而忘记了它是RTS游戏!
《英雄连》早在06年9月就已发布,它采用了DX9 API,而其DX10版本是以补丁包的形式出现,通过一个体积并不算大的升级文件,可以让《英雄连》的光影、纹理品质得到提升,战争场面更加精彩。
《英雄连》最新资料片《抵抗前线》的推出也再次掀起游戏热潮,新资料片完全沿用了先前版本的引擎,甚至连自带的测试Demo都没有做改变。
● 画面设置和测试方法
《英雄连》DX9模式对于主流显卡完全没有挑战,我们可以把特效全开最高的Ultra模式,甚至打开4xAA都能有流畅的FPS。而DX10模式对于128Bit的显卡来说是一项严峻的挑战,只能在Medium模式下才能有30帧左右的速度,因此DX10模式的游戏画面设置如下图所示,不过分辨率我们采用的是1680×1050,同时加入了开启4倍全屏抗锯齿的成绩。
英雄连自带性能测试程序,它是把任务版第二关的两个过场动画拼接在了一起,测试完之后会给出平均FPS、最大FPS和最小FPS,我们只取平均FPS做对比。
在《英雄连》这个测试中,高频版的9500GT性能还是非常不错的。不过我们在测试GDDR2版9500GT的时候,成绩很不稳定,多次测试的成绩差异很大,为了保证测试成绩的准确性,故我们这里暂时没放出该款显卡的成绩,望广大网友谅解。
● DX10 RTS游戏——《冲突世界》
看之前的游戏介绍,很多人都以为这是一款FPS游戏,因为它的画面效果和模型细节实在是太细腻了,事实上它是一款RTS游戏,一款场景比《英雄连》还有宏大、细节和特效更加丰富的即时战略游戏!
《冲突世界》(World in Conflict)是一款以假想的世界战争为题材的新作,在游戏的开场动画中,玩家就可以看到重装坦克入侵美国的大街小巷,士兵架着机枪在海岸线上殊死保卫。西雅图遭到了严重的空袭。本作的剧本作者Larry Bond是知名的畅销书作者,与汤姆·克兰西一起创作了《Red Storm Rising》,曾经参与了《鱼叉》系列海战游戏的开发,这次他与Massive的游戏开发大师们合作为玩家带来了又一款军事惊悚游戏。
● 画面设置和测试方法
《冲突世界》游戏自带的画面设置多达44个选项,预置Very High/High/Medium/Low几种模式,测试中低端卡我们选择了Medium模式,然后手动AA/AF选项,对比几款显卡的性能表现:
《冲突世界》和《英雄连》类似,内置了一段非常华丽的过场动画作为测试程序,最终得出最大、最小和平均FPS,测试结果非常精确。
《冲突世界》我们采用了同一种分辨率,两种测试模式,在开启AA的情况下,860GT只有15FPS的平均帧率,而9500GT高达23FPS;关闭AA之后,8600GT只能勉强流畅运行,9500GT的帧率超过40FPS,玩起来非常流畅。
● 首款DX10游戏大作——《失落星球:极限状态》
2007年5月份正式发布的《失落星球:极限状态》(Lost Planet:Extreme Condition),是业界首款支持DX10的游戏,它的发布打破了长久以来DX10显卡没有DX10游戏可玩的僵局,因此受到了大批PC玩家的青睐,并迅速成为显卡性能测试工具之一。
《失落星球》无论DX10还是DX9版本,画面都非常出色,但除了绚丽的画面之外,游戏本身也是可圈可点,最大的特色就是节奏紧凑、战斗过程紧张、激烈、刺激,关卡的BOSS战需要很高的操作技巧和灵活性,需要反复尝试才能通过,这非常适合那些喜欢挑战极限的玩家。所以该游戏虽然关卡不多,但所得到的游戏体验比较丰富,其任务系统非常简单,但情节引人入胜,大有一玩到底、不通关誓不罢休的味道。
● 画面设置和测试方法
《失落星球》最新的1.004补丁加入了四项DX10特效,并且大幅改进了DX10模式下的执行效率。但是对于128Bit接口的中低端显卡来说,根本无能力开启DX10模式,更无法挑战高分辨率。所以我们只是在1680×1050分辨率下进行测试,同时还有开启AA/AF的性能。
和前面《冲突世界》的测试方法一样,《失落星球》仍然在同一分辨率下切换AA/No AA进行测试,从这个测试成绩可以看出,高频版的9500GT性能非常强大,领先8600GT达30%以上。而采用GDDR2显存的9500GT性能很弱,还不如8600GT以及HD3650。
●DX10游戏性能测试:《生化奇兵》
早在游戏Demo版发布之前,BIOSHOCK就已经声名远扬,著名游戏杂志Gameinformer在较早的时候对其进行了完整测试,并给出了惊人的满分10分,将几乎所有的溢美之词都献给了这款游戏,称之为难得一见的史诗性大作。
画面设置:为了保证画面的流畅度,在这款游戏中,我们分别测试了两个分辨率——1680与1920,但是特效上我们选择Low模式。
测试方法:《生化奇兵》并不像其他几款DX10游戏那样自带测试程序,所以我们只能用Fraps来记录游戏运行的实时FPS,测试场景选取了第一关动态海面作为户外模式获得成绩。
虽然说《生化奇兵》这款游戏对显卡的要求并不算特别高,但是作为一款DX10游戏,9500GT这样的主流级显卡还是很难在高特效下流畅运行。所以我们在两个分辨率下测试都选择了Low级别。不难看出,频率高达730/2200的9500GT性能领先了频率为600/2000的9500GT不少,GDDR2低频版表现还是不行,甚至不如8600GT。
前面我们说到,9500GT支持利用GPU进行视频编码运算,NVIDIA联合Elemetal制作了名为BadaBOOM Media Converter的视频转换工具,可以将众多的视频格式转换成直接能在PSP、iPhone等流行手持数码设备上播放的视频格式。软件基于CUDA开发,最大限度的利用GPU加速。
BadaBOOM的界面简单,选择需要压制的视频和需要生成的格式即可。中间的滚动条可以设定转换品质,我们使用默认画质,输出为iPhone的480×320分辨率,压缩一段MPEG2编码的动画视频。
这段视频就是NV利用Autodesk MAYA软件制作的首部动画《The Plush Life》,这部720P的片源播放时间近12分钟,GTX280的实时编码速度达到了37.2帧,完成整个编码过程用94秒,需要注意的是我们还采用的是GDDR2版本的9500GT,而换用传统的iTunes利用当今最优异的4核心CPU QX9770单独编码整个过程却耗费了110秒。
当然除了iphone之外,你还可以为其他很多产品压缩视频,XBOX360、PS3、iPod Touch等,笔者顺便选择了PSP测试了一下,压缩速度也非常理想。
由斯坦福大学发起,旨在通过分布式运算研究各种疾病蛋白质折叠原理的Folding@home计划,早在2006年就曾经推出过显卡用客户端,但仅限A卡。今年早些时候的第二代GPU通用计算客户端仍然仅支持HD2000和3000系列,N卡一直无缘这项可以说是全球最普及的显卡通用计算应用。
现在,随着CUDA的应用越来越广泛,NVIDIA也正式加入了Folding@home计划,用户之需要安装支持CUDA的驱动程序以及一个Folding@home客户端,便可以为人类的医学事业做出自己的贡献。
搭配ForceWare 177.72驱动程序的9500GT可以完美支持Folding@home运算,根据我们的测试,9500GT可以在一天内模拟超过140纳秒的蛋白质折叠,而PS3在这方面的计算能力只有100ns/Day,4核心CPU的成绩更不过是4ns/day,可见显卡的计算能力确实要比CPU快很多倍。
确实,9500GT核心相对于8600GT核心来说,架构上没有什么改变,但是从前面的测试中大家可以看出产品的性能提升幅度十分可观,这一切都得归功于9500GT核心所采用的先进工艺。
我们知道,上一代主流级显卡8600GT所采用G84核心应用的是80nm工艺制程,工艺的落后导致了产品的频率不可能有太大的提升空间,8600GTS默认的频率已经基本上是G84核心的极限,可提升空间非常小。55/65nm工艺9500GT的出现,才使得频率得以大幅度的提升,虽然核心架构完全一样,但性能也非常好。由此我们不得不说,G84的架构设计非常经典,同样的架构升级工艺之后,能带来这么大幅度的性能提升,在显卡历史上都非常少见。
除了性能提升之外,CUDA应用也是9500GT非常好看的一个点,物理加速、视频转换、分布式运算等都在9500GT上得到了很好的应用。虽然CUDA在今后可能会支持包括Geforce 8在内的所有DX10显卡,但毋庸置疑的是NVIDIA这次是首次在主流级显卡上加入了这些附加的技术,首次将高端显卡上的应用平民化,并且完全免费。
视觉计算也是9500GT重点支持的对象,根据NVIDIA官方资料,9500GT可以在平时的生活中比如浏览网页、处理照片、阅读PDF、查看地图等多项应用中,使用GPU进行加速,让用户获得更好的体验。
●730MHz不是极限 核心频率还有提升空间
从前面的性能测试中我们可以看出,虽然9500GT和8600GT采用相同的架构,仍然拥有32个流处理器,但是凭借着工艺的升级,9500GT可以轻松的工作在更高的频率上。目前就已经有推出核心频率超过700MHz的产品,今后如果还有厂商改进散热并加强PCB设计的话,核心频率有望突破800,性能想必会非常强大。
●接过8600GT大旗 初期零售价格499元
很显然,9500GT的上市就是为了取代8600GT目前所在的市场地位。8600GT在市场已经一年有余了,工艺老旧、性能低下导致NVIDIA急需一款替代品,而9500GT正好将会接过8600GT的大旗,产品性能以及功能上都相对于8600GT来说有质的提高。目前,市场上还有少量8600GT库存,当库存正式清理完毕之后,9500GT就将正式在主流市场上大展拳脚。
如今市场上已经有部分品牌的9500GT正式开卖,零售价格基本上以499元居多,一些采用GDDR2显存的版本价格更低,可以看出9500GT的市场定位相对于其他的Geforce 9显卡来说更低,也更容易让消费者接受。
●AMD推出499元HD3850 新一轮中低端大战一触即发
不过,从目前市场上的情况来看,HD3650已经基本降到了400元以内,零售价格为399元的居多,看来9500GT上市后的真正对手并不是HD3650。让消费者兴奋的是,AMD今天也专门针对9500GT执行了新一轮的竞争计划,正式宣布推出128Bit版本的HD3850显卡,实际上也就是之前的HD3690更改了一下名字,零售价格定在499元,直指9500GT。说句公道话,即使是128Bit的HD3850,性能也会领先9500GT。面对这种情况,笔者预计等市场上的库存8600GT正式清理完毕之后,9500GT将会马上降价到399元,占据低端市场。而9600GSO将会降价到499,对抗AMD的128Bit版本HD3850。
毋庸置疑,新一轮的中低端市场大战即将打响……<