"钛"给力了!NV新秀GTX560Ti深度评测
泡泡网显卡频道1月26日 显然姗姗来迟的GTX480并没有大家期待的那么完美,之后的一段时间里,显卡市场还是一样波澜不惊,直到2010年7月12日,英伟达年度重量级产品GeForce GTX460发布。
460虽然并非旗舰定位,但它精准的定位满足了游戏玩家对于非常好的性价比价格段产品的需求。GTX460在许多对图形性能要求苛刻的DX11游戏中的表现,甚至超越了竞品更高价位的产品。在2010年下半年中,桌面显卡市场上最耀眼的明星非GTX460莫属。
但显卡的发展不会因为一款产品而停止脚步,恰恰相反,竞争会让这个行业更加充满活力。2011年伊始,NVIDIA再一次发布了粉丝们期待已久的重磅桌面产品——GeForce GTX 560 Ti。
命名解析
GT: 频率提升版本"GeForce Technoloty"的缩写,有超级跑车的意味。而而GTX: 一般可以理解为GT eXtreme。Ti: 字面意思是‘Titanium’的缩写,也就是那个太空金属 ‘钛’,在它出现的地方一般就是代表了nVidia的高端版本。在Geforce3中初现,后来又加入了Geforce2 Ti,最后在Geforce4系列中达到顶峰,大家一定不会忘记那个绝世经典-Geforce4 Ti4200。
这次NVIDIA破例将GF114核心的显卡命名为GeForce GTX 560 Ti,自然在其身上寄予了特别的期待,那它究竟有何特别之处呢?下面我们就来看看这款显卡的前世今生。
可能看过之前新闻的朋友已经知道,这GTX 560 Ti所用的GF114核心,是GF104核心的完整版,很多地方两者其实没有差别。
● GF114的前世:GF104
在GF104(GTX460)发布之前,大家都以为NVIDIA会把GF100核心的主要规格全部减半,从而制造出一颗拥有256SP 256Bit的主流核心。事实上之前国内外的媒体都是这样猜测的,因为GF100模块化四核心的设计,很容易将其“拆分为”规模大小不一的中低端核心:
但NVIDIA却没有这样做,最终GF104核心的规模出乎所有人的预料!如上图所示,GF104核心并非是GF100一半的规格,NVIDIA在微观架构方面做了不小的改动,那NVIDIA为什么要这样做呢?
● GF100更适合做并行计算、GF104/114更适合做图形处理
相信细心的读者已经看出来了,GF104/114相比GF100,最主要改变就是GPC(图形处理器集群)从4个减至2个,显存控制器从6个64bit(共384bit)减至4个64bit(共256bit),而最最重要的改变就是——每组SM当中的CUDA核心数量从32个增至48个。
我们知道,对GPU性能影响最大的模块就是流处理器(CUDA核心),如果能在GPU内部尽可能多的塞入CUDA核心的话,性能方面就会有很大的提升。但是CUDA核心也会消耗不少的晶体管,如果晶体管数太过庞大的话,GPU制造成本、良品率、功耗、发热也会受到较大影响。
大家可以注意看GF100芯片透视图,其中间位置有1/3的面积,这些是GF100一体式的二级缓存。NVIDIA为了提升GPU并行计算的效率,像CPU那样不惜成本的设计了大容量L2。L2对于性能的贡献主要集中在密集型计算任务当中,而对于普通的图形渲染来说,贡献就非常小了。那么如果将这些L2的容量进一步压缩,把节约出来的晶体管都变成CUDA核心的话,那么图形渲染性能将会得到显著提升。
GF104的SM要比GF100“胖”一些,CUDA核心横向扩张
于是,拥有较小L2、较多CUDA核心的GF104就诞生了,新核心每组SM中包含CUDA核心的数量从32个增至48个,增加了50%,流处理器总数达到了384个。NVIDIA在晶体管数一定的情况下,通过优化核心与缓存的配比,制造出了一颗更适合做图形处理的核心。
● 每组SM当中的纹理单元数量从4个增至8个
当然,NVIDIA也没有单纯增加CUDA核心的数量,针对新游戏的发展方向,GF104/114也做了较大的改进——纹理单元数量加倍!
纹理单元数量加倍
GF100核心的每组SM当中拥有32个CUDA核心,还包括了4个纹理单元,这样GF100总共就拥有64个纹理单元(GTX480屏蔽了一组是60个),少于Cypress的80个纹理单元。而API步入到DX10、11之后,游戏纹理贴图的大小爆发式增长,这样一来相对较少的纹理单元使得GTX400系列在大量使用了纹理贴图的游戏中难以发挥全部实力,如《孤岛危机》。
GF104/114核心只有8组SM,如果还是保持GF100的设计不变,那么纹理单元将只有32个,还没有HD5770多(40个)。所以NVIDIA对纹理单元部分也做了改良,每组SM中的数量直接加倍,最终GF104/114拥有64个纹理单元,与GF100相等!
CUDA核心数量增加了50%,而纹理单元增加了100%,偏向图形处理的改进意图显而易见。这些改进注定GTX460就是一款为新游戏而生的显卡。
强大的GTX460不仅逼得HD5830无路可走,迫使HD5850大降价,这让AMD感到很头疼,AMD也需要一款在中高端拥有强大实力的产品来对抗GTX460。于是AMD也针对高端的Cypress核心进行了一番优化设计,推出了功能和规格有所强化的Barts核心,定位直指GTX460。
● DX11中高端显卡规格表:
这张规格表当中囊括了显卡所有的关键参数,看起来可能比较费劲,这里就为大家重点强调几个部分:
1. GTX460虽然流处理器数量少于GTX465,但架构的优化和频率的提升效果明显,最终GTX460浮点运算能力要比GTX465高30%;
2. 由于核心SM规模的减少,GTX460的多形体引擎(内含曲面细分单元)数量减少至7组,但依然远高于HD5000/6000全系列,因为A卡都只有1个曲面细分单元!
虽然GTX460大红大紫,英伟达却是如鲠在喉。因为GTX4601GB、768MB以及后来的SE三个版本,他们显存容量、位宽或是SM单元都有所消减,是工艺的限制让英伟达不得不屏蔽部分模块来保证良品率。
屏蔽显存控制器不仅让显存位宽从256bit减至192bit、显存容量从1GB降至768MB,连带光栅单元也从32减至24个、二级缓存从512KB减至384KB。一颗优秀的核心,却不能完整的加载于显卡,实为一件憾事。
经历了七月之痒,NVIDIA终于完成了去年未尽之事,推出了GF104核心的完整版——GF114,直接对应的零售产品就是今天发布的GTX 560 Ti,下面我们就来看看这款新产品相对于GTX460有什么提升。
● 流处理器数量提升
从规格上看,GTX 560 Ti就是GTX460的完整版本,流处理器提升到了384个、显存控制器也得以补全。
但是这七个月英伟达自然不是坐等台积电工艺成熟,GF114的改进也绝对不仅仅是开核SM这么简单。相对于GT460,新产品还有别的优化。
● 动态分配缓存
GF114核心的缓存设计非常有意思,它不再是一组SM对应一组缓存,而是采用的是L1和共享缓存动态分配缓存的设计。这种划分方式完全是动态执行的,一个时钟周期之后可自动根据任务需要即时切换而不需要程序主动干预。
也就是说一级缓存与共享缓存是互补的,共享缓存能够为明确界定存取数据的算法提升存取速度,而一级缓存则能够为一些不规则的算法提升存储器存取速度。
● 频率提升
相对于GTX460来说,GTX 560 Ti在核心、Shader以及显存频率方面都得到了大幅度的提高。
记得在GTX460发布的时候,有无数玩家对这款产品的频率都非常不满。一是核心频率和Shader频率较低(675/1350),二是显存频率也和AMD的同级别产品差距太大。对高端显卡比较了解的朋友应该知道,AMD凡是采用GDDR5显存的产品,默认显存频率都超过了4000MHz,而NVIDIA此前最高端的GTX480显存频率都只有3696MHz。
但是,本次发布的GTX560完全可以让用户忘掉GTX460在频率上的遗憾,GTX 560 Ti的默认频率高达822/1644/4008MHz,比GTX460高出一大截。
▲ NVIDIA公布的GTX580官方PDF
这张柱状图体现的是拥有384个流处理器以及更高频率的GTX 560 Ti 相对于GTX460的性能提升,可以看到在改进工艺的基础上再提升频率和流处理器数量之后,GTX 560 Ti的威力非常强大,很多数游戏性能提升幅度约30%,个别甚至达到40%之多!
前面几页我们简单的介绍了一下GF114核心的GTX 560 Ti相对于GF110核心的 GTX460的改进,大家也应该对NVIDIA Geforce GTX 560 Ti有了一定的了解。接下来我们看看公版GTX 560 Ti。
延续NVIDIA的次高端公版庄重而不失时尚的风格,GTX 560 Ti的外观和GTX 460非常相似,只是换上了更潮的贴纸。
GTX 560 Ti和 GTX 460 PCB 乍看之下也是非常相似,其中的不同下面再说。
GF114和GF104(右)核心对比
显存从0.5ns升级到了0.4ns的三星GDDR5颗粒,理论频率可达4800MHz,不过NVIDIA这款显卡的频率依然比较保守,显存频率为4008MHz。
供电部分有了加强,从以前的3+1相升级到4+1,用料更为扎实。
GTX 560 Ti的散热器结构基本与GTX460相同,但为显存和供电模块专门安装了一体式散热片,以满足高频显存和超频时供电满载的需要。
输出接口方面NVIDIA依旧相对保守,和GTX460(右)一样仍然采用双DVI+MINI HDMI的设计,当然可以通过转接的方式支持任意接口的显示器。
翔升推出的GTX560Ti产品具备极强的超频性能,配备翔升独家“金刚轮”散热系统,堪称Fermi二代超频旗舰。翔升这款GTX560Ti产品在核心频率上大幅超越公版,满足追求极限性能玩家需求。
翔升GTX560Ti系列显卡在散热上配备翔升独家金刚轮散热系统。翔升金刚轮散热系统由2根8毫米加粗镀镍热导管直接接触GPU,再通过扣合pin工艺将热导管与高密集散热鳍片紧密相连,并用纯金属全覆盖金刚整流罩一体化连接,再搭配超耐久双滚珠散热风扇组合而成。
翔升推出的金刚轮散热系统中配备的酷冷至尊双热管双滚珠风扇,在高温高湿严酷环境下的使用寿命高达30000小时以上。耐高温不怕灰尘的特性让它特别适合在恶劣的使用环境下运行,完全应付玩家各种试用环境。
翔升GTX560Ti显卡经翔升工程师反复设计验证,最终采用比公版多一相,且对超频玩家非常实用的5相核心/显存分离式供电设计。加强的供电设计,保证显卡长期稳定运行,奠定显卡极强的超频基础。
输出接口方面,翔升GTX560Ti显卡采用主流的mini-HDMI接+双DVI输出设计,其中每个DVI均能输出Dual-Link信号,确保高端用户对2560*1600分辨率的使用。同时支持支持HDMI 1.4a,其中包括GPU加速的蓝光3D支持、x.v.色彩、HDMI深色以及7.1数字环绕声,可配合使用各类高清显示终端设备。
国内NVIDIA核心AIC合作伙伴厂商七彩虹(Colorful)正式推出了基于鲨鱼仿生学设计的iGame560TI 烈焰战神U D5 1024M,这也是iGame继去年推出iGame460后,再一次推出基于鲨鱼仿生学的GTX560TI显卡——iGame560TI 烈焰战神X。
iGame560TI显卡正是利用了鲨鱼的仿生学,以鲨鱼的“形”、“色”、“结构”等为研究对象,有选择地在设计过程中应用这些特征原理进行的设计,同时结合仿生学的研究成果,为设计提供新的思想、新的原理、新的方法和新的途径。
整卡设计依然在PCB的背部保留了背板的设计,背板以配件的形式附送,默认出货会默认装上。背板对显卡的硬度起了更好的保护作用,在机箱内长时间使用后防止PCB的变形。另外,还能在导热性能上起到了很好的作用。在显卡背部的左上角可以看到七彩虹专门为玩家设计的电压测量点,玩家只需用万用表即可随时测量核心、显存和外接供电的电压。这一举解决了极限玩家超频时测量电压难的问题,同时也能更加精准的测量显卡的实际功耗。
该卡高频状态达到了900/4400MHZ。
显存使用的是三星0.4ns的显存颗粒,等效频率为5000MHz。另外,该卡继续保持了双BIOS的设计。而此功能也将延续这款显卡的两大特性——安全和性能。在安全方面,两颗BIOS完全独立设计,能起到相互恢复的作用。在性能方面,延续了一键超频的特色技术,用户无需复杂的操作技能提高显卡性能。
iGame560TI采用了6+1相“呼吸”供电系统。设相对公版的3+1相供电有明显的加强,采用了6+1相供电的强悍设计。理论最高可以支持400W功耗的GPU,而且兼容Intel最新的VRM1.1的规范,支持可编程或动态开关相位的节能技术及高转换效率模式,可以提供智能调节负载与电压输出功能。
iGame560TI采用横穿式热管,使得热导管得到了更长的设计,与散热鳍片的接触面积比普通热管的接触面积增多34.2%;另一方面,使用了横穿式结构之后,整体结构显得更加紧凑和轻巧,节省了20MM的空间,更利于气流的流动。
它还采用了双风扇,并使用了大小扇结构的设计。大风扇集中帮助GPU散热,小风扇集中帮助MOS,电感,电容散热,整卡的散热均能兼顾,而且噪音小。据悉,此款风扇在日常应用中,转速只有1500转左右,噪音超低。
扇叶的形状同时会影响到噪音和风量大小,也关乎最终的温度。这一次设计上,iGame560TI扇叶上仿生鲨鱼皮肤上的纹理,减少风扇运转时切割空气所产生的噪音,借助类似设计的还有第四代鲨鱼皮游泳衣,也帮助运动员打破了多次世界纪录。
输出接口部分采用了常见的爽DVI+minHDMI的组合。
点评:鲨鱼仿生学、扎实的用料、方便的超频设计,这款显卡身上的亮点数不胜数,唯一的缺点就是体积太大。
除了鲨鱼iGame560TI之外,inno3D也推出了自己的GTX 560 Ti,不过这款是公版卡。
用了蓝色PCB,换了贴纸,但是PCB设计和公版无二。
核心默认频率为950MHz,比公版的822高出不少
同样也是用三星0.4的显存颗粒,但默认频率达到4400MHz,高出公版10%。
四+1项供电设计
均热板散热设计,成本较高但是散热效果良好
输出接口同样采用的是双DVI+Mini HDMI的搭配,这里不再赘述。
点评:虽然采用公版设计,但是默认频率却高了不少,游戏性能也得以提升。
NVIDIA的重要合作伙伴铭瑄在第一时间发布了GTX 560 Ti。
集成了铭瑄经典和橙色黑色,这款GTX 560 Ti黑武士依旧锋芒内敛。
红色也是铭瑄钟爱的颜色。
这款GF114核心默认900MHz,超过公版不少。
采用三星0.4ns的显存颗粒,默认频率4200MHz,高于公版。
供电部分采用了4+1项的设计
和GTX460黑武士有所不同,这款GTX 560 Ti采用的是双风扇+纯铜底座+热管辅助散热。外形大气养眼,散热效果良好。
点评:铭瑄这款GTX 560 Ti并非公版设计,但性能要强于公版,价格也比较有吸引力。
影驰发布了一款面向于骨灰级玩家的显卡─GTX 560 Ti Hall Of Fame(HOF)。这款显卡采用了少有的乳白色PCB,引起了很多玩家的关注。
“名人堂”。“名人堂”由Hall of Fame直译而来,为影驰最优异的系列,各方面都不惜工本,完全为高端玩家和极限超频玩家而生,“一切只为性能”是Hall of Fame的设计理念。
影驰送测的这款GTX560Ti限量版核心频率达到惊人的1GHz,是目前频率最高的GTX560Ti之一,普通版的GTX560Ti HOF为950MHz,喜欢它的朋友在购买的时候要注意一下。
显存依然使用了0.4ns的三星颗粒,默认频率4400MHz。
影驰 GTX 560 Ti HOF最值得骄傲的地方就在于采用了强劲的Volterra全数字供电方案。由于价格极其昂贵,Volterra全数字供电方案只有在最高端的AMD旗舰显卡才能看到,如最近上市的HD 6970。Volterra全数字供电方案由VT1185M主控芯片、六颗CSP封装的VT1157SF从控芯片,还有专属的Bussmann CPL排感组成,每个供电环节都保持极高的开关频率。
Volterra全数字供电方案各个运行部件均能运行在极高频率,最高1300KHz开关频率,每相可以稳定提供40A电流供应。而传统的模拟供电方案开关频率仅仅为300K Hz附近,每相仅仅稳定提供30A电流,速度、精度和集成度都无法比拟数字供电方案。而影驰GTX460 HOF核心六相供电,最高提供240A电流,并能保持88%以上的电源转换效率,足以满足显卡大幅超频使用。
GTX 560 Ti HOF所采用的散热鳍片面积2.5倍于公版,35片225mm长的铝制鳍片占据整个PCB面积,更大的散热面积无疑大大增加了散热效能,鳍片通过四条非压扁热管焊接起来,铜板原型焊接虽然成本贵,但效果优秀。
影驰GTX460 HOF导风罩还采用了全金属材质,进一步增加散热器的散热面积。镂空的导风罩设计不仅可以提升显卡的卖相,同时可以优化风道,令热量快速排出。另外一体式的散热结构也可以有效防止PCB变形,兼具了金属加固条的作用。
不同于公版,影驰提供了HDMI+DP+DVI三大主流接口,让玩家可以有更多的接驳选择。
点评:秉承名人堂的一款作风,这款GTX 560 Ti HOF外观靓丽,用料奢华,起始频率更是惊人,给人一种追求完美的感觉。
索泰作为NVIDIA全球核心伙伴,第一时间发布了GTX560 Ti产品:GTX560Ti-1GD5 极速版,主打性价比和超频能力,不过此性价比定义和绝对价格性价比不同,其注重的是超高的每瓦特性能;
GTX560Ti极速版使用自主研发的亮黑色PCB,为满足GTX560 Ti超高的默认频率,供电的用料比起GTX460要强上很多,主要的原件集中在PCB正面,可以利用一体式风扇辅助散热。
基于GF114-400-A1核心,配备384个CUDA处理器,改进后的Fermi架构非常适合高负载的DX11游戏应用。默认频率822MHz。
显存方面,采用三星 0.4ns GDDR5显存,规格甚至比GTX570还要高,正面8颗组成1024MB/256Bit,核心与显存频率为870/4010MHz,给玩家挖掘超频留足了空间。
采用了4+1相供电设计,每相由三个8爪鱼Mosfet组成(一上两下),每相输出都采用2颗NCC 2.5V820uF固态电容,保证输出品质。其次在供电部分设置了三颗A219硬件电源管理芯片(PCB背面)和精密贴片电阻(绿色),实时监测6pin以及PCIE的12v电压变化,并动态进行调节,当温度、功耗过高时执行保护机制。
散热风扇没什么特点,沿用了GTX460常见的直吹式散热方案,不过金属的外壳倒是挺有利于散热。
双DVI+Mini HDMI输出组合,双DVI接口均配备EMI屏蔽罩,可减少电磁干扰。HDMI 1.4a支持x.v.色彩、深色HDMI以及7.1声道源码输出,满足越来越普及的高清显示终端设备。
点评:品质和使用至上,4S理念的忠实拥护者,索泰显卡不错的口碑来自以用户为本的不变理念。
由于本次测试的主体以及参加测试的对比显卡都是目前的高端产品,为了尽量避免处理器和内存出现性能瓶颈,测试平台我们选择了高端的i7 965+X58+三通道这样的组合,内存使用了口碑不错的CORSAIR(海盗船)DDR3 1600 6GB(2GB×3条)。
● 详细配置如下表所示:
PCPOP.COM | |
硬 件 系 统 配 置 | |
处理器 |
Intel Core i7 965 |
(4核 / 8线程 / 133MHz*24=3.2GHz / 8MB缓存) | |
主 板 |
华硕 X58 |
(Intel X58+Realtek ALC889 8声道音效芯片) | |
内 存 |
DDR3 1333 6GB(2GB×3条) |
(9-9-9-24-2T) | |
硬 盘 |
Seagate Barracuda 7200.12 SATA |
(1TB / 7200RPM / 32M缓存 / NTFS系统分区) | |
电 源 |
Tagan BZ1100W |
六路+12V联合输出功率960W,单路+12V最大电流20A | |
显示器 |
ASUS |
(24英寸LCD / 1920*1200分辨率) | |
软 件 系 统 配 置 | |
操作系统 |
Microsoft windows7 |
(中文版 / 64BIT 旗舰版) | |
驱动 |
AMD 10-12_vista64_win7_64_dd_ccc_enu |
NV266.56_desktop_win7_winvista_64bit_english | |
游戏信息获取 |
Fraps |
版本号3.1.2 | |
显卡信息获取 |
NVIDIA Insperctor |
版本号1.90 | |
处理器信息获取 |
CPU-Z |
版本号1.53 |
为了让大家对新发布的显卡性能有个全面系统的认识,我们从GTX580到GTX460,从HD6970到HD5850,目前NVIDIA和AMD新老旗舰及高端,共计十一款显卡一网打尽。
软件环境方面,本次测试依然采用Windows 7 x64操作系统,N卡测试采用NVIDIA的支持GTX 560 Ti的最新驱动266.56,A卡测试驱动则采用目前最新通过WHQL验证的催化剂10.12。
下面,我们就一起来看看GTX 560 Ti在游戏性能方面,是不是真有官方宣传的那么出色。
暴雪的游戏,引擎往往并不是最新,系统要求也不是很高,但游戏画面却趋于完美,让人惊叹不已,这就是暴雪程序员和美工的独到之处:他们可以使用最成熟、最易用的技术勾勒出最优异的特效。此次Starcraft II就是这样,虽然没有使用DX11 API,但大量DX9C成熟技术的应用让我们目不暇接。
包括FP16 HDR、光线散射/反射效果(Diffuse and specular for lighting)、景深效果(depth of field)、体积雾(fog volumes)、动态环境遮蔽(dynamic ambient occlusion)、智能贴图置换(smart displacement)等等,这些都是Starcraft II的“BT”之处。
游戏介绍:《星际争霸Ⅱ》延续了神族、人族和虫族三足鼎立的传奇史诗。继原作《星际争霸》之后,这三大截然不同又各赋异秉的种族将再次面临冲突与对抗,旧有兵种、升级兵种以及全新的兵种将一一登场,为了各自种族的生存,展开惊心动魄的搏杀,战火将烧遍整个星系。
画面设置:所有特效全开最高,分辨率使用1920x1080。值得一提的是,《星际争霸2》 正式版虽然本身不支持抗锯齿,但是NVIDIA和ATI都先后通过驱动更新,加入了抗锯齿的支持。
测试方法:登录官网进行对战,然后播放录像全程,游戏路线中的所有单位均为实时渲染,用来测试3D性能非常合适。
作为一款DX9C的即时战略游戏,过于追求画质并不是什么好事情。从本次测试我们发现这款2010年的暴雪大作对显卡的要求不算,对CPU有一定的要求。本次高端显卡对决,成绩并没有拉开距离,因为显卡基本不是瓶颈了。
PC版《街头霸王IV》对应Game for Windows Live功能,支持在线对战、游戏内短信交流和即时语音聊天。PC版除了支持高解析度画面输出之外,还为玩家提供了画面渲染风格选择的功能,除与家用机版一样的“普通”模式外,还有“水彩”、“海报”和“烟灰墨”这三种追加的渲染风格。
测试方法:测试时使用游戏自带Benchmark。
作为一款DX9C游戏,《街霸4》和写实风格的FPS游戏不同,街霸渲染的人物模型数量较少,场景比较简单。而对于现在的高端显卡,这些显然是小菜一碟,几乎所有显卡都超过了100帧,对于游戏本身已经没有测试的必要。但是即便如此,我们通过这款Benchmark程序,依然可以清晰的看到这11款显卡的DX9实力。560Ti和HD6870、GTX480相当,双卡SLI则是轻松拿到了第一。
作为FPS类游戏中的经典,《使命召唤》系列在战争题材的FPS游戏中占据着很大的市场,在全球范围也一直都不缺乏忠实的玩家。《使命召唤7:黑色行动》由负责《使命召唤3》与《战争世界》的Treyarch操刀制作,游戏的时间点设定于冷战时期,游戏主要描述了战争期间的一个名称为Studies and Observations Group的组织,他们将在越南战争中承担最秘密、最危险的任务。而且游戏场景还会穿插北极、古巴等一些冷战时期的热点地区。
《使命召唤7:黑色行动》有对战累积经验值的设计,还多了所谓的“CoD点数(CoD Points)”,经验值只能解锁武装的购买权,还要另外花点数购买才能换取新的武器、配件与能力。因应新的CoD点数系统,多人游戏也多了所谓的押注比赛(Wager Match),里面细分为数种不同的玩法,比赛的赢家可以大赚一笔赏金。
画面设置:同样是一款跨平台的DX9游戏,使命召唤7对显卡的要求也不算高,本次测试我们游戏依然采用1920X1080分辨率,特效设置最高,抗锯齿4XAA。
作为2010年最新的FPS大作,《使命召唤7:黑色行动》虽然是DX9C,但游戏要求显然比街霸等游戏高很多、在1920X1080分辨率+4AA下,我们发现游戏内置了帧数限制,HD6850以上显卡已经达到了上限。
软件介绍:做为目前最为权威的性能测试软件,3DMark Vantage在3D基准性能测试,可以全面准确的得出显卡的真实性能,所以在历次测试中都少不了它的加盟。3DMark Vantage所使用的全新引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨。
画面设置:3DMark Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级),只有在这四种模式下才能跑出总分,如果自定义模式就只能得到子项目分数了。我们此次测试选择了Extreme(旗舰级)进行测试。
3DMark Vantage是DX10性能测试的权威。而在本项测试中,NVGTX500系列显卡跑出了不错的成绩。560Ti双卡居然跑出了17000+的GPU分数,速力效率达到90%,看来目前速力技术已经臻于完善。
<
Crysis(孤岛危机)无疑是DX11出现之前对电脑配置要求最高的PC游戏大作。作为DX10游戏的标杆,Crysis的画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。Crysis还有个资料片Warhead,使用了相同的引擎。
画面设置:Crysis只有在最高的VeryHigh模式下才是DX10效果,但此前所有高端显卡都只能在低分辨率下才敢开启DX10模式,如今测试集显自然都是最低效果。
测试方法:Crysis内置了CPU和GPU两个测试程序,我们使用GPU测试程序,测试了1920X1080模式。这个程序会自动切换地图内的全岛风景。
Crysis是一款对CPU、GPU乃至显存都要求不低的游戏,一度有显卡危机之诨号,在开启了全特效+4AA之后,多数显卡成绩均在30帧左右徘徊,勉强算是及格。而SLi在这款游戏中依然表现出了很高的效率。
游戏介绍:《冲突世界》将带领玩家返回著名的冷战时期,玩家每一个决定均影响游戏中人物和情节。可于游戏中感受不一样的团队精神,与队友于阴森恐怖的战场上一同作战。《苏联进攻》是其最新的资料片,收录全新角色、扮演苏联军队、10套新影片和全新多人联机地图等等。
画面设置:《冲突世界》是首批DX10游戏之一,采用了自行研发的MassTech引擎,支持多种当前的主流显示特效,如容积云,景深效果,软阴影等,光照系统也表现出色,尤其是半透明的容积云特效营造出了十分逼真的户外场景,物理加速结合体积光照渲染出了最逼真的爆炸效果。
测试方法:内置Benchmark是一段非常华丽的过场动画作为测试程序,最终得出最大、最小和平均FPS,测试结果非常精确,因为这款游戏对显卡要求不算很高,我们照例特效全开。
WIC中的纹理压缩非常高,远景渲染也控制的恰到好处,BenchMark程序虽然时间不长但是非常激烈。想丢而言这款游戏中各款显卡的性能差距并不是非常明显。
游戏介绍:自《孤岛惊魂》系列的版权被UBI购买之后,该公司蒙特利尔分部就已经开始着手开发新作,本作不但开发工作从Crytek转交给UBI,而且游戏的故事背景也与前作毫无关系,游戏的图形和物理引擎由UBI方面完全重新制作。
画面设置:借助于蒙特利尔工作室开发的全新引擎,游戏中将表现出即时的天气与空气效果,所有物体也都因为全新的物理引擎,而显得更加真实。你甚至可以在游戏中看到一处火焰逐渐蔓延,从而将整个草场烧光!而且首次对DX10.1提供支持,虽然我们很难看到。
测试方法:游戏自带Benchmark工具。
和孤岛危机相比,支持DX10.1的孤岛惊魂对显卡的要求显然要低的多,而在这款游戏中,性能排位有些微妙的变化,N卡整体发挥出色,GTX460名次也上升了几位,超越了HD5850。
时至今日,依然没有任何一个测试软件或者游戏能够取代3DMark在游戏玩家心目中的地位,因为3DMark的魅力就在于它所带来的不仅仅是惊艳的画面,更重要的是向广大玩家提供了一种权威、系统、公正衡量显卡性能的分值。
3DMark11的测试重点是实时利用DX11 API更新和渲染复杂的游戏世界,通过六个不同测试环节得到一个综合评分,藉此评判一套PC系统的基准性能水平。
● 3DMark 11的特色与亮点:
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面细分、计算着色器、多线程。
2、原生支持64bit,保留32bit:原生64位编译程序,独立的32位、64位可执行文件,并支持兼容模式。
3、全新测试场景:总计六个测试场景,包括四个图形测试(其实是两个场景)、一个物理测试、一个综合测试,全面衡量GPU、CPU性能。
4、抛弃PhysX,使用Bullet物理引擎:抛弃封闭的NVIDIA PhysX而改用开源的Bullet专业物理库,支持碰撞检测、刚体、软体,根据ZLib授权协议而免费使用。
● 3DMark 11 Extreme模式设置:
● 3DMark 11 Extreme模式成绩:
3Dmark11为了兼顾目前依然服役的老游戏,对DX11的特效考察都是轻量级的,而是侧重传统图形性能。A卡在这款基准软件测试中的表现要好过3DMark Vantage。但是即便如此,GTX580依然保持的单芯第一的王座。而GTX 560 Ti的双卡更是性能卓越。
游戏介绍:Unigine Engine率先发布了首款DX11测试/演示程序——Heaven Benchmark,其中大量运用了DX11新增的技术和指令,看来在新版3DMark11面世之前,Heaven将会是DX11性能测试的非常好的选择。
画面设置:2.1版本进一步强化了Tessellation技术的应用,细分精度更高,画面更上一层楼。
Heaven 2.1的测试过程比较漫长,总共有多达26个场景(视角),测试结果比较稳定,误差小。我们为了照顾A卡,Tessellation并没有选择最高,而是折中的4AA+16AF,Tessellation normal,但是总的来说还是GTX500系列显卡占优。而将Tessellation调到Extreme之后,A卡全部沦陷,测试结果意义不大,所以略去。
游戏介绍:游戏引擎开发商BitSquid与游戏开发商Fatshark近日联合公布了一个展示DX11强大技术的DEMO。这个名为《StoneGiant》(石巨人)的DEMO,可以让玩家来测试自己PC显卡的DX11性能。BitSquid Tech即将提供PC平台的引擎,并且大概在今年第三季度将提供PS3和Xbox 360等其他平台的引擎。
画面设置:StoneGiant是一款技术演示Demo,画面做的非常精美,进入之后可以选择开启关闭Tessellation以及DOF(DX11级别景深)进行测试,这两项技术都十分消耗资源,尤其是同时打开时。其中Tessellation技术对画质的改善最为明显,测试时默认开启Tessellation、打开DOF进行测试。
测试方法:游戏自带Benchmark。
看得出来,A卡的“压力”确实很大,DX11特效使用的越多,其表现就越差,这是架构使然,因为HD5000/6000中均只有一个曲面细分单元,已经很难满足一些DX11游戏大量曲面细分的需要了。
游戏介绍:《战地:叛逆连队2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。开发商EA已经于本月2日正式同步发售了Xbox 360、PS3、PC版。该游戏是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连队》的直接续作,在继承前作特性的基础上,强化了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。
画面设置:《叛逆联队2》虽然是款DX11游戏,霜寒引擎也是备受期待的DX11引擎,曾被ATI用来做Tessellation的技术展示。不过最新版本的对DX11的支持非常有限,仅仅是采用新指令集渲染HBAO特效而已,游戏会自动侦测显卡的DX级别来选择渲染模式。
测试方法:游戏不带Benchmark,笔者选取了单人任务模式下的一段无需手动干涉的过场动画进行测试,其中包括大量激烈的轰炸爆破激战场面,完全可以反映真实的游戏性能。
作为一款DX11大作,叛逆连队的画面堪称精美,而且游戏效率很高,开启全部特效以后,高端显卡还是可以流畅的运行这款游戏。
由育碧布加勒斯特开发的新一代DX11空战大作——《鹰击长空2》最近放出了这款游戏的测试程序,令玩家们总算初步体验到了游戏的震撼效果。
《鹰击长空2》是一款结合了拟真与空战要素而成的模拟飞行游戏,玩家可驾驶多种高性能战机,在高空中进行巡逻、护航、轰炸等任务。值得一提的是,游戏中的地面场景乃参考GeoEye卫星空照图所构建而成,这项游戏与现实生活的科技结合,让玩家仿佛置身于战机的驾驶舱内,逼真的地表风貌一览无遗。
《鹰击长空2》中玩家不仅将投入到紧张刺激的空战和投弹中,还将亲自负责飞机的起飞和降落工作。E3大展上开发人员展示了飞机在航空母舰上起飞的过程。看上去,起飞的过程和加速一样容易,达到一定的速度,拉起左侧的把手,使飞机起飞。估计整个操纵的难度也会随着游戏的难度而增加,当选择新增加的“真实情景”模式时,应该就更有挑战性了。
这是一款非常受欢迎的空战游戏,同时也是一款N卡支持非常完美的游戏,即使是最弱的GTX 460,在这款Benchmark测试中,表现也很出色。当然所有高端显卡都可以流畅运行游戏,从这点上说,他们都是满分。这里说明一下,有几款显卡因故没能参加这款游戏的测试,所以也没成绩。
著名游戏制作人希德·梅尔的作品包括《半人马星座》、《铁路大亨》等众多模拟类精品,其中最为广大玩家熟知的便是《文明》系列。该系列自91年推出首部作品,至今共诞生了十余款正作和资料片,每一代都大受好评,是游戏史上评价最高的游戏系列之一。
该游戏的主体内容正如游戏名称一样,描述了人类文明诞生后的发展历程,玩家将从公元前4000年开始,一直将一个种族发展到21世纪甚至未来,发展历程中紧密相关的是经济、文化、科技、政治等因素,你将亲身感受历史中各种各样的事件。最终建立起一个王朝,游戏最终胜利的方法也多种多样,包括军事征服、文化统一、外交等多种手段。不仅游戏本身乐趣十足,还能充分了解人类文明发展的历程。
本作包括美国、中国、俄罗斯、英国、法国、德国、日本、埃及、希腊、印度、罗马、波斯等18个不同的文明,有些文明现在已经消亡,有些则现在仍然繁荣。每个种族都具有自己的特色,并且选取了一位该民族历史上很有代表性的领导者。例如美国:华盛顿;中国:武则天。日本:织田信长等。
每种文明的特长也不尽相同,有些以扩张、军事闻名,有些则在经济、贸易方面有突出优势,有些国家擅长在陆地上有称雄实力,有些则在航海领域有得天独厚的优势。不同的文明特长也体现在不同的历史阶段。和真实历史中相符合。
《文明5》的画面已经达到当今策略类游戏的巅峰,更支持最新的DX11技术,画面精细,美工也是一流。当然和FPS类的游戏比,对显卡的要求还是比较低的。
游戏介绍:《科林麦克雷》系列游戏是为纪念去世的英国拉力赛车手科林·麦克雷(Colin McRae)而制作的,因此在游戏过程中不难见到许多麦克雷过往的身影。与一年一款的优品系列赛车游戏不同,DiRT2距离前作已经两年之久,目前《科林麦克雷:尘埃2》主机版早已上市,几乎登陆所有的主机和掌机平台、好评如潮,而PC版由于支持DX11的缘故,所以被延期数月。
画面设置:DIRT2堪称DX11游戏代表作,DX11的五大关键特性在这款游戏中都有体现,但却没有得到大范围的应用,都是点到为止。比如Tessellation主要体现在水洼和旗帜上,而赛车过程中也就那么几处采用了该技术,因此这款DX11的要求并不高,特效全开的话中端显卡都能跑动。
测试方法:游戏自带Benchmark程序,会自动跑完一个固定的赛道,非常接近于真正玩游戏的模式,最后得出平均FPS和最小FPS。
虽然DIRT2这款游戏当中应用了所有的五大DX11关键技术,但都是轻量级的,因此对显卡要求不是很高。而作为AMD力推的一款DX11游戏大作,N卡在本作中的表现却是非常抢眼。
游戏介绍:《Aliens vs. Predator》同时登陆PC、X360和PS3,其中PC版因为支持DX11里的细分曲面(Tessellation)、高清环境光遮蔽(HDAO)、计算着色器后期处理、真实阴影等技术而备受关注,是AMD大力推行的游戏之一,但是这样的主题难免让本作有很多不和谐的地方,暴力血腥场面必然不会少!发行商世嘉在2009年11月就曾明志,表示不会为了通过审查而放弃电子娱乐产品发行商的责任,因为游戏要维持“异形大战铁血战士”这一中心主题,无论画面、玩法还是故事线都不能偏离。
画面设置:AVP原始版本并不支持AA,但升级至1.1版本之后,MSAA选项出现在了DX11增强特效当中,当然还支持Tessellation、HDAO、DirectCompute等招牌。该游戏要求不算太高,所以笔者直接将特效调至最高进行测试。
测试方法:游戏带Benchmark,其中测试画面颇代表意义,很好的体现了Tessellation异形身体以及HDAO等高级特效,希望这些特效能让系统发挥所有潜力。
AVP虽然应用了很多DX11特效,但和基准测试软件相比还是轻量级的。而560 Ti SLi在这款游戏中效率惊人。
游戏介绍:《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作,也是DX11游戏的新成员。该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。
画面设置:《地铁2033》虽然支持PhysX,但对CPU软件加速支持的也很好,因此使用A卡玩游戏时并不会因PhysX效果而拖累性能。该游戏由于加入了太多的尖端技术导致要求非常BT,以至于我们都不敢开启抗锯齿进行测试,只是将游戏内置的效果调至最高。游戏自带Benchmark,这段画战斗场景并不是很宏大,但已经让高端显卡不堪重负了。
测试说明:如果说是CRYSIS发动了DX10时代的显卡危机,那地铁2033无疑是DX11时代的显卡杀手!地铁2033几乎支持当时可以采用的所有新技术,在画面雕琢上大肆铺张,全然不顾显卡们的感受,和CRYSIS如出一辙。然而CRYSIS靠着特效的堆积和不错的优化,其惊艳绝伦的画面和DX9C游戏拉开了距离,终究赚足了眼球;而地铁则没有这么好运了,画面固然不差,BUG却是很多,招来了大量的非议。
特效的滥用,超大的纹理和复杂的模型,也许4A Games本来就没打算让这款游戏流行。本次测试我们使用4AA抗锯齿+全特效来考验高端显卡,而经过多款驱动的不懈优化,现在中高端显卡玩地铁2033终于像是一款游戏而不是幻灯片或者别的什么了,而旗舰显卡或者双卡SLi则让我们看到了一线曙光。 <
游戏介绍:《失落的星球2》的游戏舞台是前作故事发生后十几年之后经过温暖化改变的EDN-3rd,这里将新增丛林等新场景,主人公也并非前作那样为一人,而是以“雪贼”们不同的视点展开故事。
画面设置:与前作相同,《失落的星球2》采用CAPCOM公司原创引擎MT Framework的最新版VER.2.0进行开发,游戏世界的表现将更加细致和美丽。而不仅仅是画面上的进化,本作将会在前作玩家要求基础上追加大量全新要素,新场景、新角色、新武器等自不必说,角色的动作也比前作更加丰富多彩。
测试方法:游戏自带Benchmark,开启全特效+4AA选择B场景的BOSS战,非常激烈过瘾。
这款最新的DX11游戏对显卡要求果然不低,不过还算可以接受。这款大量应用最新DX11特效的游戏,A卡整体成绩惨淡,而GTX560 Ti相对于同核心的GTX460,性能提升显而易见,居然超越了A卡旗舰HD6970,着实让小编吃了一惊。
★ 我们怎样测试显卡功耗:
▲ 测试整机的功耗非常方便
此次测试和以往一样,我们是采用功耗仪测试整个平台的功耗,然后通过差值计算出不同显卡之间的功耗差异,从而得出显卡实际功耗估值,这个功耗一样具有参考价值,换个显卡差几瓦大家也都心里有数!
FurMark是oZone3D.net开发的OpenGL基准性能兼显卡稳定性测试工具和显卡拷机软件,FurMark可让GPU长期满负载运行特别能考验显卡可靠性,这款软件和OpenGL FurRenderingBenchmark很相似,界面和使用上都很相似.不过不同的是FurMark已经在测试OpenGL 2.0的性能.这个测试提供很多选项设置,包括全屏/窗口设置、MSAA选项、窗口大小、测试时间、当然还有GPU稳定性测试(烤机)。
X58三通道果然非省油的灯,桌面闲置状态下,整机功耗也逼近200W大关。
而在Furmark满载拷机状态下,旗舰显卡基本都上了400w。但N卡高端都很绿色节能,那是因为N卡为Furmark做了过载保护,它们实际的满载功耗应该略高一些。
相关评测:285只配做物理卡?[黑手党2]全面评测
游戏介绍:《黑手党2》(Mafia II)将带领玩家进入1940年至1950年虚构的地下世界,就像好莱坞电影般的游戏世界,玩家可在拟真的城市中冒险。在1940年代的城镇中,居民如同往常过着平静的生活,帮人擦鞋、卖报纸,而路边偶尔会出现黑帮份子。
画面设置:这是一款支持PhysX GPU物理加速的最新游戏,但依然使用了DX9C引擎,因此画面本身并不出彩,但大量的爆炸、烟雾、破碎、衣料等物理效果还是很不错的。
测试方法:游戏自带Benchmark,内置的抗锯齿并不知道是多少倍数,分为不开PhysX和High两种模式进行测试。
这款Benchmark的成绩比较怪异,各款显卡成绩并没有拉开应有的差距,这是因为在关闭PhysX的情况下,游戏中依然有一些物理效果通过CPU演算。当然但从流畅角度来看,这成绩已经足够了。
开启PhysX之后,人物衣物的摆动自然流畅,物品碰撞和破坏效果趋于真实,这就是PhysX技术所带来的,更为真实更为强大的物理运行效能。
但开关PhysX对于整个游戏的性能有着十分明显的影响,不支持GPU加速的A卡只能用CPU算物理,FPS直线下跌,完全无法流畅运行。N卡帧数也下降不少,不过尚在可接受的范围,1920分辨率下GTX460算是勉强流畅,能保证25帧左右的成绩。
GTX460就是一款很能超的显卡,那GTX 560 Ti是不是也延续了GF104的传统呢?下面我们就用NVIDIA原厂公版卡小超一下,看看它的实力如何。
▲ 稳定超至1030MHz/4900MHz,X1739分。
▲ 3DMark Vantage 只能稳定上到1000MHz/4800MHz,再高的话出现花屏、驱动重置。
▲ 只运行Furmark拷机测试可以超至恐怖的1065MHz/5000Mhz
新一代的GF114核心果然不负众望,公版卡核心风冷轻松可以超至1G,显存上4800MHz也没什么问题。难怪一向保守的NV这次将GTX 560Ti的默认频率就定在了822/4004MHz。
懂车的人不会嫌法拉利费油,懂显卡的人也不会仅仅因为功耗而否定一款产品。价格作为随波逐流的东西,性价比很难有定论。既然如此,我们不妨抛开市场定位、营销策略,讨论一下纯粹的GPU核心架构。
GTX480、470性能上完全超越了同时代的竞争对手,但依然没有得到很多消费者的认可,表面上原因有二。其一,功耗发热问题。其二:发布太晚。随着时间的流逝,公众的心里预期不断推高。
事实上最根本的原因只有一个,NVIDIA过于注重自身GPU核心架构的完美和先进,却高估了台积电的工艺进步速度。虽然同为40NM工艺,A卡相对简单的核心更容易制造,良品率也好控制;反观GF100比较独特的复杂的架构让fermi不仅延期数月(发布晚),而且频率不高(性能折扣),核心漏电(功耗失控),能效比偏低。事实证明,超前的架构设计并不一定能做出最成功的产品,显卡市场没有优胜劣汰,只有适者生存!这样就很好解释为什四核心的GTX480不如双核的GTX460成功。
而GTX 560 Ti所采用的GF114更是在GF104基础上进一步改进的芯片,虽然同为40nm,但积累了数月经验之后,成熟的工艺给我们带来了更低的功耗、更低的温度以及更好的执行效率。
▲ NVIDIA公布的GTX 560 Ti官方PDF
在架构和制造工艺(依然40nm)没有实质性进展的前提下,GF114取得如此进步并非它比GF104高明多少。而是随着生产工艺的不断完善,适合它的时代终于来临。如此说来,Fermi不是来晚了,而是来早了!
至此,上一代革命架构得以涅槃重生,Fermi终究再无遗憾。
从某种意义上说,游戏是显卡的另一个生存环境。虽然之前HD5000系列取得了不错的成绩,但API新出之时,游戏厂商对DX11特效还是浅尝辄止,更多的是利用了它纹理贴图倍增的特性,用超大分辨率纹理,较多顶点模型来提高画质。这样虽然可以最省事的实现逼真的画面,但随着贴图材质不断放大,纹理定址与拾取也就是GPU的TMU单元叶需要越要强劲,资源就越要充足。而在晶体管数量有限的情况下做更大的TMU和ROP单元就要舍弃Shader的晶体管开销。
逼真的画面和特效可以借助先进API引进新技术实现,同样也可以用传统的复杂原始模型来通过大块材质贴图实现,一流的美工的确可以让一些伪3D的场景比真3D场景更加养眼,但对于画面的发展而言,是有害无益的。不可客隆和编程的人工行为由于自身极限制约,终究无法实现完全逼真的视觉模拟。
次时代游戏将逐渐摆脱依赖低等级的材质堆砌和传统的特效渲染,而是通过更高等级的编程接口来实现。这种变革可能伴随着阵痛,也非一朝一夕之功,然火车在发明之初也跑不过马车,诚然目前用模块化的特效实现方式来实现复杂真实的电影级画质要比直接上贴图麻烦的多,但随着次时代游戏全面DX11特效的加入,Tessellation的应用今后无疑会更加智能,也会更多、更重,而PhysX物理或者类似的技术成为主流也只是时间问题。
如果说过去的一年DX11游戏依然处于萌芽阶段,那么未来这一年我们将见证DX11的真正爆发。可以毫不夸张的说,2011年属于DX11,因此投资一片支持DX11且高性价比的显卡是十分明智的。这款新发布的GTX 560 Ti作为GTX460的接班人,在DX11性能方面表现优异,功耗散热也控制理想,的确是一款好显卡,而现在横在它和消费者之间的障碍,只有价格。■<