9系游戏神器 影驰GTX970黑将显卡评测
泡泡网显卡频道9月19日 NVIDIA的Kepler核心显卡发布已经两年半,当初GTX680的手法评测就是由我完成,至今还记忆犹新。在显卡产品上,NVIDIA也开始使用类似Tick & Tock的节奏:每隔两代产品进行架构升级。Maxwell正是Kepler的后继者,在架构上使用了全新SMM单元,16组SMM单元分布在四组GPC之中的结构,提升了引擎执行效率、改良了Cache缓存机制,让Maxwell不仅性能全面提升,功耗却大幅下降,并且这是在制造工艺仍为28纳米的前提下实现的,从之前的GTX750Ti/750产品上,就可以看出Maxwell的可怕实力。
完整版的Maxwell自然更是可怕,不过在跟注重性价比的甜点~次旗舰产品线上,用户往往更为挑剔,GTX970就位于这个位置。近几代产品中,NVIDIA对X70级别产品的重视程度也越来越高,这次的Maxwell GTX970定价就仅有2499元,相对于过去几代X70产品来说已经非常厚道。而这次评测中为大家带来的就是NVIDIA GeForce显卡优异品牌:影驰的非公版GTX 970黑将版显卡。
NVIDIA Kepler GPU架构于2012年初问世,它前所未有的能效比催生出全球最快的游戏PC、工作站以及超级计算机和云游戏服务器。甚至智能手机、平板电脑乃至汽车的信息娱乐系统都得益于TegraK1系统(SoC)获得了空前的视觉计算功能。
而NVIDIA的第一代“Maxwell”架构在上一代的基础上又获得了全新的提升。事实上“GM107”在研发期间的定位是专为笔记本和小型(SFF)PC等功率受限的使用场合而设计。但事实上它的性能已经达到了桌面低端甚至中端的水准,NVIDIA在最后时刻将其打造成GTX650Ti的接班人,强行推入主流市场。
在1080p分辨率下,GeForceGTX750Ti的性能通常可与四年前的旗舰GPU——GeForceGTX480比肩,然而热设计功耗仅为区区60W,是后者的四分之一!那Maxwell高端产品又当如何?是什么革新让它有如此惊人的表现呢?
Maxwell在流式多处理器(SM)方面采用了一种全新设计,可大幅提高每瓦特性能和每单位面积的性能。虽然Kepler SMX设计在这一代产品中已经相当高效,但是随着它的发展,NVIDIA的GPU架构师再次在能效比利用方面突破了难关。
MaxwellSM设计实现证明了这一点,控制逻辑分区、负荷均衡、时钟门控粒度、编译器调度、每时钟周期发出指令条数等方面的改进以及其它诸多增强之处让Maxwell SM(亦称“SMM”)能够在效率上远超Kepler SMX。全新的Maxwell SM架构能够在GM107中把SM的数量增至五个(GK107中仅有两个),而芯片面积仅增加25%。下表提供了高级对比,对比双方分别为Maxwell以及上一代GK107 Kepler GPU:
具体来说,首先Maxwell采用了容量大增的二级高速缓存设计,Maxwell核心架构中二级高速缓存容量为2048KB,而GK107中的容量仅为256KB。由于片上高速缓存容量更大,因此需要向显卡DRAM发送的请求更少,从而降低了整体显卡功耗、提升了性能。
除了上述变化以外,NVIDIA的工程师还雄心勃勃地在晶体管水平上调整了Maxwell GPU中每个单元的实现方式,以便最大限度提高节能性。所有这些努力的最终结果是,采用相同的28纳米制造工艺,Maxwell能够提供相当于Kepler两倍的每瓦特性能!
虽然说起来简单,但事实上这些就意味着Maxwell内部所有单元和横梁结构均得到了重新设计,数据流得到了优化,功率管理实现了大幅改变。
虽然从图形特性的视角来看,第一代Maxwell GPU可提供与Kepler GPU相同的API功能,但从深层来上,Maxwell还在单个GPC(图形处理簇)内实现了多个SM单元,每个SM包含一个多形体引擎(Polymorph Engine)和纹理单元,而每个GPC包含一个光栅引擎(Raster Engine)。ROP依然与二级高速缓存片(L2 Cache Slice)以及显存控制器联系在一起。
GM 204 GPU包含4个GPC、16个Maxwell流式多处理器(SMM)以及4个64位显存控制器(共256位)。这就是这一芯片的完整实现形式,规格大约是GeForce GTX 750Ti中的GM107的3倍。
上一代Kepler的方法是划分为非2幂(non-power-of-two)数量的CUDA核心,其中一些是共享核心,这种方法需要的SM调度器数量较少,但复杂程度较高,在各种各样的游戏引擎环境中表现并不理想。
上一代Kepler的方法是划分为非2幂(non-power-of-two)数量的CUDA核心,其中一些是共享核心,这种方法需要的SM调度器数量较少,但复杂程度较高,在各种各样的游戏引擎环境中表现并不理想。
而现在每个SM分为四个独立的处理块,每个处理块具备自己的指令缓冲区、调度器以及32个CUDA核心。新的划分方法简化了设计与调度逻辑、节省了晶体管与功耗、降低了计算延迟。
总体而言,在这一全新设计上,每个“SM”的尺寸得到大幅缩减,而性能却能够达到一个KeplerSM的90%。更小的晶体管消耗让NVIDIA能够在每颗GPU中实现更多数量的SM。通过对比Kepler和Maxwell SM总数的相关指标可发现,后者的峰值纹理性能比前者高25%,CUDA核心数量多1.7倍,着色器性能大约高2.3倍。
对GM204来说,要在显存位宽与上一代Kepler架构核心相同的情况下实现性能大幅提升的目标,增强显存系统也同样重要。内部显存系统带宽实现了提升,效率也得到了改善。此外,2MB大容量二级高速缓存配置(比之前的任何GPU设计都大)十分有效地降低了显存带宽需求,确保了DRAM带宽不成为瓶颈。
其他关于Maxwell架构的基本信息,例如通过Giga Thread引擎的主PCI Express接口数据流、Polymorph与Raster单元的基本操作等等过于晦涩的知识这里就不再赘述了。
影驰GTX970黑将版显卡采用经典银灰色外壳 黑色扇叶的外观,造型上相对上代产品有多处调整改进,整体上看起来更时尚、充满科技感。与各种各样颜色的主板、机箱搭配也不会有问题。
影驰GTX970黑将默认频率为1127MHz,最高加速频率为1266MHz,拥有4GB 7012MHz GDDR5显存。
影驰为GTX970黑将配备了背板,起保护、加固和辅助背面元件散热的功用。
显示接口包括DVI、HDMI和DP。
影驰GTX970黑将采用银河双子星散热系统,这颗风扇也采用了特殊的扇叶,能够有效提高风量,增强散热效率。
7相供电设计,采用全固电容和封闭式电感,保证了非常好的电气性能。外接供电则采用超过公版规格的6 8Pin,为显卡超频提供了有力支持。
来自NVIDIA的GM204芯片
三星GDDR5显存,共4GB容量
显示输出接口
PCB正面俯视图
巨大的散热器本体拆解
核心部分为纯铜底座
配备了4跟热管,采用镀镍处理
由于显卡超高的能效比,PCB不需要做的很大,因此长度也控制的非常好,甚至还没超过一块标准ATX主板的宽度。
测试平台配置说明:
测试平台使用主板:技嘉 G1.SNIPER Z97
测试平台使用电源:安钛克 HCP1000 白金版
测试平台使用SSD:OCZ VERTEX 460 240GB
2013年2月1日,Futuremark在其官网上正式宣布了新3Dmark的发布时间,它于UTC时间2月4日18:00,北京时间2月5日凌晨2:00正式发布。新的3Dmark支援桌面与移动平台的跨平台测试,支援windows、Android、iOS与Windows RT系统平台的测试。新3DMark分为入门级测试Ice Strom、主流级测试Cloud Gate以及高性能测试Fire Strike三大场景。取消了过去按照E、P、X的等级划分方式。
时至今日依然没有任何一个测试软件或者游戏能够取代3DMark在游戏玩家心目中的地位,因为3DMark的魅力就在于它所带来的不仅仅是惊艳的画面,更重要的是向广大玩家提供了一种权威、系统、公正的衡量显卡性能的方式。
Unigine Heaven(天堂)显卡测试程序4.0版For Linux(2013年2月18日发布)
对于现代显卡测试而言,除了3DMark之外必不可少的项目就是来自俄罗斯的Unigine Heaven(天堂),尤以其高负载、高压榨而知名。得益于Unigine引擎的出色性能,Heaven在曲面细分上的表现明显要优于3DMark。
《孤岛危机3》是前作的精雕细琢的延续。剧情模式具有所需的灵魂和情感,让游戏中的杀戮变得有意义,这一点突破了前作。虽然多人游戏模式不足以留住大量玩家,但毕竟具有自己的特色,为大家提供了额外的选择。这应该不算是提前到来的次世代游戏,但它的操控非常完美,节奏紧凑,战术灵活,剧情故事真实合理,是一款合格的《孤岛危机》系列续作。
《古墓丽影9》将讲述劳拉的首次冒险之旅,主角劳拉?克劳馥的年龄被设定在21岁,那时的她还只是一名刚出茅庐的新人,经验欠缺。随着游戏剧情的发展,玩家将与劳拉共同成长,获得新的武器和道具并习得新技能。在冒险的小岛上,玩家可以在营地对道具进行组合,有些特定区域就需要特定道具和技能才能通过。岛上的各个营地之间可以快捷传送,玩家无需长途跋涉。而除了劳拉外还将有其他角色出现在岛上。
《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作,也是DX11游戏的新成员。该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。
《超级房车赛:赛车运动》是Codemasters最接近PS2经典游戏《职业赛车手》的作品。不同于《超级房车赛2》的街头赛车风格,这款游戏的重点回到了拟真的赛车运动,为了比赛而改造的赛车再次占据了车辆列表,而Codemasters在本作中的赛道数量比前作多了几乎一倍。《超级房车赛:赛车运动》的缺点都很奇怪,比如品质低下的车内视角和有问题的耐力赛,游戏缺少自定义选项,但是总体来说Codemasters在这款游戏中终于又再次引擎全开。
GeForce GTX 970和过去的N卡一样,都还可以进行一定幅度的超频,尽管影驰GTX970黑将默认就已经达到了1127~1266MHz的超高规格,但是在笔者测试中发现,它还有提升空间,能够进一步发掘潜力。最终,影驰GTX 970黑将版显卡在默认电压下成功超到了1250MHz,并可以稳定通过测试,性能自然也是进一步提升。
Maxwell的架构的改良让GTX 970在功耗温度上的表现都必须要用惊艳来形容。面对同为28nm的GTX 780,性能更好的影驰GTX 970黑将在温度上的也大幅领先,待机仅有31度,Furmark拷机没到70度。
而功耗方面,影驰GTX 970黑将的满载功耗更是比GTX780低了50W之多,而两者的系统待机功耗是相近的。可以看出Maxwell架构在功耗上的表现是多么出色。
影驰GTX970黑将是Maxwell到来后最先上市的产品之一,相对于目前的优异型号3999元的GTX980,2499元的GTX 970更为直接的击穿了消费者的价格心理线。拥有超过GTX780的性能,大幅提升的功耗和温度表现,不愧是新一代游戏神器。■<