NVIDIA年度重量级显卡!GTX960首发评测
泡泡网显卡频道1月22日 2014年的Maxwell相信没有让大家失望,如果说GTX750Ti仅仅是小试牛刀,那搭载GM204的GTX980就堪称压轴之作了!之前笔者曾经预言,Maxwell架构全线产品上市后将引发显卡市场的一次大规模洗牌,那么洗牌的主力今天终于来了——NVIDIA GeForce GTX960!
现在大家最为关心的无疑就是GTX960所用的GPU核心了!GTX960使用了Maxwell架构的GM206 GPU,Maxwell在流式多处理器(SM)方面采用了一种全新设计,可大幅提高每瓦特性能和每单位面积的性能。虽然Kepler SMX设计在这一代产品中已经相当高效,但是随着它的发展,NVIDIA的GPU架构师再次在能效比利用方面突破了难关。
Maxwell SM框架示意图
Maxwell SM设计实现证明了这一点,控制逻辑分区、负荷均衡、时钟门控粒度、编译器调度、每时钟周期发出指令条数等方面的改进以及其它诸多增强之处让Maxwell SM(亦称“SMM”)能够在效率上远超Kepler SMX。全新的Maxwell SM架构能够在GM206中把SM的数量增至五个(Kepler中仅有两个),而芯片面积仅增加25%。下表提供了高级对比,对比双方分别为Maxwell以及上一代Kepler GPU:
具体来说,首先Maxwell采用了容量大增的二级高速缓存设计,Maxwell核心架构中二级高速缓存容量为2048KB,而Kpler中的容量仅为256KB。由于片上高速缓存容量更大,因此需要向显卡DRAM发送的请求更少,从而降低了整体显卡功耗、提升了性能。
除了上述变化以外,NVIDIA的工程师还雄心勃勃地在晶体管水平上调整了Maxwell GPU中每个单元的实现方式,以便最大限度提高节能性。所有这些努力的最终结果是,采用相同的28纳米制造工艺,Maxwell能够提供相当于Kepler两倍的每瓦特性能!
虽然说起来简单,但事实上这些就意味着Maxwell内部所有单元和横梁结构均得到了重新设计,数据流得到了优化,功率管理实现了大幅改变。
虽然从图形特性的视角来看,第一代Maxwell GPU可提供与Kepler GPU相同的API功能,但从深层来上,Maxwell还在单个GPC(图形处理簇)内实现了多个SM单元,每个SM包含一个多形体引擎(Polymorph Engine)和纹理单元,而每个GPC包含一个光栅引擎(Raster Engine)。ROP依然与二级高速缓存片(L2 Cache Slice)以及显存控制器联系在一起。
GM206核心框架示意图
GM 206 GPU包含2个GPC、8个Maxwell流式多处理器(SMM)以及2个64位显存控制器(共128位)。这就是这一芯片的完整实现形式,规格大约是GeForce GTX 980中的GM204的一半。
新一代SMM 处理核架构解析
而现在每个SM分为四个独立的处理块,每个处理块具备自己的指令缓冲区、调度器以及32个CUDA核心。新的划分方法简化了设计与调度逻辑、节省了晶体管与功耗、降低了计算延迟。
总体而言,在这一全新设计上,每个“SM”的尺寸得到大幅缩减,而性能却能够达到一个KeplerSM的90%。更小的晶体管消耗让NVIDIA能够在每颗GPU中实现更多数量的SM。通过对比Kepler和Maxwell SM总数的相关指标可发现,后者的峰值纹理性能比前者高25%,CUDA核心数量多1.7倍,着色器性能大约高2.3倍。
SMM架构显存系统的改进
对GM206来说,要在显存位宽与上一代Kepler架构核心相同的情况下实现性能大幅提升的目标,增强显存系统也同样重要。内部显存系统带宽实现了提升,效率也得到了改善。此外,2MB大容量二级高速缓存配置(比之前的任何GPU设计都大)十分有效地降低了显存带宽需求,确保了DRAM带宽不成为瓶颈。
其他关于Maxwell架构的基本信息,例如通过Giga Thread引擎的主PCI Express接口数据流、Polymorph与Raster单元的基本操作等等过于晦涩的知识这里就不再赘述了。
NVIDIA新开发的高效能抗锯齿技术——MFAA,它能够以2xMSAA的性能,提供4xMSAA的画质,从而以较小的性能损失提供更完美的游戏画质。这样当玩家们玩类似《显卡危机3》、《男朋友4》这样的优异大作,由于FPS本身较低不敢开高倍AA时,就可以开启MFAA技术,让速度与画质兼得。
但并不是所有的游戏都像显卡危机一样吃显卡,绝大多数游戏对显卡要求不是很高,比如《穿越火线》、《英雄联盟》一类的游戏中端显卡就能动辄跑100FPS以上,此时显卡性能有些浪费,那有没有通过牺牲一部分FPS来提高画质的方法呢?现在笔者就为大家介绍NVIDIA的另外一项黑科技——Dynamic Super Resolution(DSR),动态超级分辨率
简单来说,DSR技术可以在普通的1080p显示器上显示4K级别的游戏画面,当然NVIDIA即便掌握了火星科技也不可能将1080p显示器变成4K显示器,该技术只是在后台以4K分辨率渲染游戏画面,通过动态缩放的方式显示在1080p显示器上,虽然实际分辨率依然是1080p,但游戏画面却要比原生1080p分辨率渲染出来的好很多。
首先我们来看一张开启DSR前后的游戏画面截图:
可以看出,开启DSR之后的草丛边缘显示效果要好,然后再通过显卡渲染流程为大家分析出现差异的原因:
可以看到,DSR模式在GPU内部是以真4K分辨率进行渲染的,只不过在像素输出阶段将4个像素合成为1个像素,最后才以1080p分辨率输出。4K的分辨率是1080p的4倍,渲染精度自然大幅提高,输出像素的采样率相当于是4倍,最终的画面自然会更加柔和平滑一些。
看到这里的示意图,相信资历较老的玩家会发现DSR技术有些类似于最早期的SSAA(超级采样抗锯齿),就拿前面的示例图来说,原理可以说是完全相同的,但区别是SSAA只针对几何物体的边缘,而DSR则是针对全屏所有像素进行二次采样,毕竟内部就是以4K分辨率进行渲染的。
点击查看大图可以看到开启DSR的明显区别
DSR对游戏有要求吗?
DSR技术的工作模式非常简单,它在系统内部模拟出了4K分辨率的显示器,游戏就会以为电脑拥有一台4K显示器,从而以4K模式渲染出高精度的画面,最后GPU再重新采样并缩放成1080p分辨率输出,因此DSR技术的唯一要求就是游戏本身能够支持4K分辨率。
如何开启DSR技术?
DSR技术支持几乎所有的PC 3D游戏,玩家可以在最新版的343驱动控制面板中开启,或者使用GeForce Experience自动扫描并优化游戏,如果您的显卡较好,那么像暗黑3这样要求不是很高的游戏默认就会开启DSR技术。
DSR除了4K模式,还支持自定义分辨率,如2K模式:
当然,如果显卡性能还不够强的话,DSR技术允许玩家进行自定义设置,将渲染模式从4K降为2K,以2K模式渲染出来的画质缩放成1080p分辨率输出后,画质依然会有明显提升,同时性能损失不至于太大。
在过去的三十年里,即便显示器技术从已经从 CRT 发展到了 LCD 和 LED,但是尚无大公司挑战过这一想法,因此使 GPU 与显示器刷新率同步依然是当今整个行业的标准做法。但问题是,显卡并不以固定的速度渲染。事实上,即便在单一游戏的单个场景中,显卡渲染的帧速率也会大幅变化,这种变化根据 GPU 的瞬时负荷而定。因此在刷新率固定的情况下,要如何将 GPU 图像搬到屏幕上呢? 第一个办法就是完全忽略显示器的刷新率,对中间周期扫描到显示器的图像进行更新。这种办法我们叫做「垂直同步关闭模式」,这也是大多数游戏玩家所使用的默认方式。缺点是,当单一刷新周期显示两幅图像时,在两幅图像交替时会出现非常明显“撕裂线”,这种情况通常被称作屏幕撕裂。
解决屏幕撕裂问题的老牌解决方案是打开垂直同步,强迫 GPU 延迟屏幕更新,直到显示器开始进入一个新的刷新周期为止。只要 GPU 帧速率低于显示器刷新率,这个办法就会导致卡顿现象。它还会增大延迟,导致输入延迟。输入延迟就是从按下按钮到屏幕上出现结果这段时间的延迟。
更糟糕的是,许多玩家在碰到持续的垂直同步卡顿现象时会导致眼睛疲劳,还有人会产生头痛和偏头痛症状。这些情况推动我们开发了自适应垂直同步技术,该技术是一种有效而备受赞誉的解决方案。尽管开发了这一技术,垂直同步的输入延迟问题现在依然存在,这是许多游戏发烧友所不能接受的,也是电子竞技职业玩家绝对不能容忍的。这些职业玩家会定制自己的 GPU、显示器、键盘以及鼠标以最大限度减少重新开始时的重大延迟问题。
传统的垂直同步就是让显卡输出的帧等液晶刷新。假设显卡渲染的帧比显示器更快,那就让渲染出来的这一帧放在显存里面等待下一个液晶刷新,这个周期里面即使游戏中的模型已经发生位移或者改变,最后显示器输出的依然是之前的图像。假设显示器刷新比显卡更快,那显示器会输出两帧同样的画面。
往往这两种情况交错进行,我们看到的画面就会抖动,看到的游戏世界就会和真实情况有着一定程度的非正常延时。这就是为什么即使我们的显卡帧数跑到100FPS以上,我们依然感觉不是完全流畅的原因。
G-SYNC的出现让这种情况彻底改观,本质上说G-SYNC可以从根源上杜绝撕裂和卡顿,因为G-SYNC是在显示器中加入一个芯片,让显示器听从显卡的命令确定实时的刷新频率。简而言之就是显卡渲染出一帧,显示器就刷新一帧。这样做的好处是无论场景渲染变化如何大,显卡帧数如何波动,只要保持在一定的水平之上,我们看到的都是连贯平滑的图像。
很明显除了观赏体验上发生了巨大变化以外,当 G-SYNC 与高速的 GeForce GTX GPU 和低延迟输入设备搭配使用时,线上游戏的玩家还将获得重大的竞争优势。无论是业余爱好者还是专业电子竞技选手,NVIDIA G-SYNC对他们来说无疑是一次必不可少的升级。Unreal Engine 的架构师就称 G-SYNC技术为“自人类从标清走向高清以来游戏显示器领域最重大的飞跃”。
DSR和MFAA算是重头戏,但除此之外NVIDIA公布的新技术还有不少,有些更是之前不为人知!
和游戏引擎开发团队合作,帮助他们在开发出功能更丰富的产品一直是NVIDIA的重要战略之一,本次NV公布了这一阶段的一些成果。
PhysX FleX是物理加速的另一项技术成果,它能让液体和固体之间的物理碰撞更加接近真实,事实上是将液体和固体模型均粒子化以后复合运算达到真实的效果。
事实上物理加速的应用非常广泛,在不同平台不同设备上都在加速普及,将来无论是电脑PC还是游戏机或者是手机平板,都会越来越多的采用NVIDIA提供的物理加速解决方案,物理加速是虚拟现实技术不可或缺的重要构成环节,全面普及是大势所趋。
memory compression(显存压缩)是一种可以大幅节省显存容量和显存带宽的技术,通过算法优化,很多重复的材质和信息可以被压缩存储,这样显存的利用率得到大大提升。
用这个赛车游戏举例,其实大多数像素的信息都是重复和可被选压缩的
不同的游戏可压缩的程度有所不同,但从NVIDIA官方披露的数据来看,大家再也不用担心显存会不够用了!
NVIDIA一向非常重视软件技术的研发,长期以来都有约300位技术工程师忙碌在研发一线,不仅科研成果斐然,实用技术也是遍地开花。
Farcry系列在游戏玩家中的口碑很不错,其中一个重要原因就是它卓越的游戏代入感。
在即将发布的Farcry4中,采用了很多最新的特效,可以让游戏画面更加贴近现实。
HBAO(环境光遮蔽)可以看做是SSAO的升级版,区别在于首先HBAO规定了一个半径为R的空间范围,对于范围外的空间不做渲染;此外对于一些低精度模型,遮蔽会导致错误的产生,HBAO利用半球的角度偏置参数限制来修正这些错误;此外在采样点数量上HBAO也进行了控制,并利用函数解决了遮蔽的衰减问题。
PCSS是shadow mapping(实时阴影技术)
的改进算法,这种软阴影效果可以让实时阴影更加柔和逼真。
TXAA是另一种高效的抗锯齿技术,该模式专为直接集成到游戏引擎中而设计。与CG电影中所采用的技术类似,TXAA集MSAA的强大功能于复杂的解析滤镜于一身,可呈现出更加平滑的图像效果,远远超越了所有同类技术。此外,TXAA还能够对帧之间的整个场景进行抖动采样,以减少闪烁情形,闪烁情形在技术上又称作时间性锯齿。
目前,TXAA有两种模式:TXAA 2X和TXAA 4X。TXAA 2X可提供堪比8X MSAA的视觉保真度,然而所需性能却与2XMSAA相类似;TXAA 4X的图像保真度胜过8XMSAA,所需性能仅仅与4X MSAA相当。
游戏中,遮光物体被光源照射时,在其周围呈现的光的放射性泄露,称其为GOD RAYS(体积光)。例如太阳照到树上,会从树叶的缝隙中透过形成光柱。之所以称之为体积光,是因为这种特效下的光照相比以往游戏中的光照给人视觉上以空间的感觉。体积光让游戏玩家更真实的感觉。
NVIDIA hairworks可以让游戏中的毛发渲染达到极致,达到真正的互动的游戏体验。这一技术可以运用在游戏中的各个运动模型上,使头发/毛皮和其他模型互动,拥有前所未有的真实感。
即将发布的多款重磅游戏大作均将或多或少的采用NVIDIA提供的技术支持,获得更逼真细腻的游戏画面,但鉴于保密协议无法透露更多,所以这里我们只是借助《孤岛惊魂4》说明问题。
相比上一代的Kepler架构,Maxwell架构拥有更小的面积,更低的发热量,带来了更高的每瓦特效能。
GTX960依然延续了上一代NVIDIA公版卡的大部分特征,银色搭配黑色,让整体看起来中规中矩。因为NVIDIA也知道超公版必然是各大厂商的重头戏,所以只是开放了公版标准,并没有做出来真正的NVIDIA公版实物,我们这次测试就用的是来自七彩虹的GTX960 CH-2GD5。
GTX960采用GM206核心,基于28nm工艺制程,内建1024个流处理器,采用PCI-E 3.0 x16总线接口,配备2GB/128Bit GDDR5显存,支持DirectX 12、Shader Model 5.0、OpenGL 4.4以及NVIDIA GPU Boost 2.0等技术,同时显卡还支持2Way SLI以及多屏输出等功能。最值得一提的是GTX960非常省电,TDP只有120W,比GTX760还要低50W!
金属屏蔽杜绝干扰
GTX960的输出接口非常完善:采用完整版本的三DP、HDMI、DVI 2.0的输出设计,和高端的GTX980一样。最大支持5120*3200分辨率运行在60Hz,比Kepler最大支持60Hz 4K分辨率更上一层楼。
很明显,各大厂商对于NVIDIA GTX960显卡准备充分,与以往首发产品清一色公版卡不同,此次GTX960发布我们就提前收到了很多非公版显卡。
影驰GTX960骨灰黑将:
七彩虹iGame GTX960烈焰战神X:
映众GTX960冰龙超级版:
索泰GTX960至尊OC:
耕升GTX960关羽版:
耕升GTX960关羽版Plus:
影驰GTX960 Gamer:
目前也有部分显示器是(1920x1200),游戏在这种分辨率下的性能表现与1920x1080差不多,FPS稍低一点点,使用这种显示器的朋友依然可以参考我们的测试成绩。
● 测试平台电源:Antec HCP1200
安钛克Antec HCP1200电源在世界超频大赛中非常常见,通过了80PLUS认证,转换效率高达92.4%,支持4路12V输出,最高电流72A,支持四卡SLI/交火。平均无故障运行时间为10万小时。配备一颗8cm静音风扇,运行噪音极低。
● 测试平台SSD:OCZ Vetrx3 240GB
OCZ的Vertex系列属于它的高端固态硬盘,专门为高端玩家和存储发烧友设计。随着Sandforce控制器大红大紫,OCZ也将Vertex系列升级到了全新的SF1200方案。如今SATA3.0 6Gbps接口大行其道,OCZ推出了基于SF2200系列主控芯片的Vertex 3固态硬盘,涵盖60-480GB容量范围。
● 测试平台显卡器:三星U28D590D
三星4K UHD显示器拥有1ms极速响应时间,能清晰流畅地呈现高速运动场景,4K UHD分辨率(3840*2160)是全高清分辨率(1920*1080)的四倍,能够使800万像素的图像呈现出更鲜活自然的卓越效果,适合在极限模式下压榨显卡的潜力。
而这次Futuremark为移动平台量身定做了专有测试方案,新一代3DMark三个场景的画面精细程度以及对配置的要求可谓天差地别。
Fire Strike、Cloud Gate、Ice Storm三大场景,他们分别对应当前最热门的三大类型的电脑——台式电脑、笔记本电脑和平板电脑。
3DMARK最严苛的Fire Strike Extreme模式中,GTX960达到了3273分,介于GTX680和GTX770之间,如果和A卡相比那就是在R9 280和R9 285之间!
3DMark11的测试重点是实时利用DX11 API更新和渲染复杂的游戏世界,通过六个不同测试环节得到一个综合评分,藉此评判一套PC系统的基准性能水平。
3DMark 11的特色与亮点:
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面细分、计算着色器、多线程。
2、原生支持64bit,保留32bit:原生64位编译程序,独立的32位、64位可执行文件,并支持兼容模式。
3、新测试场景:总计六个测试场景,包括四个图形测试(其实是两个场景)、一个物理测试、一个综合测试,全面衡量GPU、CPU性能。
4、抛弃PhysX,使用Bullet物理引擎:抛弃封闭的NVIDIA PhysX而改用开源的Bullet专业物理库,支持碰撞检测、刚体、软体,根据ZLib授权协议而免费使用。
3Dmark11大量特效堆砌出来的以假乱真的画面让很多显卡不能完全流畅运行它。本次测试中所有显卡一视同仁开启Extreme模式,高端级和旗舰级性能差距依旧非常明显。这个测试项目是N卡的传统优势所在,GTX960在这里居然小超了R9 285,算是越级挑战了!
对于现代显卡测试而言,除了3DMark之外必不可少的项目就是来自俄罗斯的Unigine Heaven(天堂),尤以其高负载、高压榨而知名。现在,新一代3DMark发布之后,Unigine也奉上了全新的显卡测试程序“Valley”(山谷)。
Valley正是Heaven的开发团队一手打造的,可以在最大程度上榨干GPU显卡资源。这次场景来到了一个优美空灵的山谷,群山环绕,郁郁葱葱,白雪皑皑,旭日初升,而且拥有极致的细节,每一片花瓣、每一株小草都清晰可见。
主要技术特点包括:
— 场景面积达6400万平方米,超高细节
— 整个场景可以完全自由浏览,并支持鸟瞰、漫步模式
— 先进视觉技术:动态天空、体积云、阳光散射、景深、环境光遮蔽
— 所有植被、岩石均为实时渲染,而非贴图
— 用户可控的动态天气
— 支持立体3D、多屏幕
— 极限硬件稳定性测试
— 基准测试预设
— 监视每一帧画面对应的GPU温度和频率
— 多平台支持:Windows、Linux、Mac OS X
— 支持命令行自动执行
— CSV格式可定制报告
Unigine Valley分为基础版、高级版、专业版三个版本,其中基础版免费,支持测试预设、自定义设置、GPU监视、交互模式,不支持循环测试(也就是拷机模式)、命令行、CSV报告,对于普通用户和一般评测足够用了。
Unigine Valley的场景面积达6400万平方米,超高细节,对显卡渲染提出了很大的考验,在未来的游戏中,类似的情况将会越来越多。GTX960在极端HD模式下测得34.8FPS,比较流畅!
《孤岛危机3》支持大量的高端图形选项以及高分辨率材质。在游戏中,PC玩家将能看到一系列的选项,包括了游戏效果、物品细节、粒子系统、后置处理、着色器、阴影、水体、各向异性过滤、材质分辨率、动态模糊以及自然光。技术主管Marco Corbetta表示之所以《孤岛危机2》并不包含这么多的选项,是因为开发主机板的开发组实在是搞的太慢了。
● 实时体积烟云阴影(Real-Time Volumetric Cloud Shadows)
实时体积烟云阴影(Real-Time Volumetric Cloud Shadows)是把容积云,烟雾和粒子阴影效果结合起来的一种技术。和之前的类似技术相比,实时体积烟云阴影技术允许动态生成的烟雾拥有体积并且对光线造成影响,和其他物体的纹理渲染互动变化。
● 像素精度置换贴图(Pixel Accurate Displacement Mapping)
像素精度置换贴图(Pixel Accurate Displacement Mapping)可以让CryEngine 3引擎无需借助DX11的细分曲面技术即可一次渲染出大量没有明显棱角的多边形。此前crytek曾透露过正在考虑在主机上实现类似PC上需要DX11硬件才能实现的细分曲面效果,看来此言非虚,新型的位移贴图技术来模拟细分曲面的效果。虽然实现原理完全不同,但效果看起来毫不逊色。
● 实时区域光照(Real-Time Area Lights)
实时区域光照(Real-Time Area Lights)从单纯的模拟点光源照射及投影进化到区域光照的实现,以及可变半阴影(即投影随着距离的拉长出现模糊效果),更准确的模拟真实环境的光照特性。
● 布料植被综合模拟(Integrated Cloth & Vegetation Simulation)
布料植被综合模拟(Integrated Cloth & Vegetation Simulation)其实在孤岛危机1代中植被已经有了非常不错的物理效果,会因为人物经过而摆动,但是这次crytek更加强化了这方面的效果,还有就是加入了对布料材质的物理模拟,这方面之前只有nvidia的physx做得比较好。
● 动态体积水反射(Dynamic Water Volume Caustics)
动态体积水反射(Dynamic Water Volume Caustics)孤岛危机1和2基本上在水的表现上集中在海水,很少有湖泊和类似大面积积水潭的场景,而这次crytek实现了超远视野的水面动态反射。动态体积水反射可以说是孤岛危机2中的本地实时反射的一个延伸,是结合静态环境采样和动态效果的新的水面反射技术。
作为新一代DX11游戏的画质标杆,孤岛危机3相比上一代对显卡提出了更高的要求,而在这款代表着最尖端画质的游戏显卡优化做的非常出色,我们可以看到GTX960的成绩接近GTX680。
这些年我们看到了不少形态各异的劳拉,从丰乳肥臀的动作游戏主角到喜欢探索亚特兰蒂斯文明的睿智贵族。不过我们从未见过这样的劳拉。Crystal Dynamics的《古墓丽影9》让我们看到了一个参加初次探险的年轻劳拉,她遭遇海难被困在刀枪林立的小岛上,必须将自己的智谋和求生欲望提升到极限。
剧情介绍:故事从年少时期的劳拉开始,劳拉所乘坐的“坚忍号”仿佛是被宿命所呼唤,在日本海的魔鬼海遭遇到了台风,不幸搁浅。劳拉也被迫到岛上开始自己的求生经历。
“高”特效的画质已经非常不错了。
古墓丽影9一开始就对A卡的支持非常到位,而N卡驱动后来也进行了不断的更新,游戏性能得到大幅提升。
寒霜2引擎最大的特点便是支持大规模的破坏效果。由于考虑到游戏的画面表现以及开发成本,DICE放弃了以只支持DX9的WINDOWS XP操作系统。另外由于该引擎基于DX11研发,向下兼容DX10,因而游戏只能运行于WINDOWS VISTA以上的的操作系统。
在《战地3》中,“寒霜引擎2”内置的破坏系统已经被提升至3.0版本,对于本作中的一些高层建筑来说,新版的破坏系统将发挥出电影《2012》那般的灾难效果,突如其来的建筑倒塌将震撼每一位玩家的眼球。
《战地3》采用了ANT引擎制作人物的动作效果。在此之前,ANT引擎已在EA Sports旗下的《FIFA》等游戏中得到应用,不过在FPS游戏中使用尚属首次。相较于Havok等物理引擎,用ANT引擎可以花费较少的精力制作出逼真的效果。举例来说,战士在下蹲时会先低头俯身、放低枪口,而不是像以前的游戏那样头、身、枪如木偶般同时发生位移。此外,ANT引擎也可以让电脑AI的行动更加合理。但这款大作目前并不能良好的兼容120Hz3D以及红蓝3D模式。
寒霜2引擎大作战地三,是为数不多的画面可以挑战Crysis的游戏大作,而对核心和显存的要求已经超越了Crysis!越是要求变态的游戏,旗舰级显卡就越喜欢,这款游戏N卡整体占优,GTX960也是发挥不错。
《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作,也是DX11游戏的新成员。
该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。
《地铁2033》虽然支持PhysX,但对CPU软件加速支持的也很好,因此使用A卡玩游戏时并不会因PhysX效果而拖累性能。该游戏由于加入了太多的尖端技术导致要求非常BT,以至于我们都不敢开启抗锯齿进行测试,只是将游戏内置的效果调至最高。游戏自带Benchmark,这段画战斗场景并不是很宏大,但已经让高端显卡不堪重负了。
如果说是CRYSIS发动了DX10时代的显卡危机,那地铁2033无疑是DX11时代的显卡杀手!地铁2033几乎支持当时可以采用的所有新技术,在画面雕琢上大肆铺张,全然不顾显卡们的感受,和CRYSIS如出一辙。然而CRYSIS靠着特效的堆积和不错的优化,其惊艳绝伦的画面和DX9C游戏拉开了距离,终究赚足了眼球;而地铁则没有这么好运了,画面固然不差,BUG却是很多,招来了大量的非议。
地铁2033,一款销量游戏性被人遗忘但却家喻户晓的游戏,DX11游戏中的奇葩。这款游戏是A卡优势项目,但GTX960依然表现出不俗的实力,最高画质1080P分辨率下还是可以较为流畅运行,只是到了2K分辨率就有些力不从心了。
《Aliens vs. Predator》同时登陆PC、X360和PS3,其中PC版因为支持DX11里的细分曲面(Tessellation)、高清环境光遮蔽(HDAO)、计算着色器后期处理、真实阴影等技术而备受关注,是AMD大力推行的游戏之一,但是这样的主题难免让本作有很多不和谐的地方,暴力血腥场面必然不会少!发行商世嘉在2009年11月就曾明志,表示不会为了通过审查而放弃电子娱乐产品发行商的责任,因为游戏要维持“异形大战铁血战士”这一中心主题,无论画面、玩法还是故事线都不能偏离。
AVP原始版本并不支持AA,但升级至1.1版本之后,MSAA选项出现在了DX11增强特效当中,当然还支持Tessellation、HDAO、DirectCompute等招牌。该游戏要求不算太高,所以笔者直接将特效调至最高进行测试。
游戏带Benchmark,其中测试画面颇代表意义,很好的体现了Tessellation异形身体以及HDAO等高级特效,希望这些特效能让系统发挥所有潜力。
AVP测试环节中N卡相对来说表现一般,A卡整体占据了相对的优势,这主要是R9 290X 512bit大位宽和核心强劲的像素渲染速度的功劳!
《怪物猎人Online》,官方简称为MHO,是一款由CAPCOM授权,腾讯游戏和CAPCOM联合开发,腾讯游戏发行的网络游戏,以动作和角色扮演玩法为主体。《怪物猎人Online》是CAPCOM旗下《怪物猎人》的网游版,而内容则基于早前PC/XB360平台上《怪物猎人:边境Online》。
腾讯游戏在购得CryEngine3后对其进行了再开发,这让《怪物猎人Online》具有极高水准的画质。游戏暂时只在中国发行,并为PC独占。在《怪物猎人OL》的世界中,一方面玩家能够欣赏到最高清的游戏场景,感受栩栩如生的狩猎世界;另一方面,还能享受到由NVIDIA顶尖技术带来的极致细节刻画和狩猎动态效果,获得最身临其境的狩猎体验。
为了展现游戏中各种优异的光影特效和动作效果,带来最爽快的狩猎感受,NVIDIA在《怪物猎人OL》主题硬件测试程序中为玩家带来了包括:Depth of Field: Bokeh(景深技术:散焦)、Tessellation(曲面细分)、NVIDIA PhysX Clothing(NVIDIA PhysX衣料技术)、NVIDIA Hairworks(NVIDIA毛发技术)、NVIDIA HBAO+(NVIDIA新版环境光遮蔽。
下面我们看看最新的GTX960在这款《怪物猎人OL》主题硬件测试程序中的表现如何。
我们将▲《怪物猎人OL》硬件测试程序的画面特效全部调至最高,测试1440P的成绩。
▲《怪物猎人OL》硬件测试程序截图
▲《怪物猎人OL》硬件测试程序截图
▲《怪物猎人OL》硬件测试程序截图
Physical Based Shading(基于物理的渲染)、Realistic Vegetation Rendering(真实植被渲染)、Realistic Water System(真实水系)、Real-time Dynamic Water Caustics(实时动态水波焦散)、Parallax Occlusion Mapping(视差贴图)等一系列顶尖技术,并由此构建起一个壮阔而又真实的世界。
▲《怪物猎人OL》硬件测试程序截图
▲《怪物猎人OL》硬件测试程序截图
▲《怪物猎人OL》Benchmark ,1440P下GTX960可以跑20.1FPS
▲《怪物猎人OL》Benchmark ,1080P下GTX960可以跑34.7FPS
正是因为NVIDIA的大力技术支持和CRYENGINE强劲的图形表现,才使得《怪物猎人OL》中整个猎人世界中的画面细节达到了一个前所未有的高度。
和其他类型的高清影片以其远远超出标准分辨率DVD的画面精度为人们带来了耳目一新的视觉体验。 为了在播放高清影片时让用户享受到较好的高清影片观赏体验,NVIDIA研发并推出了PureVideo HD技术。
PureVideo HD 技术是 NVIDIA GPU 上专用视频处理内核与 NVIDIA 驱动程序中软件的组合。NVIDIA GeForce 8系和9系拥有全新视频处理架构,在蓝光视频解码(H.264,VC-1, MPEG-2)工作中,解码模块能将CPU从繁重的计算任务中彻底释放,从而实现了蓝光“画中画”、互动游戏和菜单等功能。
有了PureVideo HD技术,视频的硬解码对于目前的显卡来说已经易如反掌,就算是超高清编码在高端显卡面前也不是什么大问题,但如果一边玩游戏一边编码那又会发生什么呢?
虎牙直播是YY旗下直播网站,提供丰富的电竞游戏直播内容,玩家也可以自行录制游戏画面并实时上传到虎牙的直播平台,无论性能还是互动玩法,都是行业领先。虎牙直播助手拥有热门游戏直播,高清游戏直播平台,电竞赛事直播,单机游戏直播,lol直播,dnf直播,吃货直播,娱乐直播厅,美女直播厅,电视台节目等等功能。
进入虎牙直播以后界面
? 使用GTX 960可在虎牙直播中启用硬件加速。以往,这种录制过程只能依赖CPU计算,会大大消耗硬件资源,导致CPU占用率高居不下,画面帧数也会降低很多,导致直播不顺甚至卡顿。现在,nvidia shadowplay核心功能“视频硬编码”技术嵌入到了最新的YY游戏直播客户端(虎牙直播助手),为NVIDIA游戏玩家带来了电竞游戏直播独有的非常好的体验。
Shadow Play介绍:
Shadow Play是GFE中的一个简单易用的游戏录制模块,可充分利用 GeForce GTX 600 和 700 系列 GPU 中内置的 H.264 编码器达到高效率录制游戏录像的功能。通过利用这一硬件编码器,ShadowPlay 对游戏帧速率的影响大大低于传统的录制应用程序,传统应用程序会给 CPU 造成巨大压力。由于帧速率更高,玩家可以享受到更加流畅的游戏体验,而通过以 H.264 格式进行编码,ShadowPlay 避免了其它应用程序中占用数 GB 空间的大文件问题。这样便节省了空间,同时减少了卡顿现象。
虎牙直播助手和ShadowPlay一样,在游戏录制时可以通过硬件加速,以最大限度地解放CPU,在游戏直播过程中使用960硬件视频编码技术,可以降低CPU占用率20%-30%,提升游戏帧数20%-30%,人人都能做主播,降低游戏主播的CPU门槛,i3用户也能实现主播梦。未来H.265合作将为Maxwell 2.0架构GPU用户在优先网络带宽下带来更好的画质。
通过测试和与其他N卡的对比我们发现GTX960性能方面足以应付市售主流大型3D游戏,下面进入功耗噪音温度测试环节。
GTX960公版 Furmark
2D空闲状态,GTX960整机功耗测得74W,Furmark显卡满载状态整机功耗229W,和上一代的GTX760相比不仅性能更强,而且功耗更低,能效比大幅提升!
公版GTX960温度测试
公版GTX960噪音测试
环境温度大约20摄氏度,此时公版GTX960空闲时GPU核心温度为56摄氏度,用Furmark满载十几分钟以后,测得最高温度为84摄氏度。公版单风扇显然可以解决GTX960的散热问题,但离优秀还差得很远!在其他厂商非公版强大的散热器面前,GTX960会有比GTX970更杰出的表现,毕竟功耗降低了不少。
环境噪音40分贝左右,相距15cm,测得公版GTX960的待机噪音为46分贝,满载以后最高为51分贝。只能说马马虎虎及格,和现在市面上主流的超公版散热器不可同日而语。
超频不仅可以获得免费性能,也是检测显卡稳定性的一项重要手段,所以重点产品的测试超频环节是必不可少的。GTX960默认性能不错,超频潜力又怎么样呢?我们下面通过实际测试验证一下即可见分晓。
● GTX960显卡超频性能测试
GTX960超频非常简单,直接在NV Inspector中拉高核心显存频率即可实现性能的提升。默认GTX960核心频率为1126MHz,3Dmark Fire Stick得分6486,超频至1326MHz以后测得7133,提升幅度达到了10%!而用GPU-Z测得GTX960实际BOOST到的最高频率超过了1.5GHz!
GTX960默认3Dmark Fire Stick Extreme得分是3273,超频后达到3643,性能提升达到11.3%,Maxwell架构的强劲超频能力在GTX960上再一次得到了有力的验证,公版风冷散热就能轻松达到这个成绩,GTX960带领显卡首次迈进1.5GHz时代。
洋洋洒洒几十页,除了枯燥的技术文档就是乏味的数据测试,相信能看到这里还没有愤然关掉网页的都是对显卡有浓厚兴趣的朋友了。如果继续这样一本正经下去连笔者自己也都觉得太没劲了,下面说些笔者的感受。
架构总结:
毫不夸张的说,在挖掘架构潜力的路上,Maxwell 取得了前所未有的辉煌成就。至少在笔者从业的多年来都没有看到过仅仅通过架构更新,不提高工艺就能获得如此巨大的能效比飞跃的例子。从它身上我们不难看出工程师在背后付出的卓绝努力,每瓦特性能提升无疑是后PC时代显卡科研的大方向。其实只要功耗发热可以控制,效率得到提高,要让性能达到更高的水平就是水到渠成的事,单位效率提升之后,在一定程度上简单堆叠晶体管扩大规模对于NVIDIA或者AMD这样优异的芯片厂商来说绝非难事。
Maxwell SM设计实现证明了这一点,控制逻辑分区、负荷均衡、时钟门控粒度、编译器调度、每时钟周期发出指令条数等方面的改进以及其它诸多增强之处让Maxwell SM(亦称“SMM”)能够在效率上远超Kepler SMX。这也是为什么Maxwell SM架构能够把SM的数量增至五个而芯片面积仅增加25%的原因(GK107中仅有两个)。
市场分析:
虽然测试成绩非常不错,功耗控制再创新高,但其实对于笔者来说GTX960并不是一款“很特别”的显卡,因为GM206甚至更高端的GM204在技术上来说仅仅只是GM107的衍生品而已,在GTX750Ti发布的时候,这些辉煌都已经可以预见了。但所有这些都不会妨碍GTX960成为无数游戏玩家翘首以待,众多厂商为之疯狂的2015年上半年中端显卡市场上最耀眼的明星产品,它来的确实很晚但它绝对值得我们等这么久!
1499元的GTX960到底值不值得买?
在两年前甚至一年前,如果有朋友找我推荐一款显卡,我至少会给他两个选择,因为那个时候AMD的GCN对比NVIDIA的Kepler一点都不怯,游戏体验方面也没有什么明显的差别,萝卜青菜各有所爱喜欢谁家都有道理。但现在再遇到同样的问题,显然我不会再吝啬我的观点,NVIDIA是一家对科技和人性化有深入骨髓信仰的科技公司,如果仅仅用所谓的性能价格比去选择显卡,显然是不够全面客观的。旧的不说,诸如G-SYNC、Dynamic Super Resolution(DSR)这些技术都会让我们的游戏体验完全不同,风扇停转这些没什么科技含量但用起来很爽的东西我都不想费力气多说,总而言之用这句话来概括我的感受再合适不过——“只要你用过它们,你就再也回不去了!”
用过iPhone你还会用诺基亚吗?
之前盛传GTX960会杀到199美金,也许这也是全球游戏玩家的希望,但NVIDIA在最后定价的关头贪婪了一把。1499RMB虽然一点都不算贵,但离之前宣传的“甜点”似乎还是差了那么一点点诱惑,让大家多了一丝丝犹豫。也许就是这么区区一两百的差价,很多朋友会和这款优秀的显卡失之交臂!
真的不差钱,就上GTX980了,其他卡都完全可以无视,高富帅的世界就是这么任性,4K满帧超惊艳的游戏画面等着你。
有钱有脑子,就上GTX970吧,别问什么厂家什么牌子了,这个档次的显卡闭眼买做工都很好!什么样子都很丑?请问你是处女座嘛?是?Sorry我还有事走了先……
爱游戏爱科技,那就GTX960,等了这么久要过年了再不入一款都有点对不起自己了,别说什么R9 X80显卡跑分差不多价格便宜50块之类的……(此处省略n字,语言太过屌丝不宜展示),这点追求都没有请别说自己爱游戏好吗!
如果爸爸、妈妈、老婆、女友说再买显卡就剁手,继续等吧毕竟手只有一双家只有一个!不管一年两年,反正下一次十几纳米工艺更新以后,我保证现在所有的显卡都是战斗力为5的渣滓不信走着瞧,没出的显卡永远是最好的!■ <