A卡千元级性价比杀手!HD6790深度解析
泡泡网显卡频道4月6日 2009年AMD发布了革命性的HD5870显卡,这款显卡的出现正式拉开了DX11时代的帷幕,随后AMD又马不停蹄的发布了多款涵盖高中低的产品,宣告了DX11的全面普及。在13个月之后AMD又为玩家们带来了第二代DX11产品,这些产品不仅改变了人们之前对于AMD DX11产品的认识,并且在性能提升的同时,价位更为亲民。
纵观目前显卡市场格局,旗舰级巅峰之战可谓是大局已定,不久前HD6990的发布令AMD再次巩固了“卡皇”地位。如果说夺取“卡皇”地位是为了“争名”的话,那么占领入门级市场就是为了“夺利”,不过在入门级市场,受制于产品性能因素以及关注度的影响,AMD和NVIDIA之间的竞争较为平静,在价格和性能上的比拼,处于胶着状态。而要说竞争最为激烈市场,那就是游戏玩家关注度最高的主流级市场。
主流级市场的产品,对于游戏玩家来说可谓是性能与价格的完美平衡,所以相比其他价格区间关注度最高。因此AMD以及NVIDIA的发力重点都集中在这个价格区间内,进而产生了不少“明星产品”。如今的主流级市场,依旧是“群魔乱舞”的局面。799-1099元仅仅300元的价格区间内,就有7款产品(3款GTX460、GTS450、GTX550、HD5750、HD5770)让消费者有了更丰富的选择,真可谓是“你方唱罢我登场”。
今天AMD又进一步细化主流级市场定位,发布了采用第二代DX11构架的产品——HD6790,这款主要针对NVIDIA所发布的GTX550Ti。今天小编就借HD6790发布的这一契机,为大家全面分析一下目前主流级以上共15款显卡的性能、功耗以及价格等,力求为不同需求的玩家找出最适合的产品。
之前一直有传闻称,HD6700系列产品会完全照搬上一代HD5700系列。而小编在拿到HD6790送测产品之前,也一直认为HD6970只不过是采用HD5770核心的256bit衍生产品。但真正拿到送测产品和官方资料之后,这种想法便完全打消。HD6790的定位和上代的HD5830很相似,核心屏蔽方式也较为相同,因此小编个人认为或许命名为HD6830会更好一点。
HD6790基于BartsLE核心,该核心由HD6850的BartsPro核心进一步简化而来。该核心拥有800个流处理器单元,显存规格1024M/256bit。显卡支持DirectX11、Shader Model 5.0、优化细分曲面、形态抗锯齿、改进的各向异性过滤与HD3D等3D游戏技术,还支持UDVD3、AMD APP与蓝光3D等多媒体加速技术;还支持与DisplayPort 1.2a、HDMI 1.4、宽域等显示技术。
由上表可以看出HD6790在规格方面和上一代HD5770极为相似,流处理器数量完全相同,只是晶体管数量和显存位宽稍有不同。难道HD6790的改进仅仅只是在显存控制器方面吗?核心架构到底有没有改进?如果有那么其优势到底又是在哪呢?
我们知道,NVIDIA从GF100到GF104,虽然CUDA核心方面的改进不大,但对SM(流处理器簇)整体架构进行了重新的排列组合,部分指令分配单元和特殊功能单元被增强。
NVIDIA的MIMD(多指令多数据流)架构将并行指令的调度单元、分配单元都和特殊功能模块设计在了GPC(图形处理器集群)或者SM(流处理器簇)内部。而AMD的SIMD(单指令多数据流)架构则是整颗GPU共享单一的控制单元,自R600以来都是如此。
Juniper的单一图形装配引擎
但随着晶体管规模和流处理器数量的迅速膨胀,单一的控制单元已经无法满足大规模并行指令分配的需要,因此从Cypress开始,AMD采用了“双核心”的设计,将SIMD阵列一分为二,也就是类似于NVIDIA GPC的设计。与此相对应的,图形装配引擎虽然只有一个,内部却设计了两个Hierarchical Z(分层消影器)和Rasterizer(光栅器),但是其它的特殊功能模块均只有一个。
Barts的图形装配引擎
Barts和Cypress一样,依然保持了双核心设计,图形装配引擎也只有一个,内部的功能模块并没有太多变化。但是Ultra-Treaded Dispatch Processor(超线程分配处理器)却变成了两个,相对应的,超线程分配处理器的指令缓存也变成了两份。
我们知道,BartsLE的流处理器数量和Juniper相同,按理说线程分配压力相同,那么设计两个线程分配处理器的目的只有一个,那就是提升效率。在DX11时代,几何着色再加上曲面细分单元引入之后,图形装配引擎会产生更多的并行线程及指令转交SIMD进行处理,因此分配效率成为了新的瓶颈。
SIMD架构的优势就是可以用较少的晶体管制造成庞大的流处理器规模,拥有恐怖的理论运算能力;但缺点就是流处理器执行效率比MIMD架构低,其效率高低完全依赖于分配单元的派发效率。因此BartsLE这种双线程分配处理器的设计意义重大!
在BartsLE核心的图形装配引擎内部,还有一个毫不起眼的变化,那就是Tessellator(曲面细分单元)升级到了第七代,那么这一代到底有什么改进呢?
我们知道,NVIDIA GF100核心内部拥有多达16个曲面细分单元,GF104核心也有8个之多,而AMD的HD5000全系列都只有1个曲面细分单元,现如今HD6000系列还是维持全局共享1个的设计不变,其低下的曲面细分性能成为了NVIDIA攻击AMD最充分的理由。
HD6000系列可以说是半代改进的架构,既然数量上维持不变,就只能从改进效率的方面考虑了。而改进的内容就是加强线程管理和缓冲,也就是上页我们介绍过的“双倍的超线程分配处理器和指令缓存”。
根据AMD官方提供的数据来看,HD6870的曲面细分性能最多可达HD5870的两倍,这种情况出现在10级左右的中等细分程度,当曲面细分达到20级以上的时候,那么它们的性能就基本上没有区别了。
由此可见,Barts核心当中的Tessellator单元本身在性能方面应该没有改进,其性能提升主要源于两颗超线程分配处理器。中等级别的曲面细分在指令分配方面是瓶颈,Barts改进的架构消除了这一瓶颈,所以性能提升十分显著,但如果细分级别特别高时,Tessellator本身的运算能力将成为瓶颈,此时线程派遣器的效率再高,也无济于事。
通过前文的分析我们可以知道,HD6000在曲面细分方面的改进其实与双线程分配处理器是一回事,性能提升也是在特定的情况下才会出现。但总的来说还是能有1.5倍-2倍的提升,这对于消除A卡在Tessellation方面的瓶颈还是很有意义的。不过,AMD还是坚持认为当今的GPU和游戏尚不需要特别强悍的曲面细分能力,简而言之就是“曲面分得太细并不能让图形画质变得更好,但却会造成图形性能大幅下降”。其实,笔者也认同这种观点,但曲面细分性能也不能太弱。
下面我们就看图说话,笔者选择了目前曲面细分级别最高的一款DX11 Benchmark程序和NVIDIA官方曲面细分演示Demo进行说明:
● 天堂2.1当中Extreme级别的曲面细分
以下三张截图是最强A卡HD5970在1920x1080 4AA16AF模式下运行Heaven 2.0时获得的,从上到下依次为关闭曲面细分、普通级别曲面细分和极限模式曲面细分,大家可以点击放大对比细节差异:
Heaven 2.0 Tessellation Off,FPS=69
Heaven 2.0 Tessellation Normal,FPS=33
Heaven 2.0 Tessellation Extreme,FPS=16
可以看出,Tessellation从无到有所带来的画质改进是质变,石块、台阶、瓦片的立体感十分强烈,相应的光影效果也很到位。然后将Tessellation级别从Normal提升至Extreme时,凹凸立体感并没有太大变化,Normal模式已经足够出色了,过高的细分级别并不会带来更佳的画质,但却大大加重了显卡的负担,FPS损失非常惨重。
Heaven是款不错的DX11 Benchmark程序,其1.0版本是基于HD5000而开发的,Tessellation只有Normal级别。在GTX480发布之后,很快就诞生了2.0版本,其测试场景并没有太大变化,最核心的内容就是将Tessellation提升至Extreme级别,大家可以发现,片面提升曲面细分的结果就是:除了FPS暴降之外很难看出画面有什么提升!
然后通过测试成绩我们就可以发现,Heaven 1.0的成绩是很正常的,四款显卡的性能表现完全在意料之中。而在Heaven 2.0当中,局势完全被逆转,GTX480超越了双核的HD5970,GTX470都大幅领先与HD5870。这组成绩确实证明了GTX480和GTX470在重度曲面细分环境下拥有非常出色的效能,而HD5000将会出现严重瓶颈导致效能大降,但实际上却没有多少实际意义,因为加重曲面细分级别并没有带来画质改善,那么我们凭什么非要开到Extreme级别呢?
● NVIDIA自家DX11 Demo Island11,100级Tessellation有必要吗?
关闭Tessellation与25级Tessellation的区别,即便缩略图都能看出来
默认50级与最高的100级的区别
上图为GTX480发布时NVIDIA同步放出的一款DX11演示Demo,通过Tessellation构建了波澜壮阔的水面,确实非常有创意。该Demo默认的Tessellation细分级别为50(可以认为是自动插入顶点的数目),将其加大到100级之后,GTX480依然能够流畅自如,而HD5870则只有个位数。
但是,50级和100级的画面真有区别吗?恐怕拿着放大镜也很难看出来,事实上即便是25级的Tessellation,画面已经非常好了,到了一定的精度就不会有什么效果了。
● 小结:现阶段的游戏不需要太高级别的曲面细分
综上所述,通过两款曲面细分的代表Demo截图我们就会发现,当今的游戏其实并不需要把曲面分得太细,只要将插值顶点的数目控制在一定的范围之内,画面就非常精细了,盲目提高插值级别的做法没有太大意义,可谓是得不偿失。
事实上,当今所有的DX11都是这么做的,虽然使用了Tessellation技术,但都只是蜻蜓点水、适可而止,即便如此已经可以让游戏画面得到很大的改善。游戏不同于技术演示Demo或者SDK,而是本着实用化的原则,追求高效率运行,而不是专门用来刁难显卡的。
也就是说,以现有HD5000的Tessellation运算能力,是完全足以胜任今后较长一段时间内DX11游戏的需要。GTX480/470虽然拥有N倍于HD5000的Tessellation运算能力,但除了能够在为数不多的几款Demo当中蹂躏A卡外,似乎并没有其它用途。等到未来游戏真正需要更强的曲面细分性能时,当今的优异显卡可能几百块钱处理都处理不掉了,未来的游戏同样需要更强的浮点运算能力,而不是片面注重某一特定技术的性能。
从G80时代开始,NVIDIA不满足于业界标准MSAA(多重采样抗锯齿),推出了自己的CSAA(CoverageSamplingAnti-Aliasing,覆盖采样抗锯齿)标准,从而实现了更高的精度和更佳的效率。
很多游戏除了传统的MSAA外,都内置了CSAA支持
而AMD也不逞多让,争锋相对的推出了CFAA(Custom Filter Anti-Aliasing,定制过滤抗锯齿),实现了更高倍数的抗锯齿模式。但是这种CFAA并没有得到游戏厂商的认可,因为这种自定义扩大采样色彩采样范围的抗锯齿模式,会出现将物体边缘变模糊的现象。
WOW打开CFAA后,花草还有文字都变模糊了
从G80发布至今,NVIDIA的CSAA技术得到了越来越多游戏开发商的认可,相信很多玩家都注意到了,现在不少游戏都直接在菜单中提供了CSAA选项,N卡用户不用进入驱动控制面板就能非常方便的调用。而AMD的CFAA虽然从HD2000时代已经沿用到了HD5000时代,但几乎无人问津。
终于到了HD6000时代,AMD抛弃了实用价值并不高的CFAA,开发了一种新的抗锯齿方案——Morphological AA,直译为形态抗锯齿。这种抗锯齿采用了DirectCompute计算技术来进行高效率的后处理器过滤,
新的抗锯齿模式适用范围比传统的MSAA更广,而且精度最高可达24x,效率方面比SSAA(超级采样抗锯齿)快很多,与最高精度的CFAA差不多,但画质要更好。
除此之外,HD6000系列还改进了AF(各项异性过滤)算法,使得纹理材质的清晰度和画质进一步提高,且不至于出现失真和变形。每一代新产品出现后NVIDIA和AMD都会强调AF画质和效率会更好,事实上它们前几代产品已经做得足够好了,新的改进除了用专业测试软件才能看出很小的区别外,在普通游戏中谁会注意到如此微不足道的变化呢?
在3D引擎部分,Barts核心相对于Juniper的改进并不多,只有超线程分配处理器、指令缓存、曲面细分模块和AA/AF算法这些。
从架构图中我们可以注意点,AMD的UVD(Unified Video Decoder,通用视频解码器)引擎现在升级到了第三代:
上图非常直观的揭示了UVD三代引擎在功能方面的改进,UVD2主要是加入了对即将淘汰的MPEG-2编码的硬解支持,让CPU占用率进一步下降,性能方面接近于NVIDIA VP3引擎。
● UVD3引擎改进之一:MPEG-2完全硬解码
UVD3的改进最为彻底,MPEG-2编码最复杂的熵解码部分也可以支持硬解了,从而实现了完全硬解码,达到了NVIDIA VP3的水平。不过对于这种即将被淘汰的编码进行改进并不是UVD3的重点。
● UVD3引擎改进之二:多屏、超高分辨率、多路视频流、3D蓝光硬解码
UVD3最有价值的改进就在于对与Eyefinity多屏应用模式下,超高分辨率视频解码的支持,以及多路视频流解码支持,还有3D蓝光硬解码支持。
● UVD3引擎改进之三:加入了DivX/xVid视频硬解码支持
目前互联网上流行的很多盗版电影都是采用了DivX压缩格式,主要集中在DVDrip以及部分720p高清视频电影方面。另外新兴的XviD标准也因为更高的压缩率和画质在迅速成长。这两种由MPEG-4衍生出来的视频编码有着为数不少的影片(尤其是日本动作片)。
低分辨率的DivX/xVid视频码率并不高,对于CPU要求较低。但近年来也有朝着高清发展的趋势,分辨率提高之后的影片由于其压缩率很高因此解码时的CPU占用率并不低。此次UVD3解码器对DivX和Xvid提供了支持,可谓是民心所向。
● UVD3引擎改进之四:视频画质接近满分
根据AMD官方公布的数据来看,在HQV Benchmark 2.0测试中,HD6870几乎可以达到满分的成绩,远胜过NVIDIA最新的GTX460显卡,和Intel的整合显卡不在一个档次。
HD6000系列采用了全新的后处理器算法,并且提供了增强的视频增强选项,进一步稳固A卡在输出画质方面的领先地位。
公版HD6790完全采用了HD6870的公版设计方案,做工用料自然相比HD6850更为豪华,这似乎为今后玩家对其进行开核破解埋下了伏笔。
散热器外观虽然四方四正,但结构和以往的公版卡没什么区别,散热片部分为铜底、热管、铝鳍片,涡轮风扇侧吹式风道接口。这种散热器散热效率相对较低,但优势就是可以把显卡发出的热量全部排出机箱之外,不给机箱散热造成负担,因此AMD和NVIDIA公版卡最喜欢用这种结构。
输出接口比较多,因此留给排风口的空间只剩下半个PCI挡板了。HD6870这五个接口的定义在前文中已经详细讲解过了,这里就不再重复。AMD没有直接设计6个Mini DP接口,安置了这么多种类型的接口,就是为了能够兼容市面上所有的显示器,其中DVI接口还能转接成为D-SUB兼容模拟设备。
HD6790的供电部分,采用了核心四相、显存控制器一相、显存一相的六相供电模块,AMD放弃了ATI原厂风格的数字供电模块,而改用了常见的PWM模拟供电,更有利于成本控制。但是8颗显存仅使用1相供电,这样并不利于显存超频,这可能是HD6790默认显存频率较低的主要原因。
迪兰恒进HD6790采用了全黑色跑车风格,使产品本身颇具卖相。散热器内部采用了F.I.N穿钉技术。散热器底座则采用了成本较高的铝板三热管设计,结合上方的大面积铝制鳍片,散热效果自然不成问题。
蓝宝HD6790采用了全覆盖式的散热器设计,尽管出于成本考虑没有采用蓝宝所常用的真空腔均热板散热器,但这款显卡所搭配的铜底3热管散热器同样可以满足HD6790的需求。风扇搭配了四针大口径可变速风扇,兼顾了散热与静音效果。另外风扇扇叶也经过特殊的折边设计处理,可以有效降低切风时的噪音。
讯景HD-679X-ZDF少校版作为最新的一款HD6790非公版本,讯景HD-679X-ZDF少校版使用了讯景的特色“双旋风”散热系统,完备讯景旋风系列的强劲散热特质。两个可调速的静音风扇,辅以三跟纯铜热管导热,理论上其散热效果高于公版。
此款盈通R6790-1024GD5极速版采用非公版设计,特别要说的是基于Barts核心的优良传统,想必这款产品会有不错的超频潜能,在规格和做工等方面都完全不逊色,不过目前这款产品的价格尚不知晓。
由于本次测试的主体以及参加测试的对比显卡都是目前的主流级和旗舰级产品,为了尽量避免处理器和内存出现性能瓶颈,本次测试采用了目前非常优异的i7 2600K处理器搭配8GB内存,主板采用了最新的技嘉GA-P67A-UD4-B3。
为了能够直观的体现出目前主流级和旗舰级显卡的性能,本次测试还加入了HD5750 HD5770 HD6790 HD6850 HD6870 HD6950 HD6970 HD6990以及GTS450 GTX460 GTX550 GTX560 GTX570 GTX580 GTX590等产品对比测试。
下面,我们就一起来看看这些显卡在游戏性能方面的表现!
时至今日,依然没有任何一个测试软件或者游戏能够取代3DMark在游戏玩家心目中的地位,因为3DMark的魅力就在于它所带来的不仅仅是惊艳的画面,更重要的是向广大玩家提供了一种权威、系统、公正衡量显卡性能的分值。
3DMark11的测试重点是实时利用DX11 API更新和渲染复杂的游戏世界,通过六个不同测试环节得到一个综合评分,藉此评判一套PC系统的基准性能水平。
● 3DMark 11的特色与亮点:
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面细分、计算着色器、多线程。
2、原生支持64bit,保留32bit:原生64位编译程序,独立的32位、64位可执行文件,并支持兼容模式。
3、全新测试场景:总计六个测试场景,包括四个图形测试(其实是两个场景)、一个物理测试、一个综合测试,全面衡量GPU、CPU性能。
4、抛弃PhysX,使用Bullet物理引擎:抛弃封闭的NVIDIA PhysX而改用开源的Bullet专业物理库,支持碰撞检测、刚体、软体,根据ZLib授权协议而免费使用。
此前的Heaven Benchmark和StoneGaint这两款DX11测试软件都片面注重于Tessellation性能,以致于遭到了AMD和部分游戏玩家的不满。而3DMark11则提供了多种负载的测试场景,更加均衡的考验了显卡的DX11性能,因此其测试结果将更具代表性一些。
软件介绍:做为目前最为权威的性能测试软件,3DMark Vantage在3D基准性能测试,可以全面准确的得出显卡的真实性能,所以在历次测试中都少不了它的加盟。3DMark Vantage所使用的全新引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨。
画面设置:3DMark Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级),只有在这四种模式下才能跑出总分,如果自定义模式就只能得到子项目分数了。
3DMark Vantage 是目前验证显卡DX10性能较好的工具,不过由于其采用了PhysX物理加速技术,导致N卡总分偏高。因此N卡在此测试项目中的排名,相比3Dmark11中有所提升。
Tessellation如此重要,所以首款DX11测试程序——Heaven Benchmark中,几乎所有的场景都是由Tessellation技术动态生成的,地图中央的飞龙,和周围凹凸不平的砖墙、石阶和瓦片给人留下了深刻的印象。
Unigine Engine率先发布了首款DX11测试/演示程序——Heaven Benchmark,其中大量运用了DX11新增的技术和指令,在DMark11面世之前,Heaven曾经是DX11性能测试的非常好的选择。
Heaven Benchmark 1.0和2.0的Tessellation细分程度对比
在这幅图中,大家注意观察左侧的墙壁(以及凸出石块的阴影)、右侧的台阶和下方的鹅卵石路,Tessellation技术生成的是实实在在的顶点和曲面,所有的岩石、台阶和石块都是独立存在,而不再是平面上的虚拟贴图而已。
画面设置:2.1版本进一步强化了Tessellation技术的应用,细分精度更高,画面更上一层楼。
《天堂》2.1加入了Extreme模式Tesselation的支持,但实际上却没有多少实际意义,因为加重曲面细分级别并没有带来显著的画质改善,却大大加重了显卡的负担,FPS损失非常惨重。此项测试只能片面的证明显卡的Tesselation性能,并不能代表显卡在实际DX11游戏中的表现。
作为FPS类游戏中的经典,《使命召唤》系列在战争题材的FPS游戏中占据着很大的市场,在全球范围也一直都不缺乏忠实的玩家。《使命召唤7:黑色行动》由负责《使命召唤3》与《战争世界》的Treyarch操刀制作,游戏的时间点设定于冷战时期,游戏主要描述了战争期间的一个名称为Studies and Observations Group的组织,他们将在越南战争中承担最秘密、最危险的任务。而且游戏场景还会穿插北极、古巴等一些冷战时期的热点地区。
《使命召唤7:黑色行动》有对战累积经验值的设计,还多了所谓的“CoD点数(CoD Points)”,经验值只能解锁武装的购买权,还要另外花点数购买才能换取新的武器、配件与能力。因应新的CoD点数系统,多人游戏也多了所谓的押注比赛(Wager Match),里面细分为数种不同的玩法,比赛的赢家可以大赚一笔赏金。
画面设置:同样是一款跨平台的DX9游戏,使命召唤7对显卡的要求也不算高,本次测试我们游戏依然采用1920X1080分辨率,特效设置最高,抗锯齿4XAA。
作为2010年最新的FPS大作,《使命召唤7:黑色行动》虽然是DX9C,但游戏要求显然比街霸等游戏高很多、在1920X1080分辨率+4AA下,我们发现游戏内置了帧数限制,HD6850以上显卡已经达到了上限。
暴雪的游戏,引擎往往并不是最新,系统要求也不是很高,但游戏画面却趋于完美,让人惊叹不已,这就是暴雪程序员和美工的独到之处:他们可以使用最成熟、最易用的技术勾勒出最优异的特效。此次Starcraft II就是这样,虽然没有使用DX11 API,但大量DX9C成熟技术的应用让我们目不暇接。
包括FP16 HDR、光线散射/反射效果(Diffuse and specular for lighting)、景深效果(depth of field)、体积雾(fog volumes)、动态环境遮蔽(dynamic ambient occlusion)、智能贴图置换(smart displacement)等等,这些都是Starcraft II的“BT”之处。
游戏介绍:《星际争霸Ⅱ》延续了神族、人族和虫族三足鼎立的传奇史诗。继原作《星际争霸》之后,这三大截然不同又各赋异秉的种族将再次面临冲突与对抗,旧有兵种、升级兵种以及全新的兵种将一一登场,为了各自种族的生存,展开惊心动魄的搏杀,战火将烧遍整个星系。
画面设置:所有特效全开最高,分辨率使用1920x1080。《星际争霸2》 正式版虽然本身不支持抗锯齿,很多玩家也不会刻意从驱动去调抗锯齿,所以我们测试也没有开抗锯齿。
测试方法:登录官网进行对战,然后播放录像全程,用Fraps记录全程帧数的平均值。因为游戏路线中的所有单位均为实时渲染,用来测试3D性能非常合适。
作为一款电子竞技游戏,过于追求画质并不是什么好事情。从本次测试我们发现这款2010年的暴雪大作对显卡的要求不算高,但对CPU有一定的要求。当然,这些显卡都可以流畅运行这款游戏。
在《孤岛危机》发布之后三年多的时间里面,3D图形API从DX10发展到了DX10.1以及DX11,但即便是当今采用最新DX11图形技术的游戏大作,也没有任何一款的画面能够完全超越采用DX10引擎的《孤岛危机》,看来也只有《孤岛危机2》才有这个可能了。
时隔四年,Crytek以升级版的Cry Engine 3打造的《孤岛危机2》即将正式发行。近日,一份《孤岛危机2》的未完成版泄露出来,这比游戏预定正式发售日期3月22日早了一个多月,这令开发商大为苦恼,近日连吐苦水,却令玩家欢呼雀跃,我们早已看够了截图和视频,现在终于可以亲身体验《孤岛危机2》了!
被泄露出来的版本是一个完整版的游戏,包含完整的单人剧情内容,但并非最终版本,不少设置选项仍不完善,目前来看只有DX9.0C模式,无法开启DX10/DX11,并且存在不少BUG,不过对于显卡的需求依旧是相当高。
EA全新推出的经典竞速游戏续作《优品飞车15:变速2》成为游戏市场最火爆的游戏之一。此前,该系列以每年一部新作的速度发售,每一代新作的推出,玩家们都会对游戏的画质表现、操控体验等方便展开激烈的争论。也正是有了这么多忠实的玩家,才使得这款竞速游戏长盛不衰。
此次《优品飞车15:变速2》也是打破了之前的规律,继《优品飞车14》刚刚推出4个月后就全新发售,如果EA在年底之前再度推出《优品飞车16》的话,也将打破此前一年一部新作的规律,首度出席一年发售两部续作的状况。
新作《优品飞车15:变速2》有些画质上和前作相比没有明显的提升,反倒在一些场景还要逊于前作,但在对显卡性能的需要上却有所提高。对于普通玩家来说,HD6790就能够基本满足需求。
PC版《街头霸王IV》对应Game for Windows Live功能,支持在线对战、游戏内短信交流和即时语音聊天。PC版除了支持高解析度画面输出之外,还为玩家提供了画面渲染风格选择的功能,除与家用机版一样的“普通”模式外,还有“水彩”、“海报”和“烟灰墨”这三种追加的渲染风格。
测试方法:测试时使用游戏自带Benchmark。
作为一款DX9C游戏,《街霸4》和写实风格的FPS游戏不同,街霸渲染的人物模型数量较少,场景比较简单。而对于现在的高端显卡,这些显然是小菜一碟,几乎所有显卡都超过了80帧,对于游戏本身已经没有测试的必要。但是即便如此,我们通过这款Benchmark程序,依然可以清晰的看到这15款显卡的DX9实力。
游戏介绍:自《孤岛惊魂》系列的版权被UBI购买之后,该公司蒙特利尔分部就已经开始着手开发新作,本作不但开发工作从Crytek转交给UBI,而且游戏的故事背景也与前作毫无关系,游戏的图形和物理引擎由UBI方面完全重新制作。
画面设置:借助于蒙特利尔工作室开发的全新引擎,游戏中将表现出即时的天气与空气效果,所有物体也都因为全新的物理引擎,而显得更加真实。你甚至可以在游戏中看到一处火焰逐渐蔓延,从而将整个草场烧光!而且首次对DX10.1提供支持,虽然我们很难看到。
测试方法:游戏自带Benchmark工具。
在《孤岛惊魂2》这款游戏中,显卡的性能级别也体现的非常明显,但本次参测的所有产品都可以在1920分辨率的设置下流畅跑完该游戏的BenchMark程序。
游戏介绍:《鹰击长空》由Ubisoft旗下的Bucharest Studio工作室所研发制作而成,以汤姆克兰西最擅长的近现代国际冲突为背景,加上现代化的军事武器,和五角大厦不愿证实的开发中的先进武器,交织出最激烈的高科技攻防战。而《鹰击长空》也脱离前面几项作品的框架,将战争从地面拉拔到空中,享受广大无界限的战斗空间。
画面设置:《鹰击长空》直接内置了对DX10和DX10.1的支持,它会自动检测显卡最高能支持的级别。通过此前的测试来看DX10.1并不会让画质变得更高,但的确能够让游戏跑得更快。我们使用1920分辨率,4AA模式进行测试。
《鹰击长空》是ATI曾经主推的一款游戏,不过由测试结果可以看到A卡在主场已经发挥失利。
Crysis(孤岛危机)无疑是DX11出现之前对电脑配置要求最高的PC游戏大作。作为DX10游戏的标杆,Crysis的画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。Crysis还有个资料片Warhead,使用了相同的引擎。
画面设置:Crysis只有在最高的VeryHigh模式下才是DX10效果,此前所有高端显卡都只能在低分辨率下才敢开启DX10模式,如今显卡性能越来越强,自然全开最高。
测试方法:Crysis内置了CPU和GPU两个测试程序,我们使用GPU测试程序,测试了1920X1080模式。这个程序会自动切换地图内的全岛风景。
虽然显卡已经更新换代数次,但《孤岛危机》仍然是目前的杀手级游戏。只有HD6870以上的显卡才能基本保证能够流畅运行这款游戏。
游戏介绍:《冲突世界》将带领玩家返回著名的冷战时期,玩家每一个决定均影响游戏中人物和情节。可于游戏中感受不一样的团队精神,与队友于阴森恐怖的战场上一同作战。《苏联进攻》是其最新的资料片,收录全新角色、扮演苏联军队、10套新影片和全新多人联机地图等等。
画面设置:《冲突世界》是首批DX10游戏之一,采用了自行研发的MassTech引擎,支持多种当前的主流显示特效,如容积云,景深效果,软阴影等,光照系统也表现出色,尤其是半透明的容积云特效营造出了十分逼真的户外场景,物理加速结合体积光照渲染出了最逼真的爆炸效果。
《冲突世界》是一款非常华丽的DX10游戏,但引擎优化的不错,基本难不倒目前的主流级显卡。
游戏介绍:《Aliens vs. Predator》同时登陆PC、X360和PS3,其中PC版因为支持DX11里的细分曲面(Tessellation)、高清环境光遮蔽(HDAO)、计算着色器后期处理、真实阴影等技术而备受关注,是AMD大力推行的游戏之一,但是这样的主题难免让本作有很多不和谐的地方,暴力血腥场面必然不会少!发行商世嘉在2009年11月就曾明志,表示不会为了通过审查而放弃电子娱乐产品发行商的责任,因为游戏要维持“异形大战铁血战士”这一中心主题,无论画面、玩法还是故事线都不能偏离。
画面设置:AVP原始版本并不支持AA,但升级至1.1版本之后,MSAA选项出现在了DX11增强特效当中,当然还支持Tessellation、HDAO、DirectCompute等招牌。该游戏要求不算太高,所以笔者直接将特效调至最高进行测试。
测试方法:游戏带Benchmark,其中测试画面颇代表意义,很好的体现了Tessellation异形身体以及HDAO等高级特效,希望这些特效能让系统发挥所有潜力。
《Aliens vs. Predator》是首批支持DX11的游戏之一,但相比前面的《尘埃2》加入了更多DX11特效,对显卡性能有一定的要求。因此当测试画面中出现了N个异型以后,HD6870级别以下显卡都有些吃不消。
《战地:叛逆连队2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。开发商EA已经于本月2日正式同步发售了Xbox 360、PS3、PC版。该游戏是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连队》的直接续作,在继承前作特性的基础上,强化了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。
测试方法:游戏不带Benchmark,笔者选取了单人任务模式下的一段无需手动干涉的过场动画进行测试,其中包括大量激烈的轰炸爆破激战场面,完全可以反映真实的游戏性能。
《叛逆联队2》虽然是款DX11游戏,霜寒引擎也是备受期待的DX11引擎,曾被ATI用来做Tessellation的技术展示。不过最新版本的对DX11的支持非常有限,仅仅是采用新指令集渲染HBAO特效而已,因此对于显卡的性能要求并不是很高。
《科林麦克雷》系列游戏是为纪念去世的英国拉力赛车手科林·麦克雷(Colin McRae)而制作的,因此在游戏过程中不难见到许多麦克雷过往的身影。与一年一款的优品系列赛车游戏不同,DiRT2距离前作已经两年之久,目前《科林麦克雷:尘埃2》主机版早已上市,几乎登陆所有的主机和掌机平台、好评如潮,而PC版由于支持DX11的缘故,所以被延期数月。
画面设置:DIRT2堪称DX11游戏代表作,DX11的五大关键特性在这款游戏中都有体现,但却没有得到大范围的应用,都是点到为止。比如Tessellation主要体现在水洼和旗帜上,而赛车过程中也就那么几处采用了该技术,因此这款DX11的要求并不高,特效全开的话中端显卡都能跑动。
测试方法:游戏自带Benchmark程序,会自动跑完一个固定的赛道,非常接近于真正玩游戏的模式,最后得出平均FPS和最小FPS。
虽然DIRT2这款游戏当中应用了所有的五大DX11关键技术,但都是轻量级的,因此对显卡要求不是很高。而作为AMD力推的一款DX11游戏大作,N卡在本作中的表现却是非常抢眼。
《Lost Planet2》是一款具有光荣传统的游戏大作,在DX10时代就以率先支持DX10技术而著称,在DX11时代已然延续了对技术快速提供支持的风格,率先利用了DX11及曲面细分效果,使得游戏画面再次获得提升。
游戏介绍:《失落的星球2》的游戏舞台是前作故事发生后十几年之后经过温暖化改变的EDN-3rd,这里将新增丛林等新场景,主人公也并非前作那样为一人,而是以“雪贼”们不同的视点展开故事。
画面设置:与前作相同,《失落的星球2》采用CAPCOM公司原创引擎MT Framework的最新版VER.2.0进行开发,游戏世界的表现将更加细致和美丽。而不仅仅是画面上的进化,本作将会在前作玩家要求基础上追加大量全新要素,新场景、新角色、新武器等自不必说,角色的动作也比前作更加丰富多彩。
测试方法:游戏自带Benchmark,开启全特效+4AA选择B场景的BOSS战,非常激烈过瘾。
《失落星球2》也是一款应用Tesselation技术非常多的DX11游戏,因此这款游戏的测试结果非常离谱。仅仅在1920分辨率下,GTX460以下的显卡均无法流畅运行。
DX11大作《地铁2033》就使用了DX11级别的景深效果,清晰和虚化合理分配、主次分明,再搭配Tessellation技术的辅助,几乎接近与电影的拍摄效果,看起来有种赏心悦目的感觉。但该游戏由于使用了太多尖端图形技术,所以要求非常苛刻。
游戏介绍:《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作,也是DX11游戏的新成员。该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。
画面设置:《地铁2033》虽然支持PhysX,但对CPU软件加速支持的也很好,因此使用A卡玩游戏时并不会因PhysX效果而拖累性能。该游戏由于加入了太多的尖端技术导致要求非常BT,以至于我们都不敢开启抗锯齿进行测试,只是将游戏内置的效果调至最高。游戏自带Benchmark,这段画战斗场景并不是很宏大,但已经让高端显卡不堪重负了。
测试说明:如果说是CRYSIS发动了DX10时代的显卡危机,那地铁2033无疑是DX11时代的显卡杀手!地铁2033几乎支持当时可以采用的所有新技术,在画面雕琢上大肆铺张,全然不顾显卡们的感受,和CRYSIS如出一辙。然而CRYSIS靠着特效的堆积和不错的优化,其惊艳绝伦的画面和DX9C游戏拉开了距离,终究赚足了眼球;而地铁则没有这么好运了,画面固然不差,BUG却是很多,招来了大量的非议。
特效的滥用,超大的纹理和复杂的模型,也许4A Games本来就没打算让这款游戏流行。本次测试我们使用4AA抗锯齿+全特效来考验显卡,而经过多款驱动的不懈优化,现在高端显卡玩地铁2033终于像是一款游戏而不是幻灯片或者别的什么了,而旗舰显卡则让我们看到了一线曙光。
我们的功耗测试方法是直接统计整套平台的总功耗,既简单、又直观。测试仪器为微型电力监测仪,它通过实时监控输入电源的电压和电流计算出当前的功率,这样得到的数值就是包括CPU、主板、内存、硬盘、显卡、电源以及线路损耗在内的主机总功率(不包括显示器)。
各款显卡在待机情况下的功耗排名似乎和性能不成正比,实际功耗值相当接近。这主要是因为各参测显卡在此时均已降至相当低的频率。此外由于HD6900系列显卡采用了新一代电源管理技术,因此待机功耗低于主流级的HD6800系列。
在满载状态下各显卡的功耗排名就比较接近于显卡的真实性能。结合之前的性能来看,HD6800系列显卡在性能明显高于GTX550的情况下,功耗却低于GTX550,由此可以说HD6800系列显卡对于功耗的控制相比同定位的产品的确略胜一筹。
主动式散热无可避免会产生噪音,这是困扰风冷散热的永恒桎梏。因为测试条件的限制,之前的测试我们只能用耳朵去主观感受。因此也无法对噪音的数值做量化的分析。但随着消费者对生活品质的要求不断提高,电脑噪音污染也是越来越被玩家重视,鉴于此我们对该显卡的噪音进行了测试。
从测试的结果可以看到HD6790所搭载的散热器和HD6870完全相同,对于噪音的控制中规中矩,整体噪音为50分贝左右。另外,在满载状态下由于风扇转速明显提升,因此噪音提升了11分贝。
与UVD3引擎一同改进的,还有Eyefinity 2D输出引擎。Eyefinity技术可以外接的显示屏数量还是维持在6个,但是接口标准和定义都得到了全面增强,AMD公版HD6000系列的接口种类也发生了变化:
● 支持目前非常先进的DisplayPort 1.2、HDMI 1.4a标准
HD6000同时支持当今非常先进的DisplayPort 1.2和HDMI 1.4a,其中DP1.2的规格十分强大,数据带宽比上代直接翻番,实现了单个接口4096x2160 @ 60Hz的超高分辨率!
而且DP1.2还支持多通道数据流传输技术,可以用一个接口连接几个显示设备,并且显示完全不同的画面。
而HDMI 1.4a的意义就在于,它可以兼容目前市面上最新的3D电视、投影仪等设备,以往的HDMI 1.3标准是无法支持这些3D设备的。
HD5000系列的标准接口配置是双Dual-Link DVI、DisplayPort、HDMI,其中两个DL-DVI占据了4个显示通道,DP和HDMI各一个,这样就把Eyefinity的6个通道都用完了。
而HD6870/6850/6790的标准接口配置则是一个Dual-Link DVI、一个Single-Link DVI、HDMI、两个Mini-DP。外观上是把一个普通DP替换成了两个Mini-DP,实际上是从原来的DL-DVI中拆分出来了一个显示通道,多做了一路DP输出。
这样做的好处就是,一片显卡可以直接接驳任何类型的数字显示设备而不需要转接,另外HD6000系列的所有六个显示通道都可以直接输出,而不需要购买专用的6-DP特殊版显卡。
公版HD6870就能支持六路输出
这个功能是利用了DP 1.2标准当中的多流传输技术,通过专用的适配器,将一路Mini DP转接为三路,这样两路Mini-DP就能轻松支持六屏输出。而且转接出来的六路通道并不局限于DP接口,HDMI、DVI、VGA等常见的接口都可以兼容。如此一来,Eyefinity技术的实现难度还有兼容性将大大增强。
不得不承认,NVIDIA是一家很有远见的公司,一年多前就研发成功的3D Vision立体显示技术,现在已经成为整个IT业界的发展趋势。而AMD的3D立体显示技术才刚刚开始得到采用。
首先在硬件方面,只要能够支持120Hz刷新率的输出,就可以在PC上实现3D显示技术。而想要在平板电视和投影仪上实现3D输出的话,就需要高带宽的HDMI 1.4a标准的支持,现在AMD率先做到了。
显示设备方面的支持也不是问题,市面上主流的3D电视、投影仪,还有120Hz LCD或者双面板LCD都能支持ATI显卡。
当然,最关键的还是在软件方面。同GPU物理加速一样,AMD仍然倡导开放的标准,因此AMD积极与第三方3D显示驱动供应商合作,能够支持iZ3D和DDD这两种3D转换方案,并且兼容多种3D视频播放软件,对于3D显示设备以及3D眼镜也都是来者不拒。
开放式的解决方案由于成本较低,选择范围比较广,因此受到了很多OEM厂商的亲睐,目前已经有不少笔记本和一体机采用了基于ATI显卡的3D显示解决方案,但开放式的标准比较多,如果并非OEM集成式方案的话,安装操作就较为复杂,因此AMD的HD3D方案在DIY领域并没有什么作为,知名度远不如NVIDIA的3D Vision。
目前AMD的3D显示技术,无论效果、兼容性还是软件支持度方面,都丝毫不差于3D Vision。无论是对于3D游戏的立体化,还是2D视频的3D化,都得到了主流媒体播放器的支持,而且AMD的新一代UVD3引擎还能支持3D蓝光硬解码,可以说已经相当成熟了。
CUDA是NVIDIA显卡的一大卖点,它能够将GPU庞大的运算能力释放出来,对非3D游戏应用软件进行加速,实现比纯CPU运算更快的效能。CUDA目前虽然有很多种类的软件,但最主要的应用还是集中在视频编辑和转码方面。
AMD方面与之相对应的技术叫做Stream,Stream相关软件的数量虽然与CUDA有一定的差距,但近年来AMD也投入了很高的重视,与众多知名的软件开发商展开了密切合作,尽快的加入对Radeon显卡的优化支持,让A卡用户也能体会到GPU加速所带来的快感。
目前使用率最为广泛的PowerDVD视频倍线、MediaShow照片人脸识别、PowerDirector视频编辑、MediaShow视频转码等应用,都可以支持使用A卡进行加速,性能提升非常显著。这些以往都是N卡的专利,现在A卡用户也能达到相同的效果了。
此外,AMD新一代的UVD3引擎,还可以直接为视频转码软件输出视频源数据,这样就能在大大降低CPU和GPU占用率的同时,显著提升视频转码速度。而以往在视频转换时,视频解码的任务要么是CPU运算,要么是GPU的流处理器部分运算,占用率都比较高。
NVIDIA的物理技术PhysX收购自Agiea公司,仅能用于自家GeForce GPU。AMD此前选择了应用更广泛的Havok,既能在GPU上也能在CPU上执行,但是Havok已经被Intel收归麾下,GPU加速技术被雪藏,于是AMD又不得不选择了免费开源的大型实时物理引擎Bullet Physics。
日前,AMD已经正式公布了与Trinigy的合作进度,并且携手开发了一款基于DX11引擎、DirectCompute加速的物理演示Demo,通过公布的视频和截图来看,无论画面表现力,还是物理效果的逼真程度,都堪称一流。
此番展示的DEMO名为“Mecha Warrior”,其中有一个机甲战士在大城市中来回穿梭,一路破坏制造大量碎片,而这些效果都是利用Radeon HD 6800系列显卡配合Bullet Physics物理引擎完成的,速度相当流畅。
这款物理演示Demo是通过大名定定的Maya 2011制作而成的,AMD为其开发了免费的插件,使得程序员可以在现有的基础上,较快的开发出优秀的图像引擎。开源的魅力就在于此,相信未来会有更多基于A卡的物理加速演示出现在大家面前。
在千元以上价位中,不得不说的就是两款明星级产品——HD6850和GTX460,这两款产品在性能方面几乎是“不分伯仲”,借助于超线程分配的改进、曲面细分单元的加强以及AA效率的优化,使得HD6850在DX11游戏中的执行效率相比之前的产品有所增强。此外HD6850在功耗方面的表现的确稍好于GTX460,因此HD6850在能耗比方面的优势更为突出一些。
最后就要说到今天AMD发布的主流级DX11新星——HD6790,按照AMD的市场部署这款产品主要针对最近所发布的GTX550Ti,同时配合其“同门师兄”HD6850对更高端的GTX460形成一种夹击之势。这款产品传承了HD6800系列的特性,曲面细分效率方面相比上一代HD5770有不少的提升,因此在性能上完全超越GTX550Ti,再加上256bit的位宽,确实是千元价位很有竞争力的产品。
● 买显卡,还是买体验?
显卡性能鏖战至今,流畅度的几帧差别真的就能以胜负来分?揭开A/N性能大战背后的幕布会发现,各家在意的是消费者购买其产品的满足感。从技术层面上分析,当消费者发现真正令其感到幸福或者满足的事物后,或许会因此调整他们的消费模式。回归到销售市场中,当用户开支已经从商品转向了体验,谁能够给用户带来创造记忆,就意味着谁彻底掌握了主动权。
面对120小时,长达300次得上机实测,笔者深感显卡的技术/性能已经远远走在了应用的前面。随着显卡附属功能的推广,多屏幕输出、3D、视频转码、物理加速等诸多技术,逐渐成为了产品宣传的重心,这意味着显卡带给消费者的体验,已经成为了商家新方向。
在竞争激烈的千元级产品中,高举DX11大旗的AMD左手握HD6790,右手攥着多层降价策略。随时迎击竞争对手。HD6790来了,它的到来,意味着当用户愿意把额外的钱花在晚上跟家人一起看看电影,玩玩游戏时,在这个价位上,有了新的性价比产品可供选择。
关于HD6790的超频测试我们会在近期公布,其中将包括风冷极限超频以及破解开核的可行性测试等,更多详情敬请广大网友关注PCPOP显卡频道。■<