全面超越!蓝宝新HD6950 尘埃3版测试
泡泡网显卡频道7月8日 日前,蓝宝面向次高端的产品新HD6950抵达泡泡。而今天我们将奉上这款新产品的详细测试。而在此之前,我们首先简单了解一下HD6950的来历。
HD6900(Cayman)定位解析:避开GTX580
Radeon HD 6000是一次妥协的产物,仍旧使用R600以来的核心架构体系,制造工艺也还是40nm。而Radeon HD X9XX系列历来定位高端旗舰,根据一贯作风,Barts、Cayman核心应该分别叫作Radeon HD 6700/6800系列而替代Radeon HD 5700/5800系列,但事实上它们都拔高了一个档次,命名为HD6800/6900。
那为何AMD不惜将Cayman核心人为拔高,命名为Radeon HD 6900系列?即便有了产品细节优化和良品率的完善,实际性能表现会有质的提升么?今天借助蓝宝石HD6950 Dirt3版,我们来看看HD6950是否有资格僭越“9系”之名号。
合理的目标与顺利的执行是一款优秀的产品的必要条件。在Cayman Radeon HD 6900系列身上,AMD寄予厚望:高效的图形与计算架构、强大的几何性能、新的画质技术、新的能效与功耗管理是该核心的设计期望。
为了实现高效的图形与计算架构,AMD该用了重新定义的VLIW4架构,同时还引入了双图形引擎、更多SIMD引擎与纹理单元、升级的渲染后端、更高的显存带宽、新的GPU计算技术。
VLIW全称为Very Long Instruction Word,意思是超常指令字架构,是一种非常长的指令组合,通过把许多条指令连在一起来增加运算的速度。从第一代DX10 R600内核开始,AMD就一直使用VLIW5方式,又称5D式,也就是五个流处理器编为一组,但并非所有流处理器都是相同的,其中四个较小、较简单,另一个较大、较复杂做为特殊单元。这种架构设计在硬件方面看有着很高的效率和很深的潜力,但是结构比较复杂,对应的软件编程就很困难,始终难以真正发挥全部实力。
HD5870所采用的VLIW5结构图
6950的VLIW4结构图
如今AMD终于在内核层面翻新为VLIW4方式(4D式),每个编组由四个流处理器、一个分支单元、一个通用目的寄存器组成,其中四个流处理器的整数、浮点执行功能完全相同(不再有T-Unit),可以执行四路并行发射,但是特殊功能占据四个发射位中的三个。
AMD宣称,VLIW4架构有着更好的利用率,能将性能与核心面积比提高10%,简化调度与寄存器管理,逻辑核心也可以很好地重复使用。注意HD6800甚至HD7000的中低端产品依然延续VLIW5架构,AMD没有必要为了宣传高端产品而损害真正决定出货量和毛利率的中低端市场利益,所以这个数据可信度较高。
渲染器后端也进行了升级,支持写入操作合并,16位整数操作提速两倍,32位浮点操作也快了两到四倍。
GPU并行计算方面,新内核最大的亮点就是增加了一个全局异步寄存器,从而支持异步分配,可以同时执行多个计算内核,每个内核都有自己的命令队列与受保护虚拟寻址域。此外还有两个双向DMA引擎(更快的系统内存读写速度)、着色器读取操作合并、LDS(本地数据存储)直接预取、流控制改进、更快双精度操作(单精度的1/5提高到1/4)。
在竞争对手的宣传策略中,曲面细分性能的地位被人为拔高(Compute shader意义更大),但事实上公关手段不高明的AMD,产品设计上却并没有停滞,现在已经发展到了第八代曲面细分单元(Radeon HD 6800、5000系列分别是第七代和第六代)。
Radeon HD 6900配备了两个独立又合作的图形引擎,每时钟周期内都能处理两个原语(Primitive),具备基于区块的负载均衡,转换和隐面消除率翻番。每个图形引擎内都有一个光栅器与一个第八代曲面细分单元,前者每时钟周期内可处理最多32个像素,后者结合用于更高曲面细分等级的片外缓冲,可实现1.5-3倍于Radeon HD 5870的曲面细分性能。
全新内核架构:AA/AF增强画质
画质增强技术方面,AMD每一代新产品都会加入新功能,此番除了形态抗锯齿(MLAA)之外还有增强画质抗锯齿(EQAA)、增强各向异性过滤与纹理过滤。
EQAA其实并不是全新的抗锯齿技术,而是属于多重采样抗锯齿(MSAA)的一种新模式,每像素最多16个覆盖采样点,双倍于标准的MSAA,而且色彩与覆盖采样点的数量可以独立控制,并能够自定义采样模式与过滤器。有趣的是,EQAA兼容自适应抗锯齿(AAA)、超级采样抗锯齿(SSAA)、MLAA,换言之就是能够同时使用,共同改善画质。
AMD宣称,EQAA可以在同等量的显存消耗下带来更好的画质,对性能的影响最多5%。 而MLAA和MSAA搭档合作效果非常好的。
高功耗,高发热、高噪音一直是困扰高端显卡用户的顽疾。GeForce GTX 580引入了硬件电源监控电路,Radeon HD 6900则在Radeon HD 5000/6800系列的基础上又祭出了全新技术“PowerTune”(电源调节),灵活性更胜ATI PowePlay一筹。
电流通过导体或者电子元件都会发热,和中央处理器(CPU)一样,GPU图形核心也会在运行中产生热量,随着功耗的增大而增大。而热设计功耗(TDP)代表稳定运行所需要的最大能量消耗值,该参数受电压、核心频率、工作负载、漏电率、环境温度等多种因素的影响。
之前的ATI PowerPlay技术只是简单地指定了显卡核心与显存频率的两三个等级,分别对应待机、2D负载、游戏和拷机负载等应用。AMD PowerTune技术则是利用显卡上集成的控制处理器来实时监视GPU负载、内部计算GPU功耗,藉此实时动态调整运行频率,从而在满足热设计功耗限制的前提下带来更高的性能和更低的功耗。
除此之外,Radeon HD 6900系列还支持直接控制GPU功耗,不需要再绕过频率和电压调节,并支持AMD OverDrive工具。
以《异形大战铁血战士》游戏为例,默认设置下帧率超过55FPS,很流畅,但功耗也超过了250W;于是将功耗空间降低10%,帧率仍有55FPS左右,实际功耗降至250W之下;再降低20%呢,帧率跌至50FPS,依然足够流畅,功耗却降低至220W多一点,从而在保证游戏体验的前提下节省耗电量。
迄今为止,AMD Eyefinity多屏输出技术已经广泛应用到DX11显卡中,而且有很多不同的多屏配置方式,单卡最多可连接六台显示器。与此同时,通过认证或者准备就绪的Eyefinity兼容游戏、应用软件也达到了69款并不断增加。
下面我们逐项看看蓝宝石这款HD6950 Dirt3的参数规格。
显存部分,配备了DDR5 1GB高速显存,默认核心显存频率为800/5000MHz;在供电部分,该卡采用核心/显存4+1相独立供电,每相供电配以多颗低温MOS管,以确保显卡供电的纯净和充足。
双风扇最大转速3900转/分钟,铜底五热管散热
蓝宝石HD6950 Dirt3版接口也相当丰富,配备HDMI/双DVI/DP接口组合,适合不同用户对接口的需求。
蓝宝石HD6950 Dirt3基于最新的40nm Cayman pro,采用4D图形与计算核心,内建1408个流处理器,支持DirectX11。
从上面的成绩来看,蓝宝石HD6950 Dirt3可以流畅的运行上面几款单机游戏大作。
主流游戏均可开启最高画质并保障流畅的帧速度
除了性能之外,功耗发热和噪音也是大家非常关心的参数,下面我们看看蓝宝石HD6950 Dirt3在空闲和满载下的表现如何。
从测试结果上看蓝宝石HD6950 Dirt3的表现很不错,75℃在HD6950中绝对算是上等。
我们的功耗测试方法是直接统计整套平台的总功耗,既简单、又直观。测试仪器为微型电力监测仪,它通过实时监控输入电源的电压和电流计算出当前的功率,这样得到的数值就是包括CPU、主板、内存、硬盘、显卡、电源以及线路损耗在内的主机总功率(不包括显示器)。
经过测试可以看到蓝宝石HD6950 Dirt3的功耗控制比较理想,和之前的测试比较,稍强于公版。
主动式散热无可避免会产生噪音,这是困扰风冷散热的永恒桎梏。因为测试条件的限制,之前的测试我们只能用耳朵去主观感受。因此也无法对噪音的数值做量化的分析。但随着消费者对生活品质的要求不断提高,电脑噪音污染也是越来越被玩家重视,鉴于此我们对该显卡的噪音进行了测试。
测试我们看到蓝宝石HD6950 Dirt3这款产品待机噪音比较好,而所搭载的散热器在温度升高时转速有所提高,不过这种噪音水平也在可以接受的范围。
蓝宝HD6950 2GB GDDR5 Dirt3显卡采用2GB GDDR5显存规格,显卡采用双BIOS设计,可以实现一键超频功能,默认频率800MHz/5000MHz。显卡散热器方面也采用双风扇设计,更是拥有多达5根8mm纯铜热管,显卡接口方面采用DVI/DVI/HDMI/DP输出模式。作为Dirt3特别发行版显卡,随卡还赠送Dirt3正版激活码,为玩家们第一时间带来最新的Dirt3游戏体验。而相比之前发布的蓝宝HD6950 1GB GDDR5 白金版,在功耗温度噪音方面全面提升。■<