多屏游戏利器!蓝宝Flex系列双雄评测
泡泡网显卡频道5月12日 合理的目标与顺利的执行是一款优秀的产品的必要条件。从HD5000开始,AMD的产品线趋于完善。HD5800系列所使用的Cypress核心是一颗不大不小的GPU,AMD在40nm工艺尚未完全成熟的情况下,制造出了一颗拥有21.5亿晶体管的芯片,拥有非常不错的性能,而且功耗发热控制以及良品率都比较理想。
Cypress作为一颗一年前的核心来说,它已经非常成功了。但如果以现在的眼光来看的话,Cypress核心有点儿高不成低不就的感觉,它的性能做为旗舰显卡来说不够强大,作为中端显卡来说成本又太高了。
HD5000产品线细分方案
于是AMD在设计新一代产品的时候,对GPU做进一步的细分,高端造一颗比Cypress更大的核心,代号为Cayman;中端造一颗比Cypress略小的核心,代号为Barts;
作为AMD核心合作伙伴,蓝宝石近日又发布了Flex版的HD6870和HD6950,此举将给企业多屏游戏性能水平带上一个新的台阶。大多数的显卡支持第三屏显示输出是都采用了AMD的Eyefinity技术,但这台显示器的接口必须是DisplayPort。蓝宝石推出的FleX家族显示器支持Eyefinity模式下3台DVI显示器,不需要高昂的代价就可以创术一组真实的SLS (Single Large Surface)工作窗口。需要说明的是,其中的两台显示器是通过显卡的原生DVI连接,而第三台显示器则是通过显卡的HDMI转DVI连接,今天我们评测的对象正是这两款产品。
合理的目标与顺利的执行是一款优秀的产品的必要条件。 在Cayman Radeon HD 6900系列身上,AMD提出了四大目标:高效的图形与计算架构、强大的几何性能、新的画质技术、新的能效与功耗管理。
为了实现高效的图形与计算架构,AMD该用了重新定义的VLIW4架构,同时还引入了双图形引擎、更多SIMD引擎与纹理单元、升级的渲染后端、更高的显存带宽、新的GPU计算技术。
VLIW全称为Very Long Instruction Word,意思是超常指令字架构,是一种非常长的指令组合,通过把许多条指令连在一起来增加运算的速度。从第一代DX10 R600内核开始,AMD就一直使用VLIW5方式,又称5D式,也就是五个流处理器编为一组,但并非所有流处理器都是相同的,其中四个较小、较简单,另一个较大、较复杂做为特殊单元。这种架构设计在硬件方面看有着很高的效率和很深的潜力,但是结构比较复杂,对应的软件编程就很困难,始终难以真正发挥全部实力。
HD5870所采用的VLIW5结构图
6950的VLIW4结构图
如今AMD终于在内核层面翻新为VLIW4方式(4D式),每个编组由四个流处理器、一个分支单元、一个通用目的寄存器组成,其中四个流处理器的整数、浮点执行功能完全相同(不再有T-Unit),可以执行四路并行发射,但是特殊功能占据四个发射位中的三个。
AMD宣称,VLIW4架构有着更好的利用率,能将性能与核心面积比提高10%,简化调度与寄存器管理,逻辑核心也可以很好地重复使用。注意HD6800甚至HD7000的中低端产品依然延续VLIW5架构,AMD没有必要为了宣传高端产品而损害真正决定出货量和毛利率的中低端市场利益,所以这个数据可信度较高。
渲染器后端也进行了升级,支持写入操作合并,16位整数操作提速两倍,32位浮点操作也快了两到四倍。
GPU并行计算方面,新内核最大的亮点就是增加了一个全局异步寄存器,从而支持异步分配,可以同时执行多个计算内核,每个内核都有自己的命令队列与受保护虚拟寻址域。此外还有两个双向DMA引擎(更快的系统内存读写速度)、着色器读取操作合并、LDS(本地数据存储)直接预取、流控制改进、更快双精度操作(单精度的1/5提高到1/4)。
现在AMD也对新一代中端产品做了诸多改良,我们一起来看看。下图为AMD官方公布的Bart(HD6870/6850)核心架构图,看上去和Cypress(HD5870/5850)并无太大区别,整体依然沿用了自R600(HD2900XT)以来的SIMD(单指令多数据流)架构,流处理器部分没有太多改进,历代产品的改进都是集中在周边控制模块上面。
★ Barts(HD6870)核心架构图
★ Cypress(HD5870)核心架构图
从Cypress到Barts最明显的改变就是,SIMD阵列从原来的20组降为14组,这样流处理器数量就从1600(20x16x5)个减至1120(14x16x5)个,正好与现有HD5830的流处理器数量相等。
也就是说Barts相比Cypress,流处理器数量是70%,晶体管规模是79%,芯片面积是68%。从晶体管规模上看,Barts的确要比Cypress Mini不少,那HD6870又有何德何能享此title呢?
在竞争对手的宣传策略中,曲面细分性能的地位被人为拔高(Compute shader意义更大),但事实上公关手段不高明的AMD,产品设计上却并没有停滞,现在已经发展到了第八代曲面细分单元(Radeon HD 6800、5000系列分别是第七代和第六代)。
Radeon HD 6900配备了两个独立又合作的图形引擎,每时钟周期内都能处理两个原语(Primitive),具备基于区块的负载均衡,转换和隐面消除率翻番。每个图形引擎内都有一个光栅器与一个第八代曲面细分单元,前者每时钟周期内可处理最多32个像素,后者结合用于更高曲面细分等级的片外缓冲,可实现1.5-3倍于Radeon HD 5870的曲面细分性能。
全新内核架构:AA/AF增强画质
画质增强技术方面,AMD每一代新产品都会加入新功能,此番除了形态抗锯齿(MLAA)之外还有增强画质抗锯齿(EQAA)、增强各向异性过滤与纹理过滤。
EQAA其实并不是全新的抗锯齿技术,而是属于多重采样抗锯齿(MSAA)的一种新模式,每像素最多16个覆盖采样点,双倍于标准的MSAA,而且色彩与覆盖采样点的数量可以独立控制,并能够自定义采样模式与过滤器。有趣的是,EQAA兼容自适应抗锯齿(AAA)、超级采样抗锯齿(SSAA)、MLAA,换言之就是能够同时使用,共同改善画质。
AMD宣称,EQAA可以在同等量的显存消耗下带来更好的画质,对性能的影响最多5%。 而MLAA和MSAA搭档合作效果非常好的。
高功耗,高发热、高噪音一直是困扰高端显卡用户的顽疾。GeForce GTX 580引入了硬件电源监控电路,Radeon HD 6900则在Radeon HD 5000/6800系列的基础上又祭出了全新技术“PowerTune”(电源调节),灵活性更胜ATI PowePlay一筹。
电流通过导体或者电子元件都会发热,和中央处理器(CPU)一样,GPU图形核心也会在运行中产生热量,随着功耗的增大而增大。而热设计功耗(TDP)代表稳定运行所需要的最大能量消耗值,该参数受电压、核心频率、工作负载、漏电率、环境温度等多种因素的影响。
之前的ATI PowerPlay技术只是简单地指定了显卡核心与显存频率的两三个等级,分别对应待机、2D负载、游戏和拷机负载等应用。AMD PowerTune技术则是利用显卡上集成的控制处理器来实时监视GPU负载、内部计算GPU功耗,藉此实时动态调整运行频率,从而在满足热设计功耗限制的前提下带来更高的性能和更低的功耗。
除此之外,Radeon HD 6900系列还支持直接控制GPU功耗,不需要再绕过频率和电压调节,并支持AMD OverDrive工具。
以《异形大战铁血战士》游戏为例,默认设置下帧率超过55FPS,很流畅,但功耗也超过了250W;于是将功耗空间降低10%,帧率仍有55FPS左右,实际功耗降至250W之下;再降低20%呢,帧率跌至50FPS,依然足够流畅,功耗却降低至220W多一点,从而在保证游戏体验的前提下节省耗电量。
迄今为止,AMD Eyefinity多屏输出技术已经广泛应用到DX11显卡中,而且有很多不同的多屏配置方式,单卡最多可连接六台显示器。与此同时,通过认证或者准备就绪的Eyefinity兼容游戏、应用软件也达到了69款并不断增加。
蓝宝石HD 6950 FleX版是一款性能非常高的显卡,另外它还允许用户使用低成本的DVI显示器组建三屏显示。超过三屏以外的显示器则必须通过DisplayPort接口连接。这意味着只需要蓝宝石HD 6950 FleX版就可以搞定5屏及以下多显示器集联。(6屏需要DP hub)
相对于标准版的HD 6950,蓝宝石的HD 6950 FleX版除了拥有真实的DX 11兼容和强大的1408个流处理器单元,以及88个材质处理单元外,还拥有800MHz的核心频率和1250MHz的显存频率(等效5GHz),给用户带来愉悦的体验。
双BIOS允许爱好者体验内部BIOS设置,另外通过蓝宝石独家的TriXX超频工具可以大幅度的提高显卡的性能,散热采用了蓝宝石的Vapor-X技术,蓝宝石HD 6950 FleX版不仅拥有强大的散热性能,也可以根据显卡的负载运行在较低的速度上。
蓝宝石HD6950 flex版规格详解如下图所示
另一款flex家族产品蓝宝石HD6870也是同步上市,主打中端市场,采用的Barts XT核心为40nm制程,拥有1120个流处理器,搭载256bit位宽的1GB GDDR5,拥有可以流畅运行大多数游戏大作。
外观和之前发布的HD6950白金版有些神似
核心频率900MHz,显存频率4200MHz
直吹式风扇配合8MM热管纯铜底座散热鳍片,可以有效为显卡降温
这款显卡同样直接支持5屏的同时输出
测试平台我们选择了最新的SNB平台,i7 2600K+P67(完美B3步进)+双通道这样的组合,内存使用了口碑不错的CORSAIR(海盗船)DDR3 1600 4GB(2GB×2条)。Intel新酷睿无论是性能,功耗,还是内存带宽等方面,都要比上代的产品更加优秀,服役已久的i7 870终于可以光荣退伍了。
● 详细配置如下表
PCPOP.COM评测室 | |
硬件系统配置 | |
处理器 |
Intel Core i7 2600 |
(4核 / 8线程 / 100MHz*34=3.4GHz / 8MB共享缓存) | |
主 板 |
ASUS P8P67 |
(Intel SandyBridge +Realtek ALC889 8声道音效芯片) | |
内 存 |
DDR3 1600 4GB(2GB×2条) |
(9-9-9-24-1T) | |
硬 盘 |
日立 7200.12 SATA |
(1TB / 7200RPM / 32M缓存 / 30GB NTFS系统分区) | |
电 源 |
Tagan BZ1100W |
六路+12V联合输出功率960W,单路+12V最大电流20A | |
显示器 |
DELL 3007 |
(30英寸LCD / 2560*1600分辨率) |
操 作 系 统 | |
操作系统 |
Microsoft Windows 7 |
(中文版 / 64BIT 旗舰版) |
在主流的游戏和测试软件中,我们发现HD6950比HD6870性能高出10%到20%,在一些显存要求苛刻的游戏中,2GB的HD6950更是优势明显。总的来说蓝宝石的这两款显卡因为频率和公版相同,成绩基本一致,所以没有再行比较。
性能固然是显卡优劣的重要标准,发热功耗噪音也是不容忽视,这里我们对这些特性也做了全方位的测试,成绩如下:
● 温度测试:
虽然HD6870规格较低,但是温度测试中还要比HD6950高一点。看来频率较高,加上散热的不同都是造成这一结果的原因。
● 显卡功耗测试:
SNB平台非常省电,尤其是Furmark中只是显卡满载,CPU基本空置,所以测试成绩非常理想,两款显卡都没有超过250W。
● 显卡噪音测试:
对于这个级别的显卡,满载情况下60分贝的噪音算是比较正常的,我们看到HD6950比HD6870噪音略低。
总结:
HD5000系列的标准接口配置是双Dual-Link DVI、DisplayPort、HDMI,其中两个DL-DVI占据了4个显示通道,DP和HDMI各一个,这样就把Eyefinity的6个通道都用完了。
而HD6950和HD6870则是一个Dual-Link DVI、一个Single-Link DVI、HDMI、两个Mini-DP。外观上是把一个普通DP替换成了两个Mini-DP,实际上是从原来的DL-DVI中拆分出来了一个显示通道,多做了一路DP输出。这样做的好处就是,一片显卡可以直接接驳任何类型的数字显示设备而不需要转接,另外所有六个显示通道都可以直接输出,而不需要购买专用的6-DP特殊版显卡。多屏设置和感受参见《1台电脑多人用!多屏输出另类功能详解》。
对于组建多屏的玩家来说HD6950 2GB Flex非常合适。而对于注重性价比的玩家来说,HD6870则更具优势。■<