最强性能!华硕HD7870 DCU II TOP测试
泡泡网显卡频道6月26日 伴随Pitcairn GPU的发布,AMD南方群岛三驾马车正式聚首,Pitcairn诞生的两款新品Radeon HD 7870和Radeon HD 7850成功接过Radeon HD 6800的棒,成为新一代性能级显卡中的佼佼者。
作为性能级产品,Radeon HD 7870显卡以其卓越的能效超越了上代Radeon HD 6970,成为市售明星产品,板卡厂商华硕也不遗余力的推出了多款新品,而代表Pitcairn XT扛鼎之作的HD7870-DC2TG-2GD5-V2也已经正式登场,产品默认核心频率高达1100MHz,显存频率也达到了5000MHz的高度。
优秀的能效和出色的性能使得HD7870-DC2TG-2GD5-V2具备强劲的竞争力,为保持最高水准,产品使用了华硕独家超级合金供电和DirectCU II散热,令显卡可以稳定工作在高频率下,并具备良好的静音效果。
相比Radeon HD 5000/6000系列,南方群岛除了工艺从40nm更新到28nm以外,最重大的改变就是采用了全新的GCN架构。
AMD历代GPU的瓶颈除了曲面细分以外,其实最重要的是5D/4D VLIW架构的效率问题。这一痼疾在南方群岛身上终于得以根除,它的流处理器结构已经面目全非了。
通过Pitcairn的整体架构图我们看到,传统的SIMD流处理器阵列消失了,取而代之的是GCN阵列,Pitcairn总计拥有1280个流处理器,现在来看看GCN阵列的微观结构。
GCN阵列微观结构
GCN阵列里有4组SIMD单元,每组SIMD单元里面包括16个流处理器、或者说是标量运算器。GCN架构已经完全抛弃了此前5D/4D流处理器VLIW超长指令架构的限制,不存在5D/4D指令打包-派发-解包的问题,所有流处理器以16个为一组SIMD阵列完成指令调度。简单来说,以往是指令集并行,而现在是线程级并行。
GF100的SM(流处理器簇)微观结构
可以这么理解,一个GCN阵列与GF100当中的一组SM相当,GF100的一组SM当中有4组共计32个流处理器,而Tahiti的一组GCN当中有4组共计64个流处理器。
从线程级别来看,GCN与SM是不可分割的最小单元,GCN一次可以执行64个线程,而SM是48个(其实就是流处理器的数量)。从多线程执行上来看,GCN可以同时执行4个硬件线程,而SM是双线程调度器的设计(参见架构图)。如此来看GCN架构的多线程性能会更好一些。
最后,再来强调一下AMD抛弃5D/4D VLIW改用全新GCN架构的意义。
理想状态下毫不相干的四组线程执行情况
在VLIW的理想情况下,4个线程分别各自独立且毫不相关,可以看到新架构和VLIW的执行情况和类似,理论上效率都是100%。
非理想状态下,条件相关线程延迟执行
但对于VLIW架构来说,不理想的情况就是遇到相关的指令流,比如两个绿色线程,前三个线程可在一个周期内执行,最下方的蓝色只能独立执行。而对于新架构来说,则不存在这样的问题。也就是说,采用硬件调度之后,GCN和SIMD可以允许选择不同的线程乱序执行,这些线程可以来自同一任务,也可以是不同任务。当然,这种“乱序”也不是绝对的,基本的流程还是要遵守的,比如各个线程之间的指令必须按顺序执行,不能打乱也不能分割。
以往的VLIW架构在并行任务处理方面处于劣势,并且很依赖编译器和API的支持,扩展到OpenCL也受到很大限制。经过硬件架构的调整,新的GCN架构在并行计算方面有了很大提高。编译压力减轻,硬件调度的加入使编译器摆脱了调度任务;其次是程序优化和支持语言扩充更见容易;最后是不用在生成VLIW指令和相关调度信息,新架构最底层的ISA也更加简单。
AMD的定位很明确,Pitcairn就是为了游戏而生,在价格方面也更加趋于合理,下面我们看看Radeon HD 7800系列的详细规格。
规格方面Radeon HD 7870基于Pitcairn XT GPU,拥有1280SP,核心频率为1GHz,配备2GB GDDR5显存,显存频率为4800MHz,显存位宽为256Bit。
因为核心面积减小,Pitcairn可以冲击更高的频率,事实上HD7870是显卡史上第一款官方默认核心频率1Gz的显卡,而OC 1.2GHz亦不在话下!我们在催化剂控制中心就可以看到HD 7870的超频上限是1.2GHz,根据惯例这是AMD认为的安全超频频率。
以下都是AMD官方提供的数据,性能方面HD 7870比GTX 570更加强悍!
高频率的核心和2GB显存让多屏游戏的速度也保持在30帧以上
HD 7870的Tessellation性能比HD 6970强出数倍,架构革新的威力可见一斑
HD 7800系列虽然性能强劲,但的功耗控制的依然非常好,尤其是HD 7850,因为设计TDP只有130W,所以只需要一个6Pin供电即可满足需求。
功耗控制优秀,交火效率提升更是接近100%,所以组建双卡平台亦是明智之选。
在即将到来的12.3驱动中,将会支持最新的MLAA2.0技术
SSAA效果示意图
之前HD 7970支持的各项应用,如Eyefinity2.0、AMD AppAcceleration,PCI-E3.0、DX11.1等等,HD7800系列一个不落,照单全收。
AMD在努力:支持GPU计算的软件越来越多
但是AMD还有很长的路要走,硬件虽然很强大、全新的GCN架构也扫清了效率低下障碍,但软件和程序方面还需加把劲。让AMD欣喜的是OpenCL API的发展速度比想象中的还要快,以至于NVIDIA打算部分开放CUDA接口。可以预见的是,未来更多的商业软件将会直接使用OpenCL语言编写,对于GPU实现无差别的硬件加速支持,最终比拼的还是架构与效率。
华硕HD 7870 DirectCU II TOP显卡使用了华硕独家第二代DirectCU II显卡散热器,并配备超级合金供电,超公版的用料设计,使得核心和显存超频性能更加出色。
规格方面,华硕HD7870 DirectCU II TOP显卡基于Pitcairn XT GPU,拥有1280个流处理器,核心频率为1100MHz,配备2GB GDDR5显存,显存频率为5000MHz,显存位宽为256Bit。
核心、显存采用了独立式供电,供电相数为6+2,全面使用了超级合金供电,提供2.5倍使用寿命,工作温度下降35摄氏度。
Pitcairn XT GPU 海力士GDDR5显存
显存编号为H5GQ2H24MFR,单颗容量为2Gb,位宽为32Bit,8颗组成2GB 256bit,该显存理论工作频率可达6000MHz。
新版DirectCU II散热器,内置3根8mm热管,采用了贯穿式设计,进一步增强显卡的导热性能,而配备的双风扇也可以更迅速的将热量带走,确保显卡静音和低温,相比公版温度降低20%。
IO接口方面也是十分完备,提供了2个DVI接口、1个HDMI接口和1个DisplayPort接口,接驳多屏显示输出非常方便。
附件方面包括4pin-6pin电源线、DVI-VGA转接头、CrossFire桥、安装光盘和说明书,另外显卡还随盒赠送一块独家《暗黑3》主题鼠标垫。
测试平台使用了Intel Core i7 2700K处理器,Core i7 2700K采用了四核八线程设计,默认频率为3.5GHz,Turbo可到3.9GHz,TDP为95W。
泡泡网显卡频道测试平台 | |
硬件配置 | |
---|---|
处理器 | Intel Core i7 2700K (4C8T,L3=8MB,3.5-3.9GHz) |
主板 | Gigabyte GA-Z77M-D3H (Intel Z77) |
内存 | Samsung 4GB DDR3-1600 x2 (9-9-9-24 1T) |
固态硬盘 | OCZ Vertex 3 Max IOPS 240GB |
电源 | Antec TPQ-1000 |
显示器 | Dell UltraSharp U2312HM |
软件配置 | |
操作系统 | Windows 7 Ultimate SP1 64bit |
显卡驱动 | Catalyst 12.4 WHQL |
测试成绩方面,基准测试基于自带Benchmark,游戏部分采用了Fraps纪录平均帧数。
● 测试平台实拍
● 测试平台主板:技嘉GA-Z77M-D3H
技嘉GA-Z77M-D3H主板基于Intel Z77芯片组,全面支持22nm Ivy Bridge处理器,同时向下兼容Sandy Bridge处理器,mATX的板型设计和全功能接口使得主板非常适合组件HTPC。
● 测试平台电源:Antec TPQ-1000
Antec TPQ-1000(TruePower Quattro-1000)电源可以满足最严格的电脑规格需求,产品符合80PLUS的认证,使高效率的Quattro比同规格的电源节省了33%的能源;4组12V接线的设计,让使用者的电脑比以往更加稳定;4组PCI-E的接线,让使用者能顺利运行最新一代的显示卡设置,除此之外,标有明显著称的模组化接头以及电源供应器的赛车条纹外观让使用者能保持着干净的系统内部设置以及专业又个性的风格。
● 测试平台SSD:OCZ Vertex 3 Max IOPS 240GB
OCZ的Vertex系列属于它的高端固态硬盘,专为高端玩家和存储发烧用户设计。随着SandForce控制器大红大紫,OCZ也将Vertex系列升级到了全新的SF-2200方案。如今SATA 6Gbps接口大行其道,OCZ推出了基于SF2200系列主控芯片的Vertex 3 Max IOPS系列固态硬盘,产品涵盖60-480GB容量范围。
3DMark11的测试重点是实时利用DX11 API更新和渲染复杂的游戏世界,通过六个不同测试环节得到一个综合评分,藉此评判一套PC系统的基准性能水平。
● 3DMark 11的特色与亮点:
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面细分、计算着色器、多线程。
2、原生支持64bit:原生64位编译程序,独立的32位、64位可执行文件,并支持兼容模式。
3、全新测试场景:总计六个测试场景,包括四个图形测试(其实是两个场景)、一个物理测试、一个综合测试,全面衡量GPU、CPU性能。
4、抛弃PhysX,使用Bullet物理引擎:抛弃封闭的NVIDIA PhysX而改用开源的Bullet专业物理库,支持碰撞检测、刚体、软体,根据ZLib授权协议而免费使用。
3DMark 11 Extreme模式测试中,成绩为X2207,相比公版的X2023提升了约12.2%。
Unigine Heaven 3.0是一款基于DX11的测试DEMO,在测试DirectX 11显卡性能在扮演着重要角色,支持DirectX 9、10、11,并新增对OpenGL的支持,并进一步加重了tessellation负担,游戏支持高级SSAO技术,并能精确物理模拟的容积云和带有光线散射的动态天空。
Unigine Heaven 3.0全面支持NVIDIA 3D Surround立体环绕系统,添加了跨平台启动器,不再依赖.NET,改善了对对多屏系统的支持和增强NVIDIA 3D Vision立体技术支持。
Heaven Benchmark 3.0曲面细分测试成绩为85.9fps。
《孤岛危机》是一款科幻题材的第一人称射击游戏,此游戏由德国游戏开发商Crytek制作开发,并由美国艺电发行,是孤岛危机三部曲的第一部。《孤岛危机》的背景发生在一群外星机器的船舰在地底被发现,玩家扮演三角洲特种部队中暴龙小队的成员──诺曼(Nomad)进行搜索和撤离的任务。
地球2019年:一颗庞大的小行星在地球坠毁。朝鲜政府迅速封锁了事发岛屿,并且声称这颗小行星归属朝鲜。美国也立即派遣了一个三角洲精英小组前往观察形势。就在美朝政府关系日益紧张之际,神秘的小行星突然爆开,飞出一只高度2km的超大外星飞船。这只飞船制造出一个庞大的圆形力场,冻住了小岛的大部分地区,并且极大地改变了地球气候。外星人开始入侵地球。随后,昔日的敌人变成了盟友,美朝两国开始联手抵御外星人的进攻,拯救人类的命运。玩家将在游戏中带领一个爆破小组进入茂密的热带雨林,残酷的冰封之地,最终进入外星飞船的心脏地带和异型展开殊死搏斗。
经典的《孤岛危机》使得这款显卡在流畅运行游戏之外,并没有多少性能冗余,平均帧率为49.2fps。
《战地3》是一款由EA DICE工作室(EA Digital Illusions CE)开发制作、EA出版发行的第一人称射击游戏。游戏使用寒霜2引擎,该引擎也是“战地”系列首款全面支持DirectX11技术的引擎,并向下兼容DirectX 10,不支持Windows Vista以下的操作系统。
《战地3》是《战地2》的正统续作,是EA《战地》系列的第十一部。PC版多人模式支持高达64人网络对战,主机版则最大支持24人。
《战地3》实际测试中平均帧率达到了64.3fps,相比公版提升了7.9%。
《地铁2033》描述了西元2033年,由于核战爆发,整个世界都笼罩在辐射之下,人类几乎死尽。仅存的人类躲藏在莫斯科的地铁站里挣扎求生,布满辐射尘的地表已为各种变种生物所占据,地底的列车站台成了人们最后的聚集地。人类的生存空间在那些日益增多的变种生物的威胁下一天天缩小,人类几乎绝迹。
故事的主角阿尔乔姆是核爆后出生的生存者,他的兴趣是收集战前的风景明信片,梦想地表的模样;某日,一起突如其来的事件迫使阿尔乔姆踏上旅途,前往其他的站台求援,以拯救自己居住的地铁站以及最后人类的命运……一个掌握着人类命运的青年即将踏上未知的冒险之旅,寻找拥有拯救人类的力量的英雄。
硬件杀手《地铁2033》游戏中,华硕HD 7870 DirectCU II TOP显卡也未能幸免,依然徘徊在流畅运行边缘,平均帧率为26.6fps。
《使命召唤:现代战争3》(Call of Duty : Modern Warfare 3)是美国动视暴雪旗下“现代战争”系列的第三部作品。游戏由Sledgehammer Games、Infinity Ward、Raven Software联手制作。
《现代战争3》是《现代战争2》的续篇,本作将会揭晓“现代战争”系列主角的去向与秘密。全新角色、新科技冷武器、更加浩大的战争场面,《使命召唤:现代战争3》将会带领玩家体验到更加真实的现代战争。
《现代战争3》对硬件要求并不高,最高画质并开启4AA情况下,平均帧率依然高达125.4fps。
自《孤岛惊魂》系列的版权被UBI购买之后,该公司蒙特利尔分部就已经开始着手开发新作,本作不但开发工作从Crytek转交给UBI,而且游戏的故事背景也与前作毫无关系,游戏的图形和物理引擎由UBI方面完全重新制作。
借助于蒙特利尔工作室开发的全新引擎,游戏中将表现出即时的天气与空气效果,所有物体也都因为全新的物理引擎,而显得更加真实。你甚至可以在游戏中看到一处火焰逐渐蔓延,从而将整个草场烧光!而且首次对DX10.1提供支持,虽然我们很难看到。
《孤岛惊魂2》游戏平均帧率为81.2fps,性能领先公版显卡不少。
超频测试使用了华硕自家的GPU Tweak超频工具,产品支持核心、显存频率调节、核心电压和风扇转速调节,为玩家提供丰富的超频选择。
除了超频功能,GPU Tweak还集成了GPU信息查询、BIOS更新和游戏视频录制。
实际测试中,将核心频率提升至1250MHz、显存5500MHz,核心电压1.3V的情况下顺利通过了3DMark 11的测试,最终得分为X2477,相比默认频率提升了12.2%,相比公版更是达到了22.4%。
得益于DirectCU II优秀的散热,HD7870 DirectCU II TOP即使默认频率大幅提升,温度控制依然非常出色。
显卡待机温度仅29摄氏度,值得注意的是,长时间待机后显卡风扇会停止运转,进一步降低噪音。而采用Furmark拷机测试中温度最高为68摄氏度。
功耗测试中,待机和满载系统功耗分别为67W和232W。整个测试下来,华硕HD7870 DirectCU II TOP显卡出色的性能显露无遗,面对绝大多数3D游戏,在全高清分辨率最高画质下都可以流畅的运行,成为性能级显卡中的佼佼者。
强大性能的背后,自然少不了优秀的设计和做工,超公版供电规格、新版DirectCU II散热器都为其默认超频奠定了坚实的基础,而通过后续的进一步挖掘,我们发现,HD7870 DirectCU II TOP远不止1100MHz的核心频率,风冷情况下可以稳定在核心1275MHz、显存5500MHz的水平,此时3DMark 11 Extrme得分高达X2477,已经超越了Radeon HD 7950的表现。
即使在面对大幅度超频后,显卡借助于DirectCU II散热器依然将显卡温度控制在合理的范围内,待机是仅29摄氏度,而满载也只有68摄氏度,非常安全。细心的读者已经发现这一温度相比公版显卡还要低出不少。
作为主打性能、散热卖点的DirectCU II TOP系列显卡,HD7870 DirectCU II TOP成功达到了这一要求,这也正是性能级玩家所需要的,而现在我们要做的就是静待显卡的上市。■<