28nm新卡皇!Radeon HD 7970全面评测
泡泡网显卡频道12月23日 北京昨天中午1点,AMD正式全球发布了新一代南方群岛,首批型号包括Radeon HD 7970和Radeon HD 7950两款产品,产品全面进化到28nm,采用了全新的GCN(Graphics Core Next)架构。
南方群岛旗舰系列Radeon HD 7970显卡采用了全新的28nm工艺,晶体管数量一跃43亿,新的GCN架构也是专为图形计算而设计的架构,384Bit显存位宽的引入一改256Bit当道的局面,带宽轻松达到200GB/s。
相对于PCI-E 2.0,PCI-E 3.0提升一倍,PCI-E x16可以实现高达32GB/s的传输带宽,目前Intel X79以及明年即将发布的Ivy Bridge也将实现对其的支持。Radeon HD 7970成为全球首款支持PCI-Express 3.0显卡,同时也率先支持DirectX 11.1,相对于现有的DirectX 11更进一步。
由于运输的问题,目前中国大陆还没有收到AMD的送测样卡,产品正式送测要等到1月9日产品同步上市,本文编译自anandtech的测试。
更多Radeon HD 7970官方规格介绍和性能参数请参考:
产品布局方面AMD依然走了先高端后低端的路线,首批旗舰级芯片Tahiti将演化为Tahiti XT的Radeon HD 7970和Tahiti PRO的Radeon HD 7950显卡。
而在次一级AMD还将推出Pitcairn、Cape Verde两款GPU,其中Pitcairn将会生成Radeon HD 7870和Radeon HD 7850两款产品,成为中高端领域的主力,而Cape Verde对应的Radeon HD 7770和Radeon HD 7750两款产品作为南方群岛的中流砥柱,将成为市场主流明星产品。
规格方面Radeon HD 7970采用了Tahiti XT GPU,拥有2048个流处理器,128个纹理单元和32个光栅单元,默认核心频率为925MHz,相对上代的Radeon HD 6970的880MHz更进一步。
显存方面并没有使用传说中的XDR2显存,继续使用了GDDR5显存,显存频率为5500MHz,和Radeon HD 6970保持一致,而为了满足显卡计算带宽的需要,Radeon HD 7970将成熟依旧的256Bit显存控制器依然抛弃了,新的384Bit显存控制器,使得带宽提升了50%,可以很好的满足数据传输的需求。
不得不说的在定价方面,AMD前卫了一次,549美元的定价以及国内4699元人民币的定价,刷新了今年来单GPU上市的记录,当然作为旗舰产品,Radeon HD 7970不会以走量来布局,选购的用户仅限于极限发烧用户。
虽然晶体管数量一跃到43.1亿,相对于Radeon HD 6970的26.4亿提升了63%,不过由于采用了全新的TSMC 28nm工艺,核心面积并没有出现增长,相反还出现了些许的下降。
而在功耗控制方面,一方面由于采用了全新的28nm工艺,另外AMD还引入了ZeroCore Power技术,待机功耗低至3W,创造了性能级显卡待机功耗的新纪录,而在本文后续的测试中可以得到完整的体现。
另外AMD还将ZeroCore Power技术引入到了多显卡CrossFire当中,系统平台中在非极限负载模式下,将会关闭其中的一些显卡,仅保留一款显卡工作,满足性能需求的同时,功耗也得到了急剧的下降。
而在超频方面,借助VISION Engine控制中心,1GHz能够轻松实现,风冷下最大化超频更是可以达到核心1.35GHz的好成绩,同时显存6500MHz也能够很轻易的实现。
除了引入全新的GCN架构,南方群岛也带来了新的AMD Eyefinity 2.0技术和AMD App Acceleration技术,将多屏扩展和应用程序加速更好的满足用户的使用需求。
新的AMD Eyefinity 2.0技术全面支持DisplayPort 1.2标准和HDMI 1.4a标准,同时还加入了Color Correction颜色校正技术,而多屏扩展方面还引入了多组音视频流技术,只需一块显卡就可以实现多路视频语音会话。
另外相对于Eyefinity技术,新的Eyefinity 2.0可以扩展高达16K*16K分辨率显示输出,能够拥有更大的显示视野。
同时为了满足多屏扩展用户随心定制桌面的要求,新的Eyefinity 2.0允许用户定义主显示桌面的排列位置,不再单一的居左显示,增强了多屏扩展的可玩性。
APP加速方面,最早起源于高清硬件解码,随后扩展到各种应用程序,提高用户使用体验,全新设计的Video Codec Engine(VCE)视频编码引擎,扩展了UVD的通用性,同时支持音视频实时混合和无线显示技术。
UVD高清视频解码方面,新的YUVD扩展支持MVC(Multi-View Codec)和MPEG-4/Divx格式视频解码,同时在原双流(HD+SD)视频的基础上支持双流(HD+HD)视频解码。
新的QSAD能够提供10倍速率的图像增强处理,同时新的Steady Video 2.0能够更好的加速和处理抖动的视频。
应用程序加速扩展了对浏览器、视频处理等主流应用的支持,包括Microsoft IE、FireFox、Chrome、Adobe Flash Player、Silverlight、Microsoft PowerPoint、Google Earth等。
点击可查看高清大图
点击可查看高清大图
Tahiti GPU
测试平台选择了Intel新一代Sandy Bridge-E,CPU自然是Intel Core i7-3960,为了避免CPU的瓶颈,将CPU超频至4.3GHz,主板选取了EVGA X79 SLI,内存为G.Skill Ripjaws DDR3-1866 4 x 4GB组合,内存时序为8-10-9-26。
对比测试的显卡包括Radeon HD 3870、 Radeon HD 4870、 Radeon HD 5850、Radeon HD 5870、Radeon HD 6950、Radeon HD 6970、Radeon HD 6990,而NVIDIA阵营方面包括GeForce 8800GT、GeForce GTX 285、GeForce GTX 470、GeForce GTX 570、GeForce GTX 580、GeForce GTX 590。
系统选择Windows 7 Ultimate 64-bit,NVIDIA驱动选择了最新发布的ForceWare 290.36 Beta,而AMD显卡方面则选择了Catalyst Beta 8.921.2-111215a。
● 孤岛危机:弹头
《孤岛危机:弹头》是由德国Crytek Studios开发,美国艺电(EA)发行的一部孤岛危机正统续作。玩家将在游戏中继续借助Nanosuit与外星种族展开最后的生死搏斗,与众多新增角色一同进行惊心动魄的冒险之旅。此作将全面强化Nanosuit作战服的崭新能力与操作体验,新加入的“Advanced AI”技术将把游戏互动体验提升到一个史无前列的巅峰高度。
不得不说硬件发展到现在,《孤岛危机:弹头》依然是单GPU显卡的杀手,整个测试分为六个对比部分,画质分为2560*1600、1920*1200和1680*1050,在1680*1050分辨率下几乎所有的主流显卡都可以流畅的运行游戏,此时Radeon HD 7970的成绩为86.7,领先GeForce GTX 580 13.9FPS。
随着游戏分辨率的提升在2560*1600分辨率下,Radeon HD 7970成为唯一一款能够流畅运行《孤岛危机:弹头》的单GPU显卡,游戏最小帧速为23.5FPS。
● 地铁2033
《地铁2033》描述了西元2033年,由于核战爆发,整个世界都笼罩在辐射之下,人类几乎死尽。仅存的人类躲藏在莫斯科的地铁站里挣扎求生,布满辐射尘的地表已为各种变种生物所占据,地底的列车站台成了人们最后的聚集地。人类的生存空间在那些日益增多的变种生物的威胁下一天天缩小,人类几乎绝迹。
故事的主角阿尔乔姆是核爆后出生的生存者,他的兴趣是收集战前的风景明信片,梦想地表的模样;某日,一起突如其来的事件迫使阿尔乔姆踏上旅途,前往其他的站台求援,以拯救自己居住的地铁站以及最后人类的命运……
一个掌握着人类命运的青年即将踏上未知的冒险之旅,寻找拥有拯救人类的力量的英雄。
测试成绩和《孤岛危机:弹头》相似,在最高分辨率下,Radeon HD 7970再次突破30FPS,达到36FPS,成为首款单GPU流畅运行《地铁2033》的显卡。
● 尘埃3
作为经典越野赛车系列新作,Codemasters声称《尘埃3》要打造“有史以来最大型的拉力赛游戏”,《尘埃3》采用与《F1 2010》同样的Ego引擎,拥有更加拟真的天气系统及画面效果。
游戏将包含冰雪场景、动态天气、YouTube上传、经典的赛车、分屏对战、party模式、开放世界、更多真实世界中的赞助商和车手等特点。
在全新的生涯模式,强调了团队合作的元素,玩家可以以专业赛车手的身份开始新的生涯模式参加充满挑战性的越野赛道。除了传统的拉力赛以外,游戏还提供挑战赛,该模式中限制了车辆的控制,使比赛更需要技巧。融合众多现代和经典赛车,所有的赛车模型会比以往的作品更加细致。《尘埃3》包含从挪威的阿斯彭到蒙特卡罗到非洲平原的超过100条赛道。届时将会让玩家体验到一款全新的赛车盛宴。
《尘埃3》整个测试过程中相对比较平稳,在1680*1050分辨率下,Radeon HD 7970表现并不出色,不过随着游戏分辨率的提升,在极致2560*1600分辨率下转败为胜,再一次成为单GPU王者。
● 全面战争:幕府将军2
《全面战争:幕府将军2》游戏时代设定在十五世纪的日本战国时代,这个时候的日本被众多大名把持着,各大名之间为了争夺土地和日本的统治权,互相讨伐不断,这给游戏提供了充分的素材,游戏中。你的任务就是扮演一名战国时代的大名,培植亲信,建立军队,通过外交、经济、暗杀等手段,逐步达到你的目的——作为胜利条件,你的目的有四个:消灭你的敌对家族;让你的家族存活七十年;占领日本四十个藩国;统一日本。
在1680*1050和1920*1200分辨率下,Radeon HD 7970一如流畅的运行整个游戏,不过在分辨率调整到2560*1600分辨率时,意外发生了,Radeon HD 7970帧速瞬间下降到28.2FPS,仅能勉强流畅运行游戏,而GTX 580帧速更是低至21.8FPS已经严重制约了游戏的流畅运行。
● 蝙蝠侠:阿甘之城
《蝙蝠侠:阿甘之城》仍然建立在《阿甘疯人院》的气氛上,不过这次上升至阿甘之城——高谭市内戒 备森严的,关押了大量暴徒的监狱之中。而且新作还汇集了众多明星参与的配音阵容以及蝙蝠侠中的极度凶残的恶棍,并改进和加强了一游戏特点,让玩家们拥有像《蝙蝠侠前传2:黑暗骑士》一般的终极游戏体验。
《蝙蝠侠:阿甘之城》是刚刚登陆北美的另一游戏新作,对硬件要求较高,特别是在2560*1600分辨率下,很多显卡都不能够流畅运行游戏,GTX 580和Radeon HD 7970不再淘汰之列,而Radeon HD 7970再一次以18%的优势领先GTX 580。
● 传送门2
《传送门2》是一款以Source引擎制作的FPS游戏,为经典第一人称解密游戏《传送门》的续作。续作中添加多种道具以及全新的环境,剧情紧接一代游戏。
传送门,是对门的广义延伸,这个门连接的不在是里外的空间,而是连接整个3维乃至多维空间。通过传送门,可以将人或物瞬间传送到特定或指定的地点或空间,是一种及其快捷的传输工具。但由于许多技术问题,现在的传送门还只是个概念,只能在电影、动画及游戏中实现。
《传送门2》这款游戏相对来说对显卡要求较低,所以省去了1680*1050分辨率的测试环节,另外测试分别使用了两种抗锯齿模式MSAA(多重取样抗锯齿模式)和SSAA(超级取样抗锯齿模式)。
多重取样抗锯齿模式测试环境下,游戏可玩性非常高,即使8800GT这种古老的显卡也能在1920*1200分辨率下流畅运行游戏,不过改用超级取样抗锯齿模式后,所有显卡测试成绩都急剧下滑,在2560*1600分辨率下,Radeon HD 6950也只能勉强流畅运行游戏,而此时Radeon HD 7970以44.9继续担当单卡王,不过与GTX 480的差距缩小到3.8FPS,领先优势不是十分明显,二者接口流畅运行。
● 战地3
《战地3》是一款由EA DICE工作室(EA Digital Illusions CE)开发制作、EA(美国艺电)出版发行的第一人称射击游戏。游戏使用寒霜2引擎,不支持Windows Vista以下的操作系统。《战地3》是《战地2》的正统续作,是EA《战地》系列的第十一部。PC版多人模式支持高达64人网络对战,主机版则最大支持24人。
《战地3》这款号称硬件杀手的游戏并没有给Radeon HD 7970带来什么压力,2560*1600分辨率下,Radeon HD 7970依然高达49.7FPS,而此时的GTX 480成绩为44FPS,领先幅度约13%。
● 星际争霸2
《星际争霸2》是由暴雪在2010年7月27日推出的一款RTS即时战略类游戏,作为《星际争霸》的续篇讲述了人族、星灵和异虫三族的故事。《星际争霸Ⅱ》将以三部曲的形式推出,即Wings of Liberty、Heart of the Swarm和Legacy of the Void。
暴雪《星际争霸2》对于Radeon HD 7970依然比较多余,2560*1600、1920*1200和1680*1050分辨率Radeon HD 7970一致保持10FPS+的成绩领先GTX 580,稳坐单GPU王座。
● 文明5
由Firaxis开发的《文明5》将会带来一个全新的战斗系统、更深层次的外交互动,一系列的新特性可以让玩家沉浸在建立自己的王国并征服世界的喜悦中。
可能对玩家来说最大的惊喜在于《文明》提供了更深入的策略、更真实的游戏体验和逼真的游戏环境。游戏使用的是一个全新的引擎,能够使玩家最大程度地感受到《文明》系列游戏的魅力。外交系统将全屏展现,伴随有领导者的动画和适当的语言。那些不喜欢和谈的玩家们也会发现直接发动战争的快感更加强烈。
《文明5》也会包括MOD和多人游戏元素,游戏中设置了一个社区中心,玩家们可以在此交流经验或是进行切磋。
《文明5》继续充当了使者的角色,并没有给Radeon HD 7970带来多大的压力,在2560*1600分辨率下,Radeon HD 7970平均帧率达到了56.6FPS,而此时的GTX 580为50.3FPS,领先幅度为12.5%。
● 《文明5》纹理压缩
得益于全新的GCN架构,图形计算性能相对VLIM5和VLIW5提升非常大,在《文明5》纹理压缩对比中性能领先Radeon HD 6970多达58%,对比GeForce GTX 580也领先了12%。
● SmallLuxGPU光线追踪
在SmallLuxGPU光线追踪测试下,Radeon HD 7970表现更加惊人,对比Radeon HD 6970、GeForce GTX 580分别高出74%、72.5%,即使相比于双芯的GeForce GTX 590也领先了4%,仅比Radeon HD 6990慢了9%。
● DX11 SDK CS流体模拟
由于网格搜索测试基于CUDA而开发,NVIDIA显卡占有绝对的优势,即使是Radeon HD 7970相对Radeon HD 6970提升了47%,依然和GTX 580有不小的差距,成绩仅和GTX 570相当。
● 蒙特卡罗算法
蒙特卡罗算法基于OpenCL,测试结果为模拟400步执行所需的时间。这是Radeon HD 500系列以来A卡的长项,Radeon HD 7970又进一步比Radeon HD 6970提升了14%,明显领先。Radeon HD 6900系列其实还要比Radeon HD 5800系列稍慢一些,可能是VLIW4架构的缘故。
● AES加/解密
在AES加/解密表现中,Radeon HD 7970虽然相对上代Radeon HD 6970领先71%,不过依然不敌GTX 580,甚至还惜败给GTX 570,而值得注意的是在改用了PCI-E 3.0之后成绩得到了显著提升,由324ms减少为297ms。
总体来说采用了GCN架构的Radeon HD 7970,在很多通用计算性能方面实现了质的飞跃,只是在一些NVIDIA优势项目上依然落败GTX 580,总体表现相当出色。
作为DirectX 11的重点革新,曲面细分(Tessellation)和纹理填充极大的改善了图形质量,新的GCN架构在优化了执行效率,虽然ROP并没有得到增多,不过理论的测试却真实的反映了性能的显著提升。
测试中使用3DMark Vantage来测量像素填充,通过利用ROP单元尽量混合更多的像素。理论上Tahiti XT可以在每个时钟周期完成32个色彩的处理,也就是说925MHz的Radeon HD 7970可以获得29.6Gpix/s的速率,不过任何架构并不是100%执行的,实际测试中Radeon HD 7970像素填充率为13.33Gpix/s。
如果按照理论计算(参照Radeon HD 7970),那么Radeon HD 6970为28.16Gpix/s,不过实际中Radeon HD 7970却领先Radeon HD 6970多大51%。虽然ROP的执行效率离100%差距甚远,不过相对Radeon HD 6970执行效率提升非常大,这大概也是AMD不在Tahiti XT上面继续增加ROP的目的吧!
而在曲面细分(DirectX 11 Detail Tessellation Sample)方面,Radeon HD 7970一跃成为NO.1,每秒处理速度达到了255.FPS,领先GTX 580的2523FPS,而相对于Radeon HD 6970提升非常明显,领先达233FPS,特别是在Max模式下更是领先57%。
曲面细分第二部分测试选取了Unigine Heaven,主要反映理论成绩和实际成绩的对比,不过这款引擎依然没有被DirectX 11游戏使用。可以看到Radeon HD 7970相对Radeon HD 6970再次大幅提升,幅度达56%,另外GTX 580也被拉下马,成绩达到了63.5FPS,仅落后于双芯的GTX 590和Radeon HD 6990。
待机情况下,Radeon HD 7970整个平台仅为113W,远低于GTX 580的133W,成为所有测试显卡中待机功耗最低的产品。
借助ZeroCore Power技术,在系统长期被闲置后,系统功耗进一步降低,功耗下降到103W,又减少了10W,看来ZeroCore Power技术所言非虚,对于高性能显卡用户来说长时间待机可以节约不少的电,毕竟很多时候显卡几乎处于零工作状态。
满载测试环境下,选用了《地铁2033》作为整体平台负载测试,实际测试中Radeon HD 7970平台功耗为391W,和GTX 570几乎持平,比GTX 580低出了34W,不过相对Radeon HD 6970还是有所提升。
而在使用OCCT考级测试下,相对Furmark可以真实的反映出显卡的最大功耗,实际测试中,Radeon HD 7970平台为357W,同样比Radeon HD 6970高出了不少,不过比GTX 580的451W低了近100W。
总体来说采用28nm工艺的Radeon HD 7970虽然功耗相比Radeon HD 6970有一定的提升,不过相对GTX 580/GTX 570等重量级显卡来说依然属于节能型选手,另外ZeroCore Power技术带来的低至3W的待机功耗非同凡响,表现非常惊人,性能和低功耗得到了完美的平衡。
温度测试中,采用了28nm工艺的Radeon HD 7970继续表现出色,待机核心温度低至34℃,比Radeon HD 6970的36℃低了2℃。成为参测显卡中待机温度最低的产品。
同样平台满载测试选择了《地铁2033》,测试中Radeon HD 7970和Radeon HD 6950相当,都为74℃,低于Radeon HD 5850的68℃,成为温度第二低的产品,而GTX 580的温度整整高出了10℃,达到了84℃。
接下来同样适用OCCT对显卡进行满载测试,测试中Radeon HD 7970升温至79℃,依然表现出色,而此时的GTX 580更是直逼90大关,为88℃。
静音和低温对于性能及显卡向来成反比的,随着显卡TDP的膨胀,水冷逐渐步入高端显卡行列,测试中Radeon HD 7970待机为40.2dB,仅比Radeon HD 3870高出一些,不过整体来说这些显卡都表现相当,GTX 580也只有41dB。
进入《地铁2033》熔炉后,这些乖巧的孩子没有再老实了,Radeon HD 7970一跃达到了55.2dB,成为仅此于GTX 590的噪音杀手了,而此时GTX 580相对平和一些为52.1dB。
最后一项OCCT的显卡考级测试中,Radeon HD 7970噪音继续攀升达到了57.3dB,不过此时Radeon HD 7970的定位发生戏剧性的变化,原因是GTX 580限制显卡TDP的做法被暴露无遗,一举超越了Radeon HD 790,达到了59.3dB。
在测完所以的项目后,Radeon HD 7970相信已经感动了大部分的读者,作为一款28nm的先驱,再采用GCN架构后,相对Radeon HD 6970发生了质的飞跃。
● 游戏
Radeon HD 7970作为一款高端显卡,旨在为游戏而设计,产品最重要的是速度有多快以及成本,很显然性能上Radeon HD 7970作为王者做到了。
而在价格方面,自2008年,AMD就成为价格杀手,屡屡将对手显卡拉下马,不过这次AMD出乎意料的将新品定位到549美元(中国定价4699元人民币)成为近几年显卡价格的新高度。
从测试成绩上看,Radeon HD 7970已经完全能够胜任高达2560*1600分辨率的游戏运行,这也是目前为止首款单GPU能够达到此要求的显卡,另外AMD官方宣称的CrossFire性能直逼100%提升也非常值得期待。
虽然从整体性能上看Radeon HD 7970于双芯GTX 590或Radeon HD 6990还有一定的差距,不过双卡带来的高功耗和发热以及利用率相信不是每个用户能够接受的,选择单芯性能王者依然是大部分的用户选择。
● 计算
随着并行计算的退管,显卡被用到越来越多的通用计算上面,而专为通用计算设计的GCN也认准了这一趋势,这是自R600架构以来的一次重大变革,此前一直是修修补补。
而从本次的实际测试来看,GCN以绝对优势领先VLIW5、VLIW4架构,也正证实了GCN的正确性,而GCN不仅仅是HPC(高性能计算),它也是AMD融合的一部分,相信时间会告诉我们真相!■ <