GDDR5的咆哮!AMD旗舰HD4870权威评测
随着AMD HD4800系列的正式发布,AFan们终于扬眉吐气了一回,被压抑了许久的怨气终于在这一刻迸发,从HD4850评测文章超高的人气足以见得民心所向!HD4850是追求性价比的产物,而刚刚上市的HD4870,则代表着RV770核心的真正实力,有了全新GDDR5显存助阵,HD4870的对手已经不再是NVIDIA上代的9800GTX(+)了,而是直接将矛头对准最新的GTX260。
● 800个流处理器!R600架构终于开花结果
从DX10时代开始,AMD就因R600核心架构问题和延期上市付出了惨重代价,导致HD2000系列高中低端全线产品处于被动局面,直到HD3000系列上市才稍微有些起色。但实际上RV670的架构相对于R600没有本质改进,只不过是通过先进的工艺降低了制造成本,提高了产品性价比,对于高端玩家来说,HD3800低下的执行效能和拙劣的AA性能显然是无法交待的。
而新一代的RV770核心则是卧薪尝胆之作,它将R600的超标量流处理器架构发挥到了极致——ATI只花费了43%额外的晶体管就将流处理器规模扩充了2.5倍!不仅如此,RV770的纹理单元、光栅单元、显存控制器都作了不小的改进,在上代显卡中所发现的问题都被及时修正。通过之前HD4850的评测就可以发现,G92核心最强者9800GTX已不是它的对手,NVIDIA引以为傲的抗锯齿效能在RV770面前简直不堪一击,很多专为N卡优化的TheWay游戏也被一一攻克……
● 避其锋芒以柔克刚!HD4800欲称霸1000-2000元价位
无论AFan还是NFan,都应该为HD4850/4870的上市而拍手叫好,因为在HD4850面市之前,同级别的9800GTX还要卖2000块以上,HD4850发布当天就迫使NVIDIA将其瞬间降价1000块;而HD4870的出现,则让刚刚摆上柜台的GTX260自降1000元,这种举措在历史上都是极为罕见的。看来一贯保持强势风格的NVIDIA开始感觉到了压力,那么GTX260能否扛住HD4870的攻势呢?
实际上,从HD3800系列开始,AMD的产品设计思路就发生了改变,将中端显卡作为研发的重中之重,然后通过双GPU打造高端产品。上一次的HD3800仅仅是探路之作,现在的HD4800在吸取了经验教训后,将性能价格比和性能功耗比放在了第一位,努力将晶体管数控制在了10亿之内,这样无论芯片成本还是显卡制造成本都要低很多,HD4850就是严格控制成本的产物,上市价格仅为1399元,为消费者提供了千元价位最高性价比的产品!
而NVIDIA则一如既往地通过暴力堆积晶体管的方式,打造出至高性能的旗舰显卡,然后再通过阉割的方式降低产品定位。完整规格的GTX280性能自然十分强大,但价格也是高高在上,阉割版的GTX260价格还不错,可是性能损失也不少。此消彼长之后,这就把9.56亿晶体管的HD4870与14亿晶体管的GTX260这两款看似不是同一重量级的产品放在了一起,那么作为挑战者的HD4870在性能上能否带来惊喜呢?
对于55nm工艺制造的RV770核心来说,HD4850默认625/1986MHz的频率其实是很低的,即便如此,HD4850已经击败了675/2200MHz的9800GTX,而且比起同为55nm频率高达740/2200MHz的9800GTX+都毫不逊色。看来800个流处理器的RV770核心的确拥有强大的实力,如果继续提升频率,性能还会有不小的提升空间。
HD4870正是代表了RV770核心的最高性能,ATI将默认频率提高到了750MHz,这与55nm的9800GTX+差不多,而显存方面则首次使用下一代的GDDR5颗粒,默认频率从3600MHz(这是等效频率,实际频率为900MHz)起跳,在显存位宽保持不变的情况下,单纯通过频率将带宽提高了近一倍,也就相当于1800MHz 512Bit的水平!
● HD4870显卡全部规格表:
仔细观察以上规格表就能发现以下几个重要问题:
同为55nm工艺,G92核心的晶体管数比RV770少,但是芯片面积反而更大!(原因参见架构解析部分)
虽然HD4870只有256Bit显存位宽,但有了GDDR5助阵,其显存带宽理论值比448Bit的GTX260还要高!
G92核心与GTX200核心的规格差距很大,但55nm的9800GTX+拥有非常高的流处理器频率,因此浮点运算能力已经能接近于GTX260了!
由此可见,虽然RV770与GTX200核心不是同一重量级的产品,但HD4870和GTX260两款显卡的规格却是不相上下,那么最终性能表现如何呢,今天我们就通过详尽的测试来展现给大家。
首先来详细分析下RV770的核心架构,它源自于R600,但青出于蓝而胜于蓝,ATI对核心几乎所有的模块都进行了改进,而且规模和数量方面大大加强。HD4850/4870令人惊讶的性能表现就是源自于核心架构。
● RV770核心架构图:
基本上,RV770和RV670的整体结构是相同的,RV670身上所有的模块都得到了沿用,但很多模块都经过了重新设计或者优化设计:
1。SIMD阵列扩充为10组,每组SIMD绑定专属缓存及纹理单元;
2。纹理单元数量扩充为10组,寄存器容量增加;
3。继续提升几何着色的效率,适应未来DX10游戏的需要;
4。改进可编程镶嵌单元,使之更适合于动画游戏实时渲染;
5。改进显存控制器,率先支持GDDR5,并加入显存读写缓冲区,增强数据读写命中率。
● RV770核心规格全面翻倍:
翻倍的规格是最容易理解的,但数字部分往往比较抽象,下面就详细介绍各个模块的具体含义。
RV770核心最显著的特点就是将流处理器提升到了空前的800个,达到了RV670的2.5倍!实际上除了流处理器之外,纹理单元、光栅单元都得到了大幅增强。
● 流处理器翻2.5倍:
RV670是4组SIMD,每组16个Shader,每个Shader 5个流处理器
RV770是10组SIMD,每组16个Shader,每个Shader 5个流处理器
在SIMD和Shader规模扩大的同时,Ultra-Threaded Dispatch Processor(超线程分配处理器)也变得更加复杂。由于每组SIMD所包括的Shader数量增多,阵列内的Arbiter(仲裁器)和Sequencer(定序器)数量同比增加至20个,因此扩充规模后的RV770单个Shader执行效率并不会下降。
● 纹理单元翻2.5倍:
RV770的纹理单元数量相比R600/RV670翻了2.5倍,从4组增加至10组,这样RV770总共就是40个纹理单元,Shader和TMU的比例达到了4:1。
每组纹理单元内部包含了4个纹理寻址单元(黄色,共40个),16个32位浮点纹理采样单元(橘黄色,共160个),和4个纹理过滤单元(深红色,共40个)。
● 光栅单元数量不变,规格翻倍:
RV770还是保持4组后处理单元,也就是通常所说的16个。但这次AMD重新设计了光栅单元的内部结构,以改善R600/RV670那低下的AA效能。
R600/RV670每组后处理器单元内部包括了8个Z/模版采样,而RV770将采样数量提高至16个,多重采样(MSAA)速度直接翻倍,AMD声称RV770可以提供几乎免费的2xMSAA效能,并且4x/8xMSAA效能相比上代提升非常显著。
RV770的AA算法最终还是交给Shader部分来处理,好在RV770的流处理器高达800个,多数情况下都处在性能过剩状态。2倍的Z/模版采样率再加上2.5倍的Shader规模,RV770的抗锯齿性能将会有一个质的飞跃,详细大家请参阅游戏测试部分。
RV770核心不仅仅是把核心各个模块的数量翻倍这么简单,实际上在微架构方面还做了不小的优化,这方面相信很多朋友还不容易理解,下面就做一个简单的说明。
● 压缩晶体管密度,每平方毫米晶体管性能提升40%
在GPU最关键的流处理器部分,RV770与RV670的结构是完全相同的,RV670拥有4组SIMD(每组SIMD包括16个Shader,每个Shader有5个流处理器),RV770是10组SIMD,可以说在流处理器部分只是单纯的扩充了规模。不过,这次ATI通过另外一种“投机取巧”的方式提高了RV770核心的“效能”——压缩晶体管,或者说是提高硅片的利用率。
同为55nm工艺,RV670和RV770的SIMD阵列所占体积不同
通过上图就可以看出,从RV670到RV770,每组SIMD阵列所占用的芯片面积缩小了40%,如此一来每平方毫米晶体管所能提供的性能就提高40%。在架构和结构不变的情况下,能获得如此巨大的性能提升,看来ATI对于55nm工艺的运用已经达到了炉火纯青的地步!
RV770核心各部分模块示意图
现在我们就可以理解,同为55nm工艺,为什么7.54亿晶体管的G92核心面积高达276平方毫米,而9.56亿晶体管的RV770核心面积只有260平方毫米!因为RV770的晶体管密度更大,G92b作为NVIDIA首颗55nm的GPU,看来晶体管密度还不够高,没有充分利用硅片面积。
减少芯片面积的优势是不言而喻的,意味着一块晶元上能切割出更多的GPU核心,这样制造成本就会下降。当然与成本息息相关的还有芯片良品率的问题,RV770的晶体管密度如此之高,可能会影响良率,而且发热过于集中的问题会比较棘手。
● 纹理单元全新的缓存设计
前面已经提到RV770相比RV670纹理单元的数量翻了2.5倍,在数量增加的同时,一二级缓存的容量和带宽都随之改进,以确保存取效率。
- 顶点着色拥有独立专署缓存
- 每一组SIMD阵列拥有单独的一级缓存(L1 TC)
- RV770核心相比RV670,L1 TC容量翻倍,总L1容量达RV670的五倍!
- 在显存控制器和显存颗粒之前拥有二级缓存
- L1纹理缓存存取速度高达480GB/s
- L1和L2缓存之前的带宽高达384GB/s
● 抗锯齿效能翻倍:
在之前HD4850的评测中我们已经发现,其AA效能大幅超越HD3870,和9800GTX/+相比也能够反败为胜,而且AA等级越高优势就越明显!
可以看出,全新的ROP单元大大加强了RV770核心的多重采样效能,如果不开AA那么RV770就没什么优势,一旦打开2x/4x/8xAA,那么它惊人的实力就会被完全释放出来。
由于目前玩家们对游戏画质的要求很高,抗锯齿基本上成为了每个游戏的默认特效,再加上目前高端显卡的实力够强,在打开AA的情况下都有不错的FPS,因此4xAA应该是基本配置,更何况微软已经将4xMSAA列为DX10.1的默认标准,所以高端显卡的性能应该以打开4xMSAA为准!
随着GPU核心处理能力日益强大,对显存带宽的渴求也与日俱增,这个道理与CPU对内存的需求相似。芯片厂商扩充带宽的手段主要有三种,一是增加显存控制器的位宽(即多通道),二是提高显存的频率,三是采用新一代规格的显存。
● 显存位宽不能随意扩充:
目前的主流GPU都是256Bit的,只有部分优异核心采用了更高的位宽,例如G80是384Bit,R600和GTX200是512Bit。显存位宽加倍,带宽自然加倍,但是付出的代价也不菲:
显存控制器在GTX200核心中所占据的芯片面积仅次于流处理器
GPU集成512Bit显存控制器需要消耗大量的晶体管,而且对显卡PCB布线提出了严格要求,另外显存颗粒的数量也需要翻倍,成本增加严重不成比例!因此,除非是为了追求极致性能的优异显卡,其它情况下都会避免扩充位宽,甚至是降低位宽(比如128Bit才是真正主流)。
● 显存频率提升举步维艰:
提高显存频率很容易理解,但由于规格和工艺所限,显存频率的增长十分缓慢,目前主流的GDDR3颗粒好不容易从1.0ns进化到0.8ns,频率达到2200MHz左右以后就很难继续前进了。
三星和现代的0.8ns GDDR3显存已经在高端显卡上得到了普及
比如NVIDIA最新55nm的9800GTX+,核心和流处理器频率大幅提升,但显存频率却在2200MHz原地踏步,GTX280的默认显存频率也是2214MHz,原因就是GDDR3显存已经遇到了瓶颈。0.8ns颗粒理论频率能达到2500MHz,但是8颗(256Bit)甚至16颗(512Bit)显存同时达到2500MHz就有些难度了,稳定性难以保证!
● GDDR3气数已尽、GDDR4不过如此、GDDR5初露锋芒:
在GDDR3显存频率难以继续提升的情况下,ATI和JEDEG(国际内存标准的制定组织)制定了GDDR4颗粒标准,并在X1950XTX、HD2900XT、HD2600XT、HD3870等显卡上率先使用GDDR4。但由于NVIDIA的反对,加之ATI显卡不够强势,内存芯片厂商对于GDDR4没有表现出很高的兴趣。而且最主要的是GDDR4未能解决功耗和成本问题,而且带宽提升并显著。
举例来说:同为0.8ns的GDDR3和GDDR4,虽然GDDR4容易达到更高频率,但是由于延迟的增加,实际性能甚至比GDDR3还要差,因此GDDR4被冷落也在情理之中。最终由于内存芯片厂商没有投入精力研发改良GDDR4,其规格也就止步于0.8/0.7ns,相比GDDR3没有质的提升,业界普遍认为应该跳过GDDR4直接过渡到GDDR5。
此次,又是ATI捷足先登,HD4870率先采用GDDR5显存颗粒,在保持256Bit显存位宽不变的情况下,大幅提升了显存频率,消除了困扰多年的带宽瓶颈。
与追求低成本的HD4850不同,HD4870则是一款真正意义上的高端显卡,ATI昔日高端显卡上那些豪华的散热器、供电模快、完美的做工再次呈现在大家面前:
双槽散热器出了性能更好之外,还有个优势就是能把显卡发出的热量全部排出到机箱之外,这样就不会给机箱散热造成负担。输出接口采用了中高端显卡常用的双Dual-DVI+S-Video,配合ATI原装的专用DVI转HDMI输出转接头即可方便的实现HDMI输出,加上本身集成的UVD单元,高清视频不用愁。
HD4850默认核心电压和频率都很低,因此单槽散热器就能搞定,而HD4870的默认频率高达750MHz,再加上超高频率的GDDR5显存,发热量增加了不少,因此公版卡配备了双槽热管散热器,现在我们就把它拆开来一窥究竟:
HD4870散热器的整体结构和HD2900XT类似,不过散热片并非纯铜,只有底座是纯铜打造,看来RV770核心虽然晶体管增加不少,但发热量和R600相比还是要低一些。
在散热原理上,纯铜底座通过两根粗壮的热管将热量传导至大面积铝制散热片上,在通过涡轮风扇将热量吹向机箱外。
取下散热器之后,就来看看HD4870裸卡,可以看到显卡各个模块的布局整齐划一,是一如既往的ATI原厂设计风格,熟悉的数字供电模快又出现了:
齐梦达GDDR5显存颗粒,-40X代表等效理论频率为4000MHz
作为世界上首款采用GDDR5显存的显卡,HD4870给我们太多的期待。可以看到显存采用奇梦达的IDGV51-05A1F1C-40X GDDR5颗粒,采用PG-TFBGA 170封装格式,一共组成512MB 256Bit的容量,理论运行频率可达4000MHz,实际默认频率为3600MHz,看来还有不小的超频潜力供玩家挖掘。
与HD4850显卡上传统的2+1相供电不同,此次HD4870又采用了极为豪华的数字供电。与GTX280显卡上零乱的布局不同,ATI对于数字供电的使用显然更为得心应手,三胞胎电感、陶瓷电容排列得井井有条,下面就对其供电模块进行详细分析:
核心供电主控芯片VT1165MF(NVIDIA GTX280也用的是这颗芯片)
核心供电为三相,使用了一个连体三胞胎电感,MOS为三颗VT1195
单颗VT1195能够提供40A电流,三相就是120A,这要比GTX260的三颗VT1165提供的90A还要大!实际上HD4870的峰值电流还不到100A,这样的冗余设计显然是留给玩家超频之用。另外大家可以看到HD4870的PCB其实有一相被空焊,也就是说最大可支持四相供电,最高可提供160A的电流,看来ATI认为四相太奢侈了,所以被缩水掉了。
显存供电为两颗VT235WF,并没有电源主控芯片,因为这颗VT235WF的集成度更高,它将主控芯片、驱动IC电路和MOS管全部整合在了一起,因此看上去VT235WF比VT1195SF的芯片面积要更大一些。两相式供电为显存提供了最大60A电流,可满足超高频率下稳定运行。
看得出来,为了让RV770核心运行在更高频率,也为了对GDDR5显存提供充足动力,HD4870的数字供电模块设计比GTX260还要豪华,如果将空焊不全的话,NV史上最豪华的GFX280也只能是甘拜下风(单纯比供电模块的配置)。
豪华的供电再加上产量有限的GDDR5显存,HD4870的成本并不低,以目前的售价来看的确是相当厚道了。
● 华硕
华硕作为全球最大的板卡生产商,这次迅速发布了了自己HD4870显卡,完全公版设计,不过贴纸相当有吸引力。
● 迪兰恒进
同为AIB品牌,迪兰恒进在ATI显卡产品的上游资源和研发实力也不容忽视。这次迪兰恒进也在第一时间推出了HD4870显卡。
● 七彩虹
国内显卡出货量最大的七彩虹自然也不甘落后,第一时间和一线大厂同步推出HD4870。
● 蓝宝
身为全球最大AIB品牌,Sapphire蓝宝在ATI显卡产品的上游资源和研发实力绝对首屈一指。这次蓝宝石也在第一时间推出了HD4870显卡,公版做工延续了ATI原厂卡的风范。
● 测试平台配置
PCPOP.COM评测室 | |
硬件系统配置 | |
Intel QX9770 四核心, 3.2GHz, L2=12MB | |
主 板 | ASUS RAMPAGE Formula, chipset:X48 |
显 卡 |
9800GTX+ 512MB (740/1856/2200MHz) GTX260 896MB () |
内 存 | CORSAIR Dominator TWIN2X2048-10000C5DF DDR2-800(4-4-4-12) 4x1G |
硬 盘 | 西部数据 WD3200AAKS 32 |
电 源 | 海盗船 TX 1000W |
软件系统配置 | |
操作系统 | Windows vista Unimate 32Bit SP1 |
DirectX | 10.1 |
显示驱动 | NVIDIA Forceware 177.39 ATI Catalyst 8.6 ATI Catalyst 7.14.10.0598(HD4850专用) |
● 参测显卡
由于HD4870本身定价颇高,位于中高端市场,价格位于9800GTX+和GTX260之间,所以这两款显卡自然在测试对比之列。
RV770的前辈是RV670,流处理器的提高是否能达到预想的设计目标,还是要靠性能验证。2007年底ATI推出了经典的HD3800,时隔一年HD4870在同价位上卷土重来,看看性能提升多高。
● 测试项目
目前搭配两千元以上显卡的玩家多数一般选择22寸宽或则24寸宽LCD,更高端的30寸显示器并不多见。所以我们选定分辨率为1680×1050(22寸宽)和1920×1200(24寸宽),并开启4AA16AF,以接近这部分用户的实际使用环境。
测试程序覆盖了理论测试程序3DMark、DX9C游戏和DX10游戏,值得说明的一点是仅仅是测试demo而非可玩游戏的程序我们并没有选用,比如《鱼雷骑士》和《狂野西部》。
● DX9C理论性能测试:3DMark06
3DMark06作为DX9C权威的理论测试工具,包括了两个SM2.0测试和两个SM3.0测试场景,基本上达到了DX9C的画面最高境界,其测试结果对于很多主流游戏都有参考价值。但是如今3DMark06已经难不倒高端显卡了,高端显卡在3DMark06中难分高下,所以我们只能最大程度的提高它对系统的要求,比如说提高分辨率开启抗锯齿等。所以我们选定了在1920×1200 4AA16AF下测试其总分和SM3.0成绩。
在之前的HD4850测试中,RV770核心强大的AA性能给大家留下了深刻映像,现在有了GDDR5显存助阵,高频高带宽的HD4870性能无疑会更加强悍。通过总分来看,HD4870小幅领先于GTX260,但在SM3.0测试中我们可以看到,GTX260被HD4870拉开,看来HDR+AA性能还是RV770更胜一筹,GTX260虽然拥有更高的光栅单元及显存位宽,但AA方面确实是技不如人,看来ATI已经彻底从HD2000/3000系列AA效能低下的阴影走了出来!
● DX10理论性能测试:3DMark Vantage
3DMark Vantage已经在四月底正式发布,全新的引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨,号称“显卡危机”的Crysis也不得不甘拜下风。
3DMark Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级),只有在这四种模式下才能跑出总分,如果自定义模式就只能得到子项目分数了。我们为这次的对决选择了Extreme和High两种模式。
最新的3DMark Vantage是NVIDIA和AMD双方都认可的测试工具,相比上代的06,Vantage更加依赖核心Shader渲染能力,而对于显存带宽和纹理部分反而更小。
从测试成绩上看,GTX260中14亿晶体管的怪兽核心并不是吃素的,无论Extreme还是High模式,GTX260都要比HD4870更胜一筹,不过差距并不是很大。而HD4850和9800GTX+双雄相比则要占据上风,尤其是Extreme模式下,因为此时打开了4xAA,G92核心的AA效率显然无法同GTX200核心相比,自然败给了RV770。
● DX9C游戏性能测试:《超级房车:起点》
它来自于2007年最受欢迎的赛车类游戏DiRT的制作者。GRID是一款快节奏的,拥有众多精美场景和广阔视野的赛车类游戏。强化的EGO游戏引擎,让游戏中的碰撞、损坏等更加真实:物理模型将可以保证游戏中车辆的碰撞、损坏和解体等将更加贴近于好莱坞大片中的效果。
画面设置:先开启Ultra画面等级,使所有特效达到最高,再改变分辨率,开启4×AA。
测试方法:进入游戏后测试第一段直道的平均速度,方向键锁定前方,保证所过场景一致。
《超级房车》使用了之前《克林麦克雷:尘埃》的游戏引擎,无论画面还是游戏需求都应该算是优异DX9C游戏,ATI上代的显卡在这种偏重于像素渲染的游戏中都有非常不错的表现,新一代显卡由于核心Shader规模庞大,再加上对光栅单元的改进,AA效能大幅提高,即便是GTX260都不得不甘拜下风。
由于GDDR5的帮忙,HD4870和同为RV770核心的HD4850相比,性能提升非常显著。若您是赛车游戏爱好者,HD4870不会让您失望,高分辨率下平均超过70帧,一定会让您体会到驾驶快感。
● DX9C游戏性能测试:《使命召唤4:现代战争》
虽然使命召唤4的场景已不再是二战,但它依然保持了和使命召唤2/3系列相近的画面风格,相信老玩家在游戏中一定会有亲切感,战斗中的爆炸、烟雾效果更加逼真,物理效果也加强了游戏的真实感。
画面设置:使命召唤4引擎对显卡的要求中等,中高端显卡特效全开并且开AA都能有不低的FPS,因此我们只测打开AA时的性能。
测试方法:游戏有一段固定的爆炸场景,FPS比较稳定,也符合游戏实际运行时的情形,用Fraps统计这个过程的FPS,作为最终成绩。
HD3800系列在《使命召唤4》中的糟糕表现让人失望,尤其是开启AAAF后,更加惨不忍睹。而现在架构上改良的HD4800系列,性能上已经让人刮目相看。
即使是和各方面规格占优的GTX260相比,性能也不占下风。凭借高频和高带宽助阵,性能较4850提升明显,看来GDDR5的高带宽带来的性能不容置疑。
● DX9C游戏性能测试:《帝国时代3:亚洲王朝》
其画面风格一如既往的华丽无比,虽然游戏引擎比较老,但通过精妙的色彩搭配和美术设计,《帝国3》的视觉效果比起DX10 RTS大作《英雄连》和《冲突世界》都是不落下风。
画面设置:帝国3的最新资料片也使用了原来的游戏引擎,画面风格没有任何变化,系统需求也是照旧,对于如今的显卡来说特效全开并且打开抗锯齿运行游戏没有任何难度。起“边缘光滑”开启至“高”就是4AA。
测试方法:及时战略游戏如果没有专用测试程序,就很难在游戏中公平的测试,所以我们选用了游戏即时演算的主界面统计帧数,也能客观的反映出各卡在该游戏中的差距。
三年前的游戏引擎,因此A卡对其支持度不够好,即使有GDDR5助阵,HD4870的性能也不能赶上GTX260,只能和9800GTX PLUS打成平手。
● DX9C游戏性能测试:《半条命2:第二章》
《半条命2:第二章》作为《半条命2:第一章》的续集,引擎在HDR和室外场景的渲染方面有所增强,树叶渲染上将采用Alpha覆盖技术,提供更好的树叶细节和反锯齿效果。此外还引入全新的粒子系统,将提供动态软阴影效果。物理引擎也经过重新设计,提供大场景大范围的物理效果。
画面设置:《第二章》还是原来的Source引擎,虽然做了一些改进,但对显卡的要求并没有提高,所以我们测试时特效全开最高,并且打开游戏自带的AA和AF。
测试方法:游戏支持命令录制demo供测试,我们录制的demo覆盖了室内室外场景。
在THE WAY横行的今天,《半条命2:第二章》是屈指可数的几款打了ATI Logo的游戏,但是HD3000系列糟糕AA效能丢尽了ATI Logo的颜面,因为统计N卡在开AA的情况下几乎完胜A卡。
可以看到,年迈的Source引擎即便打开AA也难不倒几款高端显卡了,120帧基本上就是上限,HD4870、HD4850、GTX260三款显卡难分胜负。当分辨率提高到1920之后,终于反映出了实际性能,HD4870依然达到了120帧的上限,而GTX260和HD4850则回落到100帧左右。看来,分辨率越大、AA越高,越能体现出RV770的优势。
● DX9C游戏性能测试:《优品飞车11:专业赛道》
《优品飞车11:街道争霸》是一款真正可以激发你肾上腺素的赛车游戏,给玩家带来令人难忘的高细节的照片品质的图像,更有代入感,它将Autosculpt技术提升到了新的高度。
画面设置:游戏最高只支持到1920×1200,我们将所有效果开启至最高并设置4AA16AF。
测试方法:和《超级房车》一样取游戏开始的一段直道作为测试场景。
《优品飞车11》和《超级房车:起点》的表现比较相似,以前A卡总是因为AA效能问题败北。而现在对于RV770核心庞大的Shader单元来说,4AA根本就是小菜一碟。这次HD4850都能和GTX260打平,HD4870更是能够挑战GTX280的权威!
● OpenGL游戏性能测试:《敌占区:雷神战争》
《敌占区:雷神战争》作为QUAKE系列游戏的最新作,由于引擎源自Doom 3,但比DOOM3在很多方面都有所加强,最引入注目的MegaTexture技术的首次使用。简单而言,MegaTexture就是一张超大的贴图。在《敌占区:雷神战争》中每张MegaTexture容量达到了3GB(类似ClipTexture,并非全场景的动态贴图),在得到更好效果的同时,对显存容量的要求也更高。除此之外,引擎还引入了视差映射、凸凹紋理映射、法向映射和Specular Highlighting、软粒子等目前流行的显示技术。
画面设置:毕竟是源于老迈的DOOM3架构,引擎无论如何改进,对配置的要求也不可能出现翻天覆地的变化,自然是特效全开,并开启游戏内置的4AA16AF。
测试方法:我们自行录制了一段多人对战Demo,调用游戏内置的控制台命令行播放录像,然后就可以得到比较准确的全程FPS。第一次回放Demo时由于Loading的原因成绩较低,所以取第二次的成绩为最终结果。
OpenGL一直是A卡的弱项,AA也是软肋,因此在为数不多的几款OpenGL游戏中,A卡的差距总是不小。不过在HD4800系列改进纹理单元和光栅单元之后,低频的HD4850已经能够和9800GTX+打平,HD4870可以叫板GTX260,着实难能可贵!
● DX10游戏性能测试:《孤岛危机》
Crysis(孤岛危机)无疑是现阶段对电脑配置要求最高的PC游戏大作。Crysis的游戏画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。
画面设置:游戏版本为V1.2,开启最强DX10效果(Very High),即便是许多高端显卡也只能在低分辨率看幻灯片,所以我们选择了1920×1200,分别开启最强DX10效果(Very High)和最强DX9效果(High)。
测试方法:Crysis内置了CPU和GPU两个测试程序,我们使用GPU测试程序,这个程序会自动切换地图内的全岛风景,得到稳定的平均FPS值。
Crysis是唯一能被称为次世代游戏的超强大作,几乎秒杀上代所有显卡,很多玩家升级显卡可能就是冲着Crysis而来。对于这款NVIDIA全程参与开发的游戏来说,N卡基本上能发挥出最大效能,而A卡虽然也通过驱动不停优化,可跑起来是举步维艰。
HD4870表现能只用惊艳来表示,在这个一向是N卡把持的游戏中,凭借着核心的高频率和GDDR5的高带宽,和规格更高的GTX260打成平手。而我们可以看到,随着分辨率的提高,HD4870的优势还会扩大。不过要想流畅玩爽Crysis的话,目前还是使用GTX280这种怪兽甚至多卡才行。
● DX10游戏性能测试:《失落星球》
《失落星球》无论DX10还是DX9版本,画面都非常出色,但除了绚丽的画面之外,游戏本身也是可圈可点。
画面设置:游戏版本为V1.03,将所有特效全开最高,可以使画面颜色达到64位。
测试方法:游戏自带测试程序,该程序会将游戏任务第一关的所有场景快速跑一遍,然后得到Snow和Cave两种模式下的平均FPS,测试结果取FPS较低的Snow成绩。
《失落星球》是首款DX10游戏,也是N卡御用TheWay游戏,A卡的表现惨不忍睹。HD4850相比上代显卡性能提升显著,但和9800GTX差距还是不小。
值得欣慰的是,HD4870虽然在noAA模式下落后幅度仍旧较大,但开4AA后已经能和9800GTX PLUS打成平手,这说明改进光栅单元之后的HD4870对AA的性能提升明显!
● DX10游戏性能测试:《刺客信条》
老牌游戏厂商育碧不失时机的将横跨数个平台的超级大作《刺客信条》搬上了PC平台,这款结合了古代和现代场景的科幻动作游戏早已在游戏机平台聚集了强大的人气。育碧表示《刺客信条》的DX9画面和DX10画面没有本质区别。育碧之所以为其选用DX10 API,仅是单纯为了调用Shader Model 4.0技术,从而大幅提升游戏渲染效率。
《刺客信条》是目前唯一一款DX10.1游戏,可惜因为某种不可告人的原因,在最新的补丁中官方去掉了对DX10.1的支持,这就让A卡遗憾不已。不过A卡用户可以不打这个补丁,感受下DX10.1带来的新特效。在我们的测试中为了保证特效一致,打上了最新补丁不开DX10.1。
画面设置:将所有特效全开最高,游戏最多支持8×AA,但是当分辨率达到1920×1200及以上就无法开启抗锯齿,所以我们选择了1680×1050 8×AA,更高的分辨率没有AA的模式。
测试方法:游戏通过训练关后会进入一个城镇,我们不对其进行任何操作,直接读取屏幕上稳定的帧数。
凭借着架构改善带来的优势,即使在8×AA下HD4870仍旧十分强悍,领先对手GX260不少,不过在1920x1200分辨率无法开启AA下,两者的成绩差不多。可见N卡在虚幻3引擎下的抗锯齿性能明显不如新一代A卡。
● DX10游戏性能测试:《冲突世界》
《冲突世界》采用了自行研发的MassTech引擎,支持多种当前的主流显示特效,如容积云,景深效果,软阴影等,光照系统也表现出色,尤其是半透明的容积云特效营造出了十分逼真的户外场景,物理加速结合体积光照渲染出了最逼真的爆炸效果。
画面设置:游戏自带的画面设置多达44个选项,内置的Very High模式并不能把所有选项都调最高,需要手动将其设定为Very Long和1024。
测试方法:《冲突世界》和《英雄连》类似,也是选择了一段非常华丽的过场动画作为测试程序,最终得出最大、最小和平均FPS,测试结果非常精确。
《冲突世界》的表现和《失落星球》差不多,A卡一向都拼不过N卡,不过HD4870的诞生是个转折点,即使和GTX260相比,性能上也不吃亏。低数据量下GTX260还领先,但到了高负荷下的4AA16AF1920分辨率下,4870力拔头筹,完成了逆转。
● DX10游戏性能测试:《生化奇兵》
早在游戏Demo版发布之前,BIOSHOCK就已经声名远扬,著名游戏杂志Gameinformer在较早的时候对其进行了完整测试,并给出了惊人的满分10分,将几乎所有的溢美之词都献给了这款游戏,称之为难得一见的史诗性大作。
画面设置:《生化奇兵》的画面设置项目并不复杂,DX10特效只有一项,而且游戏不支持抗锯齿(虽然可以驱动强制开启AA,但DX10和部分阴影会失效),所以我们的测试模式就是特效全开,但不开AA和AF。
测试方法:《生化奇兵》并不像其他几款DX10游戏那样自带测试程序,所以我们只能用Fraps来记录游戏运行的实时FPS,测试场景选取了第一关动态海面作为户外模式获得成绩。
在《生化奇兵》中HD4870和GTX260的效能表现难分伯仲,秒杀了9800GTX PLUS,较前代产品HD3800系列上的提升可谓翻天覆地。
● DX10游戏性能测试:《地狱门:伦敦》
《地狱门:伦敦》包含不少DX10特效:有物理性的容积烟雾,能够跟周围外力产生互动;GPU模拟的雨滴效果,每一个雨点将受到方向光源的打光;以及一种称之为 fancy soft shadows的阴影技术,可以根据光源跟物体的距离调节所产生阴影的柔和程度。此外《地狱门:伦敦》还采用最新的Havok FX引擎 ,该引擎将利用GPU资源来进行物理模拟计算。
画面设置:游戏对N卡和A卡的支持程度并不相同,比如使用抗锯齿后N卡和A卡能够开启的特效等级就不尽相同,我们只好取消抗锯齿设置,以求统一画面设置。
测试方法:以游戏训练关的初始场景读取稳定帧数。
测试结果很和谐,HD4870的性能和GTX260不相上下,HD4850和9800GTX+差不多,而价格上显然A卡更便宜,熟优孰劣读者自有定论。
● 功耗测试:
我们的功耗测试方法就是直接统计整套平台的总功耗,既简单、又直观。测试仪器为Seasonic的Power Monitor,它通过实时监控输入电源的电压和电流计算出当前的功率,这样得到的数值就是包括CPU、主板、内存、硬盘、显卡、电源以及线路损耗在内的主机总功率(不包括显示器)。
从满载和待机功耗来看,HD4870均不占优势,和老对手GTX260相比满载待机均高出一点。和同门师弟4850相比,虽然核心频率更高,但不应有这么大的功耗差距,想必多出的功耗多是用到显存上去了。
HD4870的待机功耗并不低,从测试中发现,这和AMD的Poweplay在待机下执行度不高有关,待机下核心显存还处于550/3600MHz的高频率,好在目前还是产品的早期阶段,相信随着BIOS的改进,未来HD4870在待机下的功耗控制会好很多。
在此之前,由于没有合适的超频软件,本站在HD4850的测试中并未加入超频测试。对核心采用55nm工艺制造来说,频率的提升应当很容易。目前,AMD官方已经推出基于HD4800系列的超频软件amdgpuclocktool-9.8。
使用最新版本的amdgpuclocktool,用户只需在窗口中直接修改,在点击Set Clock即可将显卡超频至想要的频率。在使用中,笔者发现,即使设置频率太高,引起系统假死也没有关系,HD4870会自动侦测并恢复到默认状态。这点用户无需担心。
相对于默认的750MHz,核心频率在稳定情况下仅能提高50MHz,而在显存方面,在默认已经3600MHz的情况下,默认电压下能够提高至4400MHz,通过3D Mark Vantage HIGH模式的检验。
看来,55nm的RV770超频能力还算不错,风冷无MOD电压情况下能够稳定在800MHz并非难事,而GDDR5的显存超频能力更显惊人,高达4400MHz的显存频率让人生畏。不过客观的讲,核心超频能力一般和笔者测试的早期sample版本有关,相信随着显卡发现的各种bug的修正,未来RV770的超频能力会更好。
● 第二代UVD高清解码测试:
现在不少蓝光光盘已经不止含有一段视频流,可以通过“画中画”功能在主画面上同时插入一个或多个经过压缩的子画面。这样相当于同时播放着两部高清视频,如果完全使用CPU,系统负荷无疑非常巨大。
RV770核心集成了第二代UVD,其中对“双流解码”的支持就是用GPU同时硬解码两部高清视频,这样无论使用什么CPU都能轻松胜任。
我们挑选了H.264编码的《国家宝藏2》、《变形金刚》以及VC-1编码的《史前一万年》、《X战警3》进行测试。
现在两部高清视频已经难不住第二代UVD,解放CPU也可以降低整个平台的功耗,对于看高清时执行一些依赖CPU的任务也是不错的方案。
● 性能对比:HD4870 VS HD4850
依托核心高频率和GDDR5显存的高带宽,4870相比4850平均提升了24.2%,核心频率的提升不能带来这么大的性能提升,可见HD4800系列的瓶颈在显存上,未来若GDDR5的频率再提升,相信性能提升会更高。
● 性能对比:HD4870 VS GTX260
作为直接的性能对手,NVIDIA已经下决心让GTX260降低身价来对决HD4870,综合来看,HD4870和GTX260打成平手。不过HD4870价格还有下降的空间,而GTX260呢?
● 性能对比:HD4870 CrossFire性能提升幅度
纵观测试成绩,两个理论性的3D MARK是展现交火效率非常好的的舞台,此外,Crysis中的交火性能让人欣喜,不过总体上看,交火在游戏中的表现还不算完美,平均提升甚至没有达到50%,相信随着驱动的完善,交火下的性能还有很大的提升空间。
● 性能对比:HD4870 CrossFire VS GTX280
一块GTX280要多少钱?4999元。而两块HD4870的价格则是4800元。那么测试结果呢?相对GTX280来说,平均比其高出19.6%。客观的讲,本次4870交火的成绩这么好,一是由于显卡强劲,而更重要的是,这次AMD的驱动做的十分到位,根据显卡并行原理,互联后显卡性能的提升并非是理论上的两倍性能提升,驱动的优化对显卡并行的效率非常敏感。
当然,目前HD4870的首版驱动还不够完善,相信随着新款驱动对DX10游戏提供良好支持后,未来的HD4870X2将会有更高的性能表现。
● 性能对比:HD4870 VS HD 3870X2
作为逝去的王者,HD3870X2廉颇老矣,双芯的效率问题以及核心的老旧,让它已不能和新一代的HD4870比试舞步,不过作为双芯显卡的过来人,它给未来的HD4870X2做了很好铺垫。相信在改进HD3870X2遇到的问题后,HD4870X2会更强大。
● 成本控制出色,高端也要性价比
得益于55nm制造工艺,AMD在大幅提升流处理器数目的同时,成本上也能控制在合理范围之内。虽然采用GDDR5显存,但是由于仅仅是256bit的位宽,所以成本并没有提高多少。反观对手GTX260,基于GT200架构的制造,无论核心、PCB还是显存颗粒,成本难以控制,即便降价后的GTX260也要比HD4870贵500元。
● 打碎NV价格体系
长期以来,AMD显卡由于性能不济,价格上总要根据NV的定价策略进行调整,这种看人家脸色的日子自然不好过。而在利润丰厚的高端市场,AMD只能吃NV的残羹,NV一度霸占了中高端市场,AMD仅能在拼价格拼出货量的低端市场度日。而现在,这一切都不复存在了,凭借着超强的性能,相对低廉的价格,4800系列一经推出就重燃了玩家的那颗有些泛绿的火红的心。当4850推出后,NV紧急拿出了9800gtx大幅降价的杀手锏,而在4870推出后,刚上市不久的GT200兄弟俩,也不得不放下高昂的头,被迫降价,根据国外的报价来看GTX280/260已经最低降价至459/259美元,相信不久大陆市场也会是这个价格。
●市场反响强烈
目前,虽然高端显卡出货量不高,但是HD4870已经批量到货,很受玩家的欢迎。不少高端玩家购买4870时,就是为了4870强悍的AA性能,其实玩家对显卡的核心并没有偏见,哪个性价比高,得到的享受更好就选哪个,而一向走性价比路线的AMD这次终于扬眉吐气。真正地让玩家实惠了一把。
●HD4870终极对手——GTX260or9800GTX PLUS
笔者截稿时,迫于多方面的原因,NVIDIA已经对优异的GTX280和GTX260做出了很大的价格让步。将GTX260的价格降到比HD4870稍高的价位。而在HD4870定价2400元下面,还有9800GTX PLUS虎视眈眈,上有GTX260下有9800GTX PLUS,NVIDIA的摆出一副夹击HD4870的姿态。
不过客观的讲,在2000元的市场上,笔者十分看好HD4870,首先,HD4870处于上市初期,还有一定的降价空间,而和其性能接近的GTX260由于是GTX280的阉割版,所以成本问题很难解决。其次,本是HD4870对手的赶鸭子型产品9800GTX PLUS在市场中还难寻踪迹,虽然价格上占有优势,但是性能上的差距不小。而9800GTX PLUS实际上是高频版的9800GTX,超频空间有限,而HD4870若解决好散热问题,还有一定的提升空间。
看过HD4870的测试成绩,我们惊讶的发现,仅有256bit位宽的4870能和拥有448bit的GTX260打成平手,而从晶体管上看,仅有9亿晶体管的小核心甚至可以挑战拥有14亿的怪兽核心,这是什么原因呢?
不同于NV的做法,这次ATI在4800系列显卡的核心设计上下足了功夫。HD4850的推出已经让人为止赞叹:单槽散热,单6pin供电,较低的功耗,性能却着实领先了9800GTX直逼55nm的9800GTX+,千元出头的售价已经凸显性价比,而且无需使用大功率电源。HD4870更是凭借强劲的显存和更快的核心将优势进一步拉大,性能直逼GTX260。
当然,HD4870的实力还不足以挑战NVIDIA旗舰级GTX280,毕竟两者的规格差异太大了,但如果拿两颗RV770核心组成双核心显卡的话,那么GTX280可就危险了。通过我们的性能测试来看,在目前催化剂驱动还不够完善的情况下,HD4870 CF的性能已经完全超越了GTX280,只要ATI用心完善交火驱动,那么未来HD4870X2对抗GTX280时的优势将会更加显著!
纵观近年历史,从X1950XTX PK 7950GX2、HD2900XT PK 8800GTX、HD3870X2 PK 9800GX2,ATI代代优异显卡一直被压制着。而现在——HD4800真的要翻身了,因为NVIDIA庞大的GTX200核心再加上512Bit显存,是很难设计成双核心显卡的,而HD4870X2则给大家留下了悬念。
下一步,AMD上有更加强悍的4870X2 ,按照现在4870的性能推算,GTX280的宝座将会岌岌可危,而且ATI即将推出RV710和RV730核心的44x0,46x0产品,虽然经过一些规格上的缩水,但全新的架构执行效率大为提高,即使架构缩减性能不会弱到哪去,而这些才是市场的主流。相信Afan在相当长一段时间内在中高低端都可以扬眉吐气了。笔者也真心期待HD4000系列显卡一路走好!