ATI双卡显威力!X16XT交火性能大提速
2006年3月1日,随着ATI正式发布CrossFire Xpress 3200芯片组,X1900 CrossFire双显卡的强大火力终于被彻底释放了出来,从此ATI方面就屡创佳绩,RD580芯片组与R580双剑合璧威力无穷,捷报频频传来:
2月23日,X1900 CrossFire首次取代7800GTX 512MB SLI登上3DMark05超频王座,但由于当时玩家使用的RD580芯片组尚未正式发布,因此成绩被取消;
3月01日,RD580发布当天,X1900 CrossFire就拿下了3DMark05超频排行榜的前三名,ATI终于扬眉吐气,攻克了长期被SLI独占的3DMark05世界纪录!详细资料请看“决战双卡互联之巅 ATI X1900交火测试”;
3月18日,“X1900交火再发力!3DMark05终破20000”,RD580与R580 CF亲密无间的配合终于让3DMark05的世界纪录首次突破了两万分大关!
3月20日,X1900交火终于攻陷了最新的3DMark06排行榜,将3DMark06发布以来就一直稳居榜首的7800GTX 512MB SLI赶了下来!
如今,3DMark05排行榜前6名已全部被X1900交火拿下,当然都是在FX60和RD580芯片组的大力支持下完成的。
在最新的3DMark06排行榜上,X1900交火的表现同样非常出色,前六名当中占据了四个席位。RD580芯片组发布还不到一月就创下了如此佳绩,不由得让人刮目相看!
● ATI正式发布CrossFire Xpress 3200芯片组,专为交叉火力而生:
3月22日,ATI在北京召开发布会,面向国内正式发布了RD580芯片组。与上代RD480 Radeon Xpress 200的命名方式完全不同,此次RD580的正式名称为CrossFire Xpress 3200,一方面突出CrossFire技术,另一方面3200的含义就是能够为双显卡提供32个PCI-E通道组建全速的交叉火力!
ATI双剑合壁:双X16芯片组RD580搭配双R580交火
NVIDIA方面有经典成熟NF4 SLI芯片组,还有NF4 SLI X16为SLI提供双PCI-E X16接口,而ATI方面一直只有RD480提供双PCI-E X8接口,因此性能强悍的X1900 CrossFire无疑会受到限制。如今ATI酝酿已久的双X16平台终于发布了,RD580搭配R580双剑合璧实力非常强悍!
RD580芯片组发布还不到一月,就帮助X1900 CrossFire取得了如此骄人的成绩,在不超频的情况下即便面对NV最新的7900GTX SLI不逊色,而在超频世界纪录排行榜上也向SLI发起了挑战。那么RD580相对于RD480芯片组,到底能够给交叉火力带来多大的性能提高呢?除了高端的X1900 CrossFire,在中低端组建交火能否受益?这就是本文所要测试的内容!
双卡互联不单单是两款显卡放一块这么简单,其中所包含的技术非常复杂,实现方案也不尽相同,对于系统也有些特别的要求。
● CrossFire的实现方案与SLI完全不同:
集成在GPU内部的SLI模块和显卡外部SLI桥接器
NVIDIA在双卡互联方面具有先天优势,其GPU内部设计了一小部分运算模块专门负责双卡之间的数据传输,而我们能够看到的就是连接两块显卡的SLI桥接器,它的作用就相当于是在两颗GPU之间开启了一条专门的数据通道,是独立于PCI-E总线而存在的。
NV绝大多数显卡都配备了SLI金手指,用SLI桥接器连起来即可组建双卡互联。不过NV的驱动也开放了无桥SLI,原理就是将原本走SLI桥的数据通过PCI-E总线传递,这就需要额外占据一部分总线带宽,因此会造成性能损失,但也方便了一些无桥的低端显卡。
ATI的GPU在设计上并不能支持双卡互联,但为了对抗SLI技术,ATI通过外置合成引擎的方式在高端实现了CrossFire。主要原理就是让从卡输出的DVI数据通过外部的专用线缆传递给主卡,然后主卡上的可编程逻辑芯片将双显卡的图像合成。CrossFire模块虽然复杂,但也无需通过PCI-E接口传递数据,效率同样出色。
ATI的这种CrossFire方案并不适合用在中低端显卡之上,主要是因为复杂的合成引擎成本比较高。因此ATI只有高端显卡才拥有CrossFire主卡(目前仅有三款),而中低端显卡特意采用了催化剂驱动支配的方式,让两块显卡通过PCI-E总线传输数据,这与NV的无桥方案非常类似。
● 双显卡芯片组为何采用PCI-E X8接口?
要组建双卡互联系统,除了显卡必须支持SLI/CrossFire技术之外,主板也得满足相应的条件,最基本的就是要拥有两条PCI-E X16显卡插槽。但实际上大部分主板的两条PCI-E插槽都是工作在PCI-E X8模式,为什么不是两条PCI-E X16呢?
众所周知,NV最早推出双6800U SLI时,必须配套NF4 SLI主板,因为只有NF4 SLI芯片组能够通过转向卡将一条PCI-E X16拆分为两条PCI-E X8接口供双显卡使用。NV之所以这样做是因为当时的主板芯片组无法提供更多(32条以上)的PCI-E通道供显卡使用,因此不得以才使用了拆分方法让双显卡使用PCI-E X8接口。
当时就有人质疑双PCI-E X8接口可能会限制显卡的性能发挥,而实际上6800U刚从AGP 8X接口转型到PCI-E X16接口,以GPU的实力来讲富裕的PCI-E带宽并不能带来性能提高,因此双X8接口已经绰绰有余了。
随着双卡互联技术的迅速普及,除NV之外的其他芯片组厂商也开始推出能够支持双显卡的芯片组,比较知名的例如ATI专为CrossFire设计的RD480、Intel的975X、VIA的K8T900等,这些芯片组也是通过拆分的方法提供双X8配置,因为在芯片组中集成更多的PCI-E通道设计难度相当高,而且这些芯片组能否取得SLI或CrossFire的认证还很难说,因此除NV/ATI之外,其他芯片组厂商并不敢贸然花费精力去开发集成更多PCI-E通道的芯片组。
● 双X16芯片组横空出世:
时过境迁,随着NV 7800系列的发布,GPU性能越来越强显存速度越来越快,显卡对接口的带宽利用率也逐渐提升,因此组建SLI系统的话PCI-E X8接口的带宽开始捉襟见肘。NV正是意识到了这一点,开发了NF4 SLI X16芯片组,首次为显卡提供了两条全带宽的PCI-E X16接口,让SLI双显卡不再受到接口带宽不足的困扰!AMD/Intel平台的NF4 SLI X16芯片组
ATI方面X1800 CrossFire尚未发布,其RD580工程样品就已经基本准备就绪,RD580芯片组从产品设计到正式推出历时八个月,虽然发布时间晚于NF4 SLI X16,但这款芯片组最突出的特性就是两条PCI-E X16接口全部由北桥提供,而并非NV那种南北桥各提供一条的解决方案。
那么双X16芯片组有什么优势呢?接口带宽翻倍性能有多大提升?ATI的单芯片解决方案与NV的双芯片解决方案有何异同呢?请接着往下看:
● 双卡互联模式下的数据传输:
双卡互联模式下要求每隔一帧图像就要在两块显卡之间传输一帧图像帧数据,这个不管SLI/CrossFire采用了何种渲染模式(交替帧或分割屏)皆是如此。而且不管哪一块显卡处理某一帧图像,都会要交由一块固定的显卡(主卡)输出到显示器上。虽然NV的SLI技术看似对等的,其实最终还是由连接显示器的一块显卡作为主卡输出图像,差别就在于NV的每一块显卡都可以当作主卡。
在这一帧图像传输过程中,虽然也会有其他数据传输,但绝大多数由图像帧数据构成。一帧1600×1200 32bit的图像包含7.32MB的数据,如果要达到每秒60帧的图像渲染速度,GPU处理每一帧图像的用时就必须要少于17毫秒,而这个时间分成数据传输的时间和渲染图像的时间,当进行数据传输的时候,GPU的渲染速度实际上非常低效,所以每一毫秒的数据传输都要“斤斤计较”。
如果数据传输延迟较大的话,会对双卡互联效能造成一定程度的影响,要想让双显卡在PCI-E上得到良好性能提升,那么尽可能降低来自于PCI-E传输过程中所造成的性能损失将是一个重点。
● CrossFire Xpress 3200设计方案:
RD580芯片组也采用了传统的南北桥双芯片设计,不过RD580所有的PCI-E通道全部由北桥提供,因此可以将组建CrossFire系统两块显卡之间的数据延迟降至最低:
● CrossFire Xpress 3200芯片组规格:
以上主要介绍了有关双卡互联方面的芯片组特性,下面就来看看ATI最新CrossFire Xpress 3200芯片组的规格:
RD580芯片总共包含了2200万个晶体管,采用了台积电110nm Low K工艺制造,核心面积仅有39mm²,是当前市面上最小的北桥芯片,其设计功耗仅为8W!
Socket 939 | nForce4 SLI | nForce4 SLI X16 | Radeon Xpress 200 | CrossFire Xpress 3200 |
北桥 | 单芯CK804 | C51D | RD480 | RD580 |
工艺制程 | 150nm | 90nm+150nm | 130nm low k | 110nm low k |
南桥 | CK804 | SB450/ULI1575 | SB450/ULI1575 | |
南北桥总线 | 1GHz 16Bit HT | PCI-E X4/X2 | PCI-E X4 | |
PCI-E通道 | 20 | 18+20 | 20 | 40 |
双卡模式 | X8+X8 | X16+X16 | X8+X8 | X16+X16 |
● 小结:
RD580芯片组是ATI专门为高端游戏平台而设计,因此除了拥有两条全速的PCI-E X16接口、针对双卡互联进行专门的优化之外,还具备超强的超频能力(HT总线和PCI-E总线皆可),通过了严格的稳定性测试,发热与功耗方面都控制得相当出色!这部分内容可以参考我们之前的测试“全球同步 ATI双X16平台RD580深度评测”。
随着双卡互联技术的深入人心,组建SLI/CrossFire已经不再是高端显卡的专利,NV和ATI的中低端显卡也都能组建双卡互联,如此一来对于用户来说也有了更多的选择余地,因此对于中端显卡的CrossFire性能也是一个比较重要的内容。
为此我们除了对ATI最高端的X1900 CrossFire进行测试之外,中端主流的X1600XT更加令人关注,不限制品牌的做法更加贴近实际DIY玩家。为了检验X1600 CrossFire通过PCI-E总线达成交叉火力的效率,我们特别使用了不同品牌、不同板型的两块X1600XT显卡进行测试。
● 七彩虹镭风X1600XT-GD3 UP烈焰战神 256MB
目前在千元级市场角逐的显卡有很多款:X1600XT、X1600Pro、X800GTO、7600GT、6800GS、6600GT。其中7600GT和6800GS性能虽然优秀但是价格普遍在1500元以上,6600GT已经略显疲态,X800GTO性能尚可但规格落伍,综合来看X1600系列性价比非常出色。随着7600GT的大军压境高规格高频率的X1600XT价格有了一定程度的下滑。
七彩虹镭风X1600XT-GD3 UP烈焰战神规格上与ATI公版完全相同,频率为590/1380MHz,从型号上就可以看出采用了高速的GDDR3显存。12PS/5VS再加上高频率让X1600XT的性能表现非常出色!
七彩虹 镭风X1600XT-GD3 UP烈焰战神 256MB | |
[参考价格] | 1199元 |
[联系方式] | 海龙5092 (010-82663563) |
[报价查询] | 显卡产品报价 七彩虹显卡产品报价 |
完全公版设计,散热器更加出色
● 测试平台:
测试平台 | |
处 理 器 | AMD Althon 64 FX60 (2.6GHz、1MB L2×2 、1GHz HT) |
主 板 | Asus A8R32-MVP Deluxe(双16交火) Asus A8R-MVP Deluxe(双8交火) |
显 卡 | ATI X1900XTX(650/1550MHz) ATI X1900XT CF(625/1450MHz) 七彩虹X1600XT(590/1380MHz) |
内 存 | 威刚DDR400 512MB×2(Auto |
硬 盘 | Seagate 7200.7 80GB |
显 示 器 | 爱国者 998FD |
驱动程序 | |
显卡驱动 | 催化剂6.2WHQL |
操作系统 | Windows XP + SP2 |
● X1900 CrossFire测试成绩:
● 性能分析:
虽然RD580的PCI-E带宽翻了一倍,但X1900 CrossFire性能的提升却非常有限。从数字上看RD580完胜RD480,但无论3DMark得分还是游戏FPS提升都非常微小。
● 3DMark得分提高微小,游戏FPS提升有限:
为什么双X16的优势如此微弱?主要是因为当前的显卡并不能完全利用PCI-E X16 8GB/s的高带宽,绝大多数情况下4GB/s即可满足需求。尤其是3DMark测试工具在进行每个项目之前都已经将大量运算资料存储在本地显存上,而无需依赖接口带宽。3DMark等测试工具在设计的时候就把瓶颈放在GPU渲染本身上,而尽可能排除或者降低系统其他部分的压力,因此PCI-E X16在这方面无法体现优势;在实际游戏中,PCI-E X16也没能体现出优势,相对于双X8交火来说,FPS也就提高了2桢左右。
● 高分辨率、开AA/AF,依然没有优势:
可能不少人认为高分辨率下RD580的双X16会更具优势,其实这是对图形芯片核心架构的误解,因为上述结论是基于分辨率越高占用带宽越大的假设而得出的。
事实上,当提高分辨率打开AA/AF时,GPU的负载加剧导致FPS大幅下降,对外读取资料的次数也会减少,加上大部分数据和纹理已被载入显存,因此显卡对带宽的占用反而会比低分辨率下更少。而且双卡之间频繁的数据交换也会因为FPS的下降同步减少,双PCI-E X16的优势可能会更不明显!
● X1900 CrossFire的工作原理决定了交火效能与接口带宽无关:
另外,最重要的一点,ATI的CrossFire技术全部的数据合成都是通过Compositing Engine利用芯片将两块显卡的运算在外部进行结合,没有利用PCI-E带宽,因此理论上PCI-E X16带宽翻倍不会给双卡的效能带来任何提高!
● 那么RD580双X16微弱的性能优势源于何处?
而测试中我们所看到的RD580还是有着微弱的性能优势,这些其实全部都建立在单卡本身性能提高的基础上。可以这么想,只使用单卡的情况下,手动把X1900XTX的接口带宽降到PCI-E X8,那么它的性能自然会有些许下降。反过来说,RD580所带来的性能提升就相当于把两块显卡从接口处的微弱优势加起来。因此在单卡都无法有效利用PCI-E X16全部带宽的情况下,双X16的意义并不大!
● X600XT CrossFire测试成绩:
● 性能分析:
无论是基准3DMark测试,还是游戏测试,在同样使用两块X1600XT组建交火的情况下,RD580平台比RD480有了非常明显的性能提升,这与X1900 CrossFire的表现呈鲜明对比,给人意想不到的惊喜!
● FPS越高,性能提升幅度越显著:
综合来看,三代3DMark中03的性能提升最显著,相对来说06的幅度就小了些;而从游戏FPS来看,1024分辨率下的的桢数明显很高。这也就充分证明了我们之前所作的理论分析:在3D渲染过程中,FPS越高,组成CrossFire系统的双卡之间就需要更加频繁的交换数据,因此双X16高带宽带来的优势就越明显!
● X1600XT CrossFire的工作原理决定了交火效能与接口带宽息息相关:
X1600XT的CrossFire并没有采用专门的合成引擎,所有的数据传输全部依赖与PCI-E总线。对于目前的显卡来说,PCI-E X8接口的带宽基本够用,但是如果额外的加入双卡互联时相互传递的数据,带宽就成为性能发挥的瓶颈!
从测试成绩中可以看到,在半条命2游戏里双X8交火的性能竟然还不如单卡就是因为争抢带宽的原因!
● 软交火性能提升幅度对比:
另外,我们在“决战双卡互联之巅 ATI X1900交火测试”一文中列出了NVIDIA 7800GTX SLI和ATI X1900 CrossFire的双卡性能提升幅度对比。有兴趣的朋友可以用它作为参照,看看X1600XT“软交火”与“硬SLI、硬交火”有多少差距。
● RD580 vs. RD480对比分析:
从以上表格中可以看出,以RD580作为平台,双X1600XT即便没有CrossFire合成引擎也能获得非常高的效能!在负荷较高的3DMark06和细胞分裂中,双X1600XT相对于单卡的性能提升幅度在80%以上,个别极限模式甚至可超过100%!ATI“软交火”的效能令人刮目相看!
如果拿RD580和RD480直接对比的话,仅仅更换主板就能让显卡性能提高最多30%。在大部分游戏中FPS提升都在20%左右,这一结果令人非常满意!由此也可以看出RD580芯片组的确是专为CrossFire而生的,效能非常出色!
X1900 CrossFire基本没有从RD580中获益,而X1600XT CrossFire从RD480到RD580性能猛增30%左右,有点不可思议的感觉!
通过测试可以发现,X1900 CrossFire配合双X16的RD580其实没有多少性能提升。可以说为了那么一点性能由RD480升级到RD580其实并不划算,那为什么绝大多数玩家都对RD580非常感兴趣呢?
● RD580对X1900 CrossFire性能的贡献很小,为何优异玩家趋之若鹜?
首先,性能提高虽小终归是提升了,在RD580身上绝对不会出现性能下降的情况,分数的提高看得见,这对冲刺世界纪录尤为重要;
其次,RD580不光是将PCI-E升级到双X16这么简单,芯片组的兼容性、各个方面的性能都比RD480提高了一些,不考虑显卡从主板的角度考虑升级都是值得的;
最后,ATI着重强调RD580的超频性能非常优异,RD580与CPU之间的HT总线至少超1.5GHz,RD580与南桥之间的PCI-E总线、RD580与显卡之间的PCI-E总线频率可超140MHz以上,当然在发烧玩家手中的潜力更大!ATI最新的RD580的超频能力不亚于经典的NF4 SLI系列,由此博得了不少玩家的青睐,让CrossFire平台得以壮大,对于普及CrossFire技术功不可没!
这些都在本文开头所介绍的3DMark超频争霸赛中展露无遗,借助RD580,CPU、内存都可以超至RD480可望而不可及的地步,X1900双卡也能够更加稳定的工作,所以在RD580发布之后X1900 CrossFire才开始崭露头角,因为之前X1900 CrossFire没有好主板的配合,空有一身武艺使不出来。
如今,RD580配合R580,ATI终于有了优秀的平台得以向先入为主、深入人心的SLI技术发起挑战!
● 为何X1600XT从RD580处受益无穷?
X1900都无法有效利用PCI-E X16高带宽的优势,理论上来说X1600XT更不会占用太多带宽,为什么X1600XT的性能提升如此显著呢?
虽然ATI都称之为CrossFire,然而高端的X1800/X1900的实现方案与中低端的X1600/X1300完全不同,这一点前面已经有所介绍。
由于成本的原因,ATI并未将复杂的CrossFire合成引擎引入中低端,而仅仅是采用了驱动支配的“软交火”,简单来讲就是将原本从DVI输出的数据通过PCI-E总线传递给主卡,然后通过软件的方式将数据合成。如此一来组建CrossFire系统之后必将加剧PCI-E总线之间的负担,原本绰绰有余的PCI-E X8带宽被占用殆尽,显卡本身吞吐的数据与CrossFire双卡之间交换的数据争抢带宽,导致性能表现不理想。而RD580的出现让两块显卡之间通过宽带的PCI-E X16直接交换数据,压力顿时缓解,性能自然大幅提升!
● RD580实力不可小视,软交火性能非常出色:
通过测试可以很清楚的看到,搭配双X16的RD580主板之后,X1600XT CrossFire的性能大增,双卡相对于单卡的提升幅度达到了50%-90%,大多数游戏都在70%左右,这一比例非常令人满意,而如果只是使用双X8的RD480,那么提升幅度普遍要降低10%-20%。
ATI仅靠RD580芯片组就让“软交火”的效能提升到了可以媲美高端“硬交火”的水平,这就让中端X1600组建交火系统更加实用!由此足以看出ATI精心优化设计RD580芯片组、以及将其命名为CrossFire Xpress 3200的良苦用心。
● ATI另辟蹊径,交叉火力新出路:
ATI的交叉火力技术发展至今已经有两代共三款产品,不过现阶段CrossFire在技术上落后于SLI却是不争的事实:复杂的CrossFire导致成本增加、PCB需要重新设计、外置连接线非常麻烦不够方便、不适合用于低端产品、处理能力有限等。
目前来看ATI还没有很好的办法解决这些缺点,对于高端的X1800/X1900 CrossFire来说,只要性能强大、效能出色,纵使有诸多缺点,它依然是成功的。而中高端的X1800XL完全就是鸡肋,用X1800 CrossFire主卡配合X1800XL简直就是暴殄天物;中低端的X1600/X1300也存在同样的问题,RD480平台的软交火效能低下,实际意义并不大。
GPU在设计上并不能支持双卡互联这是硬伤,现阶段是无法挽回的,但是ATI却另辟蹊径,通过精心优化设计主板芯片组的方法,大幅提高了基于PCI-E总线交换数据的效率,让“软交火”的效能大幅提高,这种做法就相当于将一个简单的CrossFire合成引擎设计在了RD580芯片组内部,那么接下来ATI意欲何为就非常明确了:
之前就有消息称,ATI将发布无主卡的X1800交火技术,主要是针对X1800XL、AIW X1800以及AIW X1900显卡和X1900XL(尚不存在),而这些都是建立在双X16全速的RD580芯片组基础上!在3月份举办的CeBIT06展会上,ATI就展示了基于RD580平台的X1800GTO交火系统,由此可见,ATI的确是打算将“软交火”发扬光大,真正进入实用阶段!
● 总结:
CrossFire Xpress 3200芯片组的发布,ATI不但得以在AMD高端平台占有一席之地,而且让CrossFire技术真正可以同SLI平起平坐,正式向深入人心、先入为主的SLI技术发起挑战!
对于高端的X1900 CrossFire来说,RD580更多的是“精神”上的支持,优秀的系统整体性能和强大的超频能力让X1900 CrossFire向性能巅峰发起了冲击;而对于中低端的X1600/X1800来说,RD580给与“物质”上的支持,高速低延迟的双PCI-E X16可以让无主卡的交叉火力系统性能发挥到最高,彻底改变“软交火”性能低下的观念,使得交叉火力更加贴近普通用户!<