DX10显卡中端对决！HD2600大战GF8600-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

DX10显卡中端对决！HD2600大战GF8600

2007年06月29日 05:25作者：泡泡网评测室编辑：孙敏杰文章出处：泡泡网原创

“千呼万唤始出来，犹抱琵琶半遮面。转轴拨弦三两声，未成曲调先有情。”——用这句古诗来形容AMD Radeon HD 2000系列显卡真是恰如其分！

HD 2600/2400拥有很多激动人心的特性和功能，吊足了广大玩家的胃口。可偏偏雷声大、雨点小，让人望眼欲穿却又捉摸不着。今天，姗姗来迟的HD 2600/2400终于从幕后走向了前台……

2007年5月15日，AMD在全球范围内正式发布了新一代DX10显卡Radeon HD 2000系列，但实际上市的只有HD 2900XT这一款，中端HD 2600和低端HD 2400由于一些特殊的原因延期一月发布。

2007年6月13日，AMD在中国北京召开发布会，向国内用户隆重推出HD 2900/2600/2400全线显卡，此次除了高端HD 2900XT之外，AMD携众多合作厂商带来了各种版本的HD 2600/2400显卡，让中低端用户期待已久的重量级产品终于来了！

AMD屡次延期给了合作伙伴们非常充分的准备时间，几乎所有厂商都是一口气发布N款不同规格的产品。现在各大AIB和通路厂商的HD 2600/2400显卡已经全面铺货，部分大城市已经率先摆上了柜台！

{imageTitle}
ATI Radeon HD 2600和NVIDIA GeForce 8600巅峰对决

Radeon HD 2000系列显卡是AMD收购ATI以来所推出的首款重量级产品，面向主流用户的HD 2600更是重中之重，HD 2600的表现直接关系到AMD在2007下半年独立显卡市场的命运！

Radeon HD 2600与GeForce 8600是棋逢对手，中端DX10显卡大会战正式开始！

● 文章导航：

第一章卧薪尝胆之作 AMD用HD 2600/2400大打翻身仗
       第一节屡次延期，但关注度丝毫不减
       第二节晚于竞争对手两月发布，但并未错失良机
       第三节胜负之数、在此一举！看HD 2600后发制人

第二章 HD 2600/2400拥有令对手汗颜的三大卖点
       为什么被命名为HD 2000，而不是X2000？
       第一节 HD 2000全系列显卡都支持HDCP
       第二节 HD 2000系列显卡全都集成声卡，支持原生HDMI输出
       第三节竞争对手NVIDIA实现HDCP和HDMI的方案
              GPU划分369等，HDCP和HDMI的支持度不尽相同
              必须集成额外KEY ROM才能支持HDCP
              必须加装音频输入和SP-DIF线才支持HDMI
       第四节通吃HDTV的Avivo HD（UVD）引擎
              Avivo HD纯硬件解码H.264和VC-1两大格式的HDTV
              澄清：8800和2900都不支持纯硬件解码
              G84/G86支持H.264纯硬件解码，但VC-1改善有限
              UVD和G84/G86视频解码引擎的异同

第三章恐怖的硬件规模——RV630核心架构解析
       第一节 RV630 VS. G84——核心架构图对比
        第二节 RV630 VS. G84——流处理器规格解析
              此流处理器非彼流处理器
              “管线”的由来——1个时钟周期4次运算
              “管线”弊端越发明显，G8X架构改革，流处理器诞生
              ATI改进传统架构，制造庞大规模的流处理器
       第三节 RV630 VS. G84——纹理单元规格解析
       第四节 RV630 VS. G84——光栅单元规格解析

第四章 RV630技术特性介绍
       第二代统一渲染架构——源于XBOX360
       DirectX 10.0和Shader Mode 4.0
       Tessellation技术——DirextX 10.1的内容
       全新CFAA抗锯齿技术

第五章公版非公版齐上阵，Radeon HD 2600XT显卡赏析
       第一节 ATI原厂HD 2600XT GDDR4设计解析
              3.9亿晶体管的RV630核心竟如此小巧
              0.9ns GDDR4显存，默认2200MHz
              一块PCB上竟集成两套供电设计方案
       第二节 ATI公版HD 2600XT GDDR3设计解析
              非原厂设计，台湾启亨代工
              1.0ns GDDR3显存，默认1960MHz
       第三节各大厂商已上市产品集中赏析
              昂达——全固态电容散热出众
              七彩虹——四款HD 2600规格各不相同
              盈通——率先铺货全线HD 2000显卡
              蓝宝石——漂亮的非公版，用料扎实
              迪兰恒进——AIB品质公版规格
              东翎——首款非公版HD 2600XT GDDR4 512MB

第六章 HD 2600 VS. 8600性能测试
       第一节测试系统配置和设置
              3D测试项目：3DMark05/06，9款DX9游戏，3款DX10游戏
              视频测试方法说明，PowerDVD 7.3 Ultra
              视频测试项目：H.264皇家赌场、VC-1最后的武士
       第二节 3DMark05/06理论性能测试
       第三节 3大DX9经典游戏：FarCry、Half-Life2、Prey
       第四节 3大优异赛车游戏：NFS10、TDU、DiRT
       第五节其他经典游戏：COD2、SCDA、STALKER
       第六节 3大最新DX10游戏：COJ、COH、LP
       第七节抗锯齿性能专项测试
       第八节高清视频解码能力测试——VC1影片测试
       第九节高清视频解码能力测试——H.264影片测试
       第十节显卡功耗测试

第七章全文总结和中端显卡市场分析
       性能测试总结——足以击败8600
       视频性能总结——HDCP、HDMI、声卡免费赠送！
       AMD定价相当厚道，中端性价比新王诞生
       只有激烈的竞争，才会诞生更多超值的产品

第一章卧薪尝胆之作 AMD用HD 2600/2400大打翻身仗

在新一代DX10显卡的较量中，AMD高端落后NVIDIA长达半年之久，最终HD 2900XT还是没有夺回性能之王的宝座，只能走性价比路线与8800GTS 640MB竞争。AMD中低端也晚于NVIDIA两月发布，丧失先机，相信所有AFan以及关注ATI显卡的玩家都为AMD捏了一把冷汗！

第一章/第一节屡次延期，但关注度丝毫不减

就在前几天，为了“迎接”AMD HD 2600/2400的到来，NVIDIA不仅发布了入门级的8400GS，而且大幅降低了8600/8500系列显卡的售价，于是各大通路厂商的8600GT显卡瞬间降至799元，非常诱人！

为此，我们特意做了一个小调查，看看在NVIDIA咄咄逼人的攻势下，广大用户的态度如何？

在8600GT降到799元之后，依然有超过9成的网友支持HD 2600PRO！
（原文在此：你会选谁？HD 2600与86GT优缺点大对决）

调查结果让笔者大跌眼镜，居然有超过90%的网友还是鼎力支持HD 2600Pro GDDR3，如此巨大的差距真是让人始料未及！

是什么原因能够促使广大网友如此坚定不移的支持AMD呢？答案只有一个，那就是新显卡的功能、规格和性能！HD 2600的确拥有诸多8600并不支持的卖点，这些极具诱惑力的特色功能将会在后文中详加介绍。

第一章/第二节晚于竞争对手两月发布，但并未错失良机

8600抢先发布，但定位偏高，直接与昔日高端7900GS/X1950GT相竞争，由于性能没有质的提升，导致用户接受程度不如预期。至于DX10方面，时至今日依然只有三款DX10游戏，其中两款还是试玩版，再加上中端显卡根本跑不动（必须牺牲很多特效才有流畅FPS），因此卖点严重不足，难以打动消费者的“芳心”。

再看看HD 2600，它也会遭遇和8600相同的问题，性能方面很难与256Bit的X1950GT相提并论，DX10的应用范围很窄而且也很难跑动。但是，除了3D性能之外，HD 2600拥有众多激动人心的功能——核心集成声卡、集成HDCP数字解密技术、原生支持HDMI、集成UVD通用视频解码引擎、还有先进的65nm制造工艺——无论哪一样都要比8600高出一筹！

DX10、性价比、HDTV、Vista和领先的工艺

随着时间的推移，用户对DX10中端显卡的接受程度也在慢慢提高，越来越多的用户有高清视频播放和HDMI连接数字电视的需要。因此，迟来的HD 2600并没有辜负广大用户对她的期望，无论从哪方面来看，HD 2600的确是要更完美一些！

第一章/第三节胜负之数、在此一举！看HD 2600后发制人

AMD仅有HD 2900XT这一款高端显卡，而NVIDIA则拥有四员大将，8800Ultra的王者地位更是不可动摇。不过高端只是为了打形象，中低端才是兵家必争之地，尤其对于国内用户来说千元以下的显卡才是销售最为火爆的。

在AMD发布会结束之后，我们对AMD高层进行了简短的采访。AMD公司高级副总裁兼图形卡产品部总经理Rick Bergman先生指出：HD 2000系列OEM市场已经取得突破！尽管在DX10产品时间上晚于竞争对手，但凭借无可比拟的平台优势以及HD2000系列自身优秀的规格指标、性价比，“合并”所带来的平台优势在OEM市场得到非常好的表现。

AMD凭借HD 2000在OEM和零售市场均取得突破

当问及DX10产品时间上为什么落后竞争对手？AMD全球图形卡高级总监王启尚先生指出，“AMD永远希望做正确的事，而不是去选择捷径。就如同在DX9.0c，尽管产品比竞争对手稍晚一些，但推出的X1650/X1950系列都有很好的性能表现，所以说我们把DX9做正确了！在DX10这一代产品上，我们也同样如此。”

在关键的中端市场，ATI HD 2400/2600加入战局将为DX10的更替提档加速，价格走低的DX10显卡很快将成为市场主流。Rick Bergman先生充满信心表示，“拥有独特的产品特性和优惠价格的ATI将会在DX10市场后发制人，超越竞争对手NVIDIA并在年末拿到50%以上的DX10显卡市场份额。”

第二章 HD 2600/2400拥有令对手汗颜的三大卖点

广大用户认识和了解Radeon HD 2000系列显卡，大多是从其卖点开始的，也正是因为HD 2000系列拥有诸多创新的技术和功能，才使得它倍受期待！所以，首先详细解析HD 2000显卡能为大家带来什么？

为什么叫作HD 2000而不是X2000？

AMD将这一代显卡命名为HD 2000系列是有深刻涵义的，这是因为它们能够原生支持HDCP、HDMI和Avivo HD三大HD技术。

第二章/第一节 HD 2000全系列显卡都支持HDCP

HDCP主要针对蓝光和HD-DVD影碟，显卡和显示器必须同时支持HDCP解码才能够正常播放正版高清影碟，而不支持HDCP的显卡只能输出普通标清信号或者是无信号！

HD 2000将HDCP密钥集成在了GPU内部

一般的显卡要支持HDCP需要在PCB上额外集成一颗ROM芯片，而AMD在设计GPU时就将它集成在了芯片内部。这样做的好处一是降低成本、二是只要HD 2000系列显卡就肯定支持HDCP，与显卡的PCB做工没有任何关系！

第二章/第二节 HD 2000系列显卡全都集成声卡，支持原生HDMI输出

HDMI输出主要面向液晶/等离子电视用户，因为大屏电视的标配接口就是HDMI，只有显卡支持HDMI才能够同时输出视频和音频信号。

HD 2000系列显卡集成杜比5.1声道声卡，为HDMI输出音频

可能很多朋友会感到纳闷，大部分HD 2000显卡都是双DVI输出，没有提供HDMI接口，这些显卡何以支持HDMI，还能被称作“原生”？

普通DVI-HDMI转接线或者转接头市面上多得是，但这样的转接头只有图像、没有音频，而HD 2000系列显卡通过特制的转接头能够输出标准的HDMI信号，既有图像又有声音！

通过ATI显卡专用转接头，就能输出HDMI信号，且带音频

这个问题的答案我们曾在HD 2900XT的评测文章中作了非常详细的解释，这里只作简单说明：DVI是数字接头，各个针脚传输的数据都经过了编码进行串行的高频传输，只要GPU能输出音频信号到DVI接口，就可以通过特殊的转接头将数字音频信号提取出来，按照HDMI的标准传输。

R600/RV630/RV610三颗核心都集成了声卡，都可以用专用转接头将DVI变为HDMI，所以全系列HD 2000显卡都能够支持HDMI输出，不管它默认是HDMI还是DVI接口！

第二章/第三节竞争对手NVIDIA实现HDCP和HDMI的方案

● GPU划分369等，HDCP和HDMI的支持度不尽相同

8800系列全都支持HDCP，但都不支持HDMI；

8600GTS有两种：G84-400支持HDCP但不支持HDMI，G84-403支持HDCP和HDMI；

{imageTitle}

8600GT有三种：G84-300既不支持HDCP也不支持HDMI，G84-303同时支持HDCP和HDMI，G84-305支持HDCP但不支持HDMI；

8500GT有三种：G86-300既不支持HDCP也不支持HDMI，G86-303同时支持HDCP和HDMI，G86-305支持HDCP但不支持HDMI；

8400GS的分类暂不清楚，目前只清楚G84-213支持HDCP。

只有G84-403支持HDMI，普通的G84-400不支持

通过上面的核心代号可以看出，这种划分方法的确让人头痛，想要买一款支持HDCP或者HDMI的显卡，必须选特殊版本，主流走量的版本都是-300编号，大家可以对照查询。除此之外，仅有核心支持HDCP或HDMI还不够，显卡PCB必需经过特殊设计……

● 支持HDCP必须集成额外KEY ROM

NVIDIA还是通过附加ROM支持HDCP，在GeForce 8系列显卡中，高端四款8800都支持HDCP，中端8600GTS和低端8400GS默认支持HDCP，可是面向主流的8600GT和8500GT默认不支持HDCP。

8400GS显卡所集成的HDCP KEY ROM

虽说只要厂商使用特殊编号的GPU并且集成KEY ROM就能支持HDCP，可实际情况是几乎所有的86GT/85GT都不支持HDCP——这样做显然是为了节省成本！

● 支持HDMI必须加装音频输入和SP-DIF线

高端四款8800全都不支持HDMI输出，中低端8600GTS/8600GT/8500GT/8400GS默认都不支持HDMI输出，但是NVIDIA提供了HDMI解决方案：

由于NVIDIA GPU没有集成声卡，因此音频信号只能从板载声卡或者独立声卡获取，获取方式有两种，一是SP-DIF、另一种是光纤：

技嘉和华硕的HDMI显卡

无论哪一种方案都需要你的主板声卡支持才可以，SP-DIF会占用额外的音频通道，导致声卡无法输出环绕立体声，光纤输入的GF8系显卡目前还没有。

综上可以看出，N卡虽然可以支持HDCP、也提供了HDMI解决方案，但是实现起来的确要复杂很多，以至于很多厂商都不愿意推出这些特殊HDCP/HDMI的显卡，即便有也都是很难在零售市场出现的“火星卡”。

对于消费者来说，能否实现或者具体实现方式如何并不重要，最关键的就是实际使用和操作起来要方便，这一点AMD就做的非常完美——随便买一块HD 2000显卡就支持，插上装驱动就能用，优势不言而喻！

第二章/第四节通吃HDTV的Avivo HD（UVD）技术

HD 2000系列所具备的第三大HD技术也是最为重要的一项，由于涉及内容较多，所以把它和竞争对手8600/8500的视频解码引擎作对比——

● Avivo HD纯硬件解码H.264和VC-1两大格式的HDTV

Avivo HD就是新一代UVD视频解码技术，ATI首次同时支持当前流行的H.264和VC-1两种编码的HDTV，真正实现了纯硬件视频解码，将CPU占用率降至最低！

GPU集成特殊的UVD模块专门解码HDTV

HDTV和Vista、DX10一样都是大势所趋，都对新一代显卡提出了严格要求，因此AMD和NVIDIA都非常重视。NVIDIA在G84/G86核心中集成了新的BSP解码器和VP2引擎，从而加强了视频解码能力。

● 澄清：8800和2900都不支持纯硬件解码

首先需要特别指出，高端G80和R600核心的高清视频解码能力都维持在上代的水平，也就是PureVideo和AVIVO，因为NVIDIA和ATI认为使用8800和2900显卡的朋友一定会搭配高端双核甚至四核CPU，像E6600这种级别的CPU软件解码H.264/VC-1都足够了，虽然大家对此深表遗憾，但也无大碍。

● G84/G86支持H.264纯硬件解码，但VC-1改善有限

G84/G86中除了改进VP之外还加入了BSP引擎

NVIDIA方面中端G84和低端G86核心集成了BSP引擎（BitStream Processor Engine，二进制空间分割引擎），这个模块专门负责处理上代PureVideo所忽略的CAVLC（前后自适应可变长度编码）/CABAC（前后自适应二进制算术编码，压缩率更高）解码以及Inverse Transform（反变换），从而全面接管了H.264解码输出的全过程。

但是BSP引擎不能解码VC-1，只能依靠VP2和CPU共同解码VC-1视频，通过我们之前的测试来看，VP2相对于GF7系列的VP-1改善有限。

● RV630/RV610和G84/G86视频解码引擎的异同

视频解码共分为四个步骤，在GF7和X1000这一代，NVIDIA和ATI都用GPU Shader来解码视频，将最后两个步骤Pixel Prediction和Deblocking接管了过来，从而降低了CPU占用率，满足了当时中等码率的HDTV解码。

但使用Shader解码对GPU要求比较高，将GPU庞大的Shader模块调动起来的话，电能消耗一点都不低于纯CPU解码，而且面对码率更高的HDTV就力不存心了。因此GF8和HD 2000这一代的解码能力都被大幅提高：

在G84/G86核心中，NVIDIA用VP2模块负责后三个步骤的解码任务，VP2对于H.264和VC-1视频都有效。而BSP引擎专门负责H.264解码的第一个步骤，这也是负载最重的一步，但它无法解码VC-1的第一步，还是交由CPU处理。

80%—8%，GF8的H.264解码能力有了质的改善

通过BSP和VP2的配合，NV实现了纯硬件解码H.264，CPU占用率大幅下降。而VC-1方面虽然GF8比GF7多完成了第二个步骤，但这个步骤地负载并不高，因此效果有限：

38%—34%，GF8的VC-1解码能力改进有限

而AMD的UVD引擎是一个单独的模块，它能够独立负责所有四个步骤的解码任务，H.264和VC-1支持度没有区别，这样就真正做到了对蓝光和HD-DVD两大高清视频的纯硬件解码！

UVD在VC-1方面解码优势很容易理解，但AMD也表示，UVD在H.264方面的解码能力也是要略强于G84/G86，因为NV是通过BSP和VP2两个模块协同完成解码，两者之间的数据转移可能会占用更多的显存和CPU使用率，而单独的UVD模块就要稍胜一筹！

第三章恐怖的硬件规模——RV630核心架构解析

前面主要介绍了HD 2600所具备的视频解码技术和特殊功能，下面就开始进入3D领域，首先从了解它的核心架构开始。

第三章/第一节 RV630和G84核心架构图对比

RV630的总体架构和R600是相同的，只是在规格方面做了一些精简：

RV610、RV630、R600规格对比

通过上述表格可以看出，RV630拥有120个流处理器，是R600的3/8；RV630拥有8个纹理单元，是R600的1/2；RV630拥有4个ROPs，是R600的1/4；128Bit显存是R600的1/4；RV630核心集成3.9亿晶体管，是R600的1/2多一点。

由于RV630的整体架构和R600完全相同，因此关于技术介绍部分大家感兴趣的话可以查看“HD 2900XT评测一文中的相关内容：

第四章 R600核心架构解析

    第一节集众家之长，R600架构总览
        1 Xbox360图形芯片Xenos，为R600的研发积累了宝贵的经验
        2 R580架构的精髓被沿用在了R600之上

第二节 R600架构分块介绍

第三节 Command Processor（指令处理器）

第四节 Setup Engine（装配引擎）

第五节 Ultra-Threaded Dispatch Processor（超线程分配处理器）

    第六节 Stream Processing Units（流处理器）
        第一小节 SIMD架构的弊端
        第二小节 G80全新的MIMD架构
        第三小节 R600的超标量SIMD架构

第七节 Texture Units（纹理单元）

第八节 Shader Export & Render Back-Ends（像素输出部分）

第九节独立的专属缓存
 ATI片内缓存相关技术

第十节 Memory Control（显存控制器）

RV630的核心架构图

G84核心架构图

RV630和G84规格对比

当然，单看R600/RV630的核心架构比较难以理解，接下来就对RV630和G84的核心架构作一个简单对比，这样有助于深入理解两大DX10中端显卡的技术实力。

第三章/第二节 RV630 VS. G84——流处理器规格

上一代显卡的性能高低通常用“管线”来衡量，7900GT有24条（像素）管线，7900GS有20条管线，所以7900GT强。而到了DX10时代，NVIDIA和ATI都提出了流处理器的概念，“管线”已经成为历史，那么管线和流处理器之间有什么关系呢？NVIDIA的流处理器和AMD的流处理器又有多大差别呢？且听笔者慢慢道来……

● RV630 VS. G84 之此流处理器非彼流处理器

RV630拥有120个流处理器，而G84才32个，差距如此之大，但它们的性能差距并不会有这么夸张，这是为什么呢？

NVIDIA将G80的128个统一着色单元命名为Streaming Processors；ATI将R600的320个ALU命名为Stream Processing Units。一字之差导致其含义完全不同，虽然通常都称之为流处理器，但其结构相差甚远，所以无法单纯通过数量来判断其处理能力。也正是从DX10开始，NVIDIA和ATI在Shader设计方面走上了截然相反的道路，两者分别对传统的Shader架构进行了革命性改进，

但不管怎么说，无论NV还是ATI的流处理器，数量都大大增加，可是性能根本无法同上代的“管线”相提并论，比如32个流处理器的8600GTS多数情况下落后于24管线的7950GT，这是什么原因呢？

● “管线”的由来——1个时钟周期4次运算

在图形处理中，最常见的像素都是由RGB（红黄蓝）三种颜色构成的，加上它们共有的信息说明（Alpha），总共是4个通道。而顶点数据一般是由XYZW四个坐标构成，这样也是4个通道。在3D图形进行渲染时，其实就是改变RGBA四个通道或者XYZW四个坐标的数值。为了一次性处理1个完整的像素渲染或几何转换，GPU的像素着色单元和顶点着色单元从一开始就被设计成为同时具备4次运算能力的运算器（ALU）。

完美DX10!ATI新王者HD2900XT权威评测

数据的基本单元是Scalar（标量），就是指一个单独的值，GPU的ALU进行一次这种变量操作，被称做1D标量。由于传统GPU的ALU在一个时钟周期可以同时执行4次这样的并行运算，所以ALU的操作被称做4D Vector（矢量）操作。一个矢量就是N个标量，一般来说绝大多数图形指令中N=4。所以，GPU的ALU指令发射端只有一个，但却可以同时运算4个通道的数据，这就是SIMD（Single Instruction Multiple Data，单指令多数据流）架构。

● “管线”弊端越发明显，G8X架构改革，流处理器诞生

显然，SIMD架构能够有效提升GPU的矢量处理性能，由于顶点和像素的绝大部分运算都是4D Vector，它只需要一个指令端口就能在单周期内完成4倍运算量，效率达到100%。但是4D SIMD架构一旦遇到1D标量指令时，效率就会下降到原来的1/4，3/4的模块被完全浪费。为了缓解这个问题，ATI和NVIDIA在进入DX9时代后相继采用混合型设计，比如R300就采用了3D+1D的架构，允许Co-issue操作（矢量指令和标量指令可以并行执行），NV40以后的GPU支持2D+2D和3D+1D两种模式，虽然很大程度上缓解了标量指令执行效率低下的问题，但依然无法最大限度的发挥ALU运算能力，尤其是一旦遇上分支预测的情况，SIMD在矢量处理方面高效能的优势将会被损失殆尽。

传统的管线/Shader结构

可以这么理解，传统的1条管线里面包含了4个基本运算单元，在早期这种架构的执行效率还是很高的，因为大多数程序指令都是4D的。但由于API和游戏复杂Shader指令的发展，4D指令所占比重开始下降，3D/2D/1D等混合指令频繁出现，所以传统的管线式架构效率越来越低！

因此，NVIDIA从G80开始架构作了变化，把原来的4D着色单元彻底打散，构成了128个基本运算单元，称之为流处理器。这些流处理器可以按照动态流控制智能的执行各种4D/3D/2D/1D指令，无论什么类型的指令执行效率都能接近于100%！

如果硬是要把流处理器和传统管线建立一个公式的话，就应该是128÷4，因为目前4D指令还是要占很大的比例。但还要考虑到G8X的流处理器工作频率是核心频率的两倍（8600GT核心540MHz，流处理器1180MHz），所以8600GT的“管线”应该是32÷4×2=16条。

由于G84是统一渲染架构，假设给它分配4条顶点管线，那就还剩12条像素管线。540/1400MHz的86GT和76GT的频率差不多，规格（12管）也差不多，因此两者在3DMark03、DOOM3、FarCry等老游戏中的性能没有太大差距，可是一旦启动近两年发布的新游戏，8600GT的性能立刻有了质的飞跃，可达到甚至超越7900GS！由此可见G8X全新架构的威力有多么可怕，GPU的效能得到了大幅提升！

● ATI改进传统架构，制造庞大规模的流处理器

再来看看RV630核心，它实际上是24个统一着色单元（Shader），因为每个Shader当中包含了5个ALU，所以就是120个流处理器。24个着色单元假设还是分配4个顶点，那么还有20条像素管线，这个规格就要比G84多很多了。

RV630每个Stream Processing Units的结构

ATI的架构改进更容易理解一些，它并没有像NVIDIA那样将ALU彻底打散，Shader依然是Shader。但ATI通过增强ALU的运算能力以及超线程分配单元的调度能力，来提高Shader内部ALU的利用率和执行效率，从而在面对1D/2D/3D/4D等杂乱的混合指令时的表现会比上代产品强不少。

HD 2000家族超强的浮点运算能力

流处理器这个称号主要针对纯数学运算，因此R600/RV630的浮点运算能力要大幅领先于G80/G84。但是图形渲染指令要复杂很多，所以GPU资源利用率和效率就显得非常重要了。从目前的测试结果来看，ATI架构的效率确实要低于NVIDIA（当然也有驱动的原因在里面），但是RV630的硬件规模要大很多，数量优势可以弥补一切不足之处！

ATI从R520到R580核心，将像素渲染单元翻了三倍之多，但纹理单元的数量和性能没有改进，因为ATI认为今后的游戏中纹理操作指令并没有增多，而且所占比重逐年下降。到了DX10时代，ATI的流处理器阵容非常恐怖，那么纹理单元有何变化呢？

第三章\\第三节 RV630 VS. G84 之纹理单元

首先来看看RV630的对手——G84在纹理单元部分有些类似于传统的管线式架构，只不过传统GPU是每个ALU绑定TMU，而G84是每组流处理器（16个）阵列绑定一组TMU&L1&L2，这种架构非常灵活，也很容易衍生出一系列产品。

G84的2组Shader阵列绑定了纹理单元和L1/L2缓存

G84核心拥有2组Shader阵列（G80的1/4），这样总共就是8个纹理过滤单元（TF）和16个纹理寻址单元（TA），下面看看RV630有几个纹理单元？

与G84每组流处理器阵列绑定纹理单元&缓存不同，RV630的纹理单元与流处理器部分是分开的，都受到Thread Processor的统一调度，这种架构沿用R520/R580的设计，但在结构部分改动特别大。

RV630的纹理单元及缓存部分

RV630包含2组纹理单元（R600的一半），但在每个纹理单元内部包含了8个纹理寻址单元（黄色，共16个），20个32位浮点纹理采样单元（橘黄色，共40个），和4个纹理过滤单元（深红色，共8个）。

RV630单个纹理单元的内部结构

再来看看细节部分，可以看到8个黄色的纹理寻址单元和20个FP32纹理采样单元还要区分大小，这是因为顶点着色只能使用到其中4个小纹理寻址单元进行纹理采样，而像素/几何着色则可以使用全部的8个；顶点着色只能使用其中4个小FP32纹理采样单元，而像素/几何着色则可以使用全部的20个。

可能很多人都比较奇怪RV630怎么会有这么多的FP32纹理采样单元，这是因为Shader Mode 4.0只能支持128Bit色彩精度（IEEE FP32）纹理采样，而且Textures和Samplers现在是各自独立的，程序会大量使用Sampler指令，因此独立、大规模的FP32纹理采样单元可以大幅提升纹理贴图效率和高分辨率纹理精度。

现在就可以知道，RV630和G84的纹理单元数量是相等的，如此一来，X1000系列在纹理方面大幅落后于GF7系列的情况，将不会在HD 2600身上重演，HD 2600可望在老游戏和OpenGL游戏中反超GF8！

第三章\\第四节 RV630 VS. G84——光栅单元规格解析

ATI的Render Back End（后期渲染）其实就相当于NVIDIA的ROP（Raster OperATIon Processor光栅操作处理器），其主要作用就是像素输出，但是它还担负了Z（深度）操作、抗锯齿取样等繁重任务，在DX10中被称作“Output Merger”。

{imageTitle}
G84拥有2组ROP单元

G8X的架构都是分块式的，每一个ROP单元包含64bit显存控制器，G84拥有两个ROP单元，每个ROP可以处理4个像素，因此就是8个ROPs。

RV630只有1个后期输出模块

与G84相同，RV630也提供了最大8个MRT（Multiple Render Target），直接支持8xMSAA。其最大的特点就是可编程AA模式，可以在2/4/8xMSAA的基础上衍生出N多种高效率的CFAA（最大24x）。

但是RV630最大的缺点就是只有1个后期输出模块（R600有4个），这可能会导致它的AA效能偏低。

第四章 RV630技术特性介绍

GPU核心架构只是一方面，除此之外，硬件规格和技术特性也是非常重要的内容——统一渲染架构、DirectX 10、ShaderMode 4.0、Tessellation、CFAA等。RV630完整地继承了R600所有的特性和规格，因此这里的内容请看以下章节：

第二章统一渲染架构详细解析

第一节：3D图形创建原理介绍

    第二节：二次革命！R600的统一渲染架构
        第一小节：传统的显示芯片架构
        第二小节：传统架构的劣势和不足
        第三小节：ATI的第一代统一渲染架构：XENOS

第三章 DirectX发展回顾以及DirectX10详细介绍

    第一节:技术背景——DirectX 的发展回顾和API相关基本常识
        第一小节：DirectX简介
        第二小节：DirectX发展历程

   第二节 DX10的架构特性以及带来的好处
        1．降低绘制消耗
        2．降低CPU依赖性
        3．批量绘制

    第三节 ATI 3Dc功能回顾
        1．纹理压缩技术
        2．3DC技术原理
        3．3DC技术的优点

第四节 Shader Model 4.0
        1 加入了一种新的Shader——Geometry shader
        2 统一的Shader架构
        3 百倍于DirectX 9的可用资源
        4 更多的纹理
        5 更多的渲染目标（Render Target）
        6 新的HDR颜色格式

    第五节几何Shader以及 Stream Out
        1 细分的虚拟位移贴图（Displacement Mapping with Tessellation）
        2 基于边缘（Adjacency）的新算法
        3 数据流输出（Stream Output）

    第六节高级渲染语言（HLSL 10）
        1 常量寄存器（Constant Buffers）
        2 Views
        3 整形与位运算指令（Integer and Bitwise Instructions）
        4 Switch 语句（Switch Statement）

    第七节其他改进
        第一小节 alpha to coverage
        第二小节 shadow map filtering

    第八节游戏效果
       第一小节次世代Instancing技术
       第二小节基于象素级别的位移贴图技术

第五章 R600的神工鬼斧——Tessellation技术

第一节 Tessellation技术简介

    第二节传统的虚拟3D技术回顾
        第一小节通过纹理贴图获得“质感”
        第二小节凹凸贴图 Bump mapping
        第三小节法线贴图（normal mapping）
        第四小节视差贴图技术parallax occlusion mapping
        第五小节位移贴图（displacement mapping）
        第六小节 ATI的独门秘籍 Trumform

    第三节 Tessell ATIon技术
        第一小节 Tessellation技术的网格细分算法：
            第一种：离散算法
            第二种：连续算法。
            第三种：自适应算法
        第二小节神奇的小数点——细分网格算法中小数位的意义
        第三小节 Tessell ATIon效率的源泉——控制“笼子”
        第四小节顶点插值技术

第四节 Tessellation技术的流程

第五节 Tessellation技术的应用和前景

第六章游戏画质提升四倍！全新CFAA解析

    第一节抗锯齿技术及其两种基本方法
        什么叫做抗锯齿（Anti-Aliasing）
        超级采样（SuperSampling）抗锯齿
        多重采样（Multi-Sample），抗锯齿技术真正实用化

    第二节抗锯齿技术的发展
        暂时性（Temporal）抗锯齿（ATI专用）
        自适应（Adaptive）抗锯齿
        双卡互联，让AA等级成倍提高
       组合AA技术

    第三节 DX10时代，NVIDIA和ATI大幅改进AA算法和精度
        第一小节 NVIDIA GeForce 8系列全新CSAA
        第二小节 ATI HD 2000系列全新CFAA（Custom Filter，定制筛选）技术
        第三小节各个等级的AA品质对比：

第五章公版非公版齐上阵，Radeon HD 2600XT显卡赏析

了解了ATI中端主力RV630的核心架构和技术规格之后，现在就来看看HD 2600XT显卡实物：

第五章/第一节 ATI原厂HD 2600XT GDDR4设计解析

HD 2600XT GDDR4采用了全尺寸大板PCB，散热器风格和高端HD 2900XT非常相似，只不过HD 2600XT的散热器是单槽版本，体积很小。

取下散热器就可看到PCB设计和X1950Pro有些相似，但显存只需要四颗就能满足128Bit的位宽需求。

PCB背面预留了四个显存空焊位，因为正面四颗最高只能组成256MB的容量，如今新游戏的显存要求很高，未来推出512MB版本还是很有必要的。

● 3.9亿晶体管的RV630核心竟如此小巧

RV630核心，65nm工艺，默认频率高达800MHz

由于集成了额外的UVD引擎、声卡模块、HDMI混音和输出部分、交火引擎，所以RV630核心晶体管数膨胀，RV630拥有3.9亿晶体管这已经超过了上代高端R580核心！

RV630核心面积148mm²，G84核心面积160mm²

不过在65nm工艺的帮助下，RV630核心面积非常小巧，甚至比G84还要小，功耗发热控制的也不错（大家注意HD 2600XT GDDR4无需外接供电），噪音相信也能令人满意。

● 0.9ns GDDR4显存，默认2200MHz

显存采用了三星0.9ns GDDR4颗粒，4颗组成256MB 128Bit的规格，默认频率高达2200MHz。

● 一块PCB竟集成两套供电设计方案

供电部分比较复杂，大家可以看到有好多空焊位，这在ATI“原厂卡”上还是头一次出现。这是因为ATI在这小小的供电模块设计了两套完全不同的供电回路，显卡厂商既可以使用与R600一样的VOLTERRA优异数字供电方案（上图中空焊），也可以使用传统的PWM多相式回路。这样的两套方案主要是考虑到世界各地工厂采购原料的难易程度，以及成本控制的需要，给AIB不同的选择。

目前大家看到的HD 2600XT GDDR4都采用了2+1相供电设计，用料也很豪华，三洋固体电容+钽聚合物电容，核心供电部分每相都使用了2个磁闭电感和3个MOS，通过分流降低供电模块发热。

还可以注意到，这块公版PCB预留了6pin供电接口，如果有厂商想要采用高频512MB GDDR4，那么就可以直接使用公版PCB，只需加强供电模块就行了。

● 双DVI接口，照样支持原生HDMI

前面已经介绍过了，HD 2000系列即便没有集成HDMI接口，也能通过DVI输出HDMI信号，并且带音频输出，只要使用ATI专用的转接头就行了。

第五章/第二节 ATI公版HD 2600XT GDDR3设计解析

上一款HD 2600XT GDDR4是ATI原厂公版设计，而这里要介绍的HD 2600XT GDDR3虽然也是公版，但并非是原厂设计，而是交由台湾AIB启亨设计制造：

● 设计风格类似于X1950GT、X1650GT

实际上去年ATI发布的X1950GT和X1650GT也都是由启亨设计制造的，这款HD 2600XT GDDR3的设计风格就没有多大变化。

● 65nm RV630核心，默认800MHz

● 1.0ns GDDR3，默认1960MHz

最大的变化就是显存，改用了1.0ns的颗粒，默认频率是1960MHz，虽然比GDDR4版本低了240MHz，但由于GDDR3的延迟低，因此实际性能未必输给GDDR4。

● 供电依然是2+1相设计，保证高频稳定运行

核心两相，显存供电在PCB右上角

● 直接集成HDMI输出

这款PCB直接集成了HDMI输出，这样显卡就不必再附送一个ATI特制的转接头，因此成本要更低一些，但灵活性不如双DVI的设计方案。

第五章/第三节各大厂商已上市产品集中赏析

● 昂达——全固态电容散热出众

昂达这款HD 2600PRO，做工用料散热都很突出，默认频率甚至比很多HD 2600XT都高，超频能力值得期待。

● 七彩虹——四款HD 2600规格各不相同

此次七彩虹对HD 2600/2400系列显卡非常重视，一口气推出了四款HD 2600XT/Pro显卡，各种频率规格都有，令人眼花缭乱。

四款显卡采用了完全相同的PCB，都是前面介绍的启亨公版，只是搭配的核心和显存不同，其中白金版采用了三星1.0ns颗粒，而黄金版是奇梦达1.3ns颗粒。

    镭风2600XT-GD3 CF白金版 256MB，800/1960MHz
    镭风2600XT-GD3 CF黄金版 256MB，800/1600MHz
    镭风2600PRO-GD3 CF白金版 256MB，800/1800MHz
    镭风2600PRO-GD3 CF黄金版 256MB，650/1400MHz

● 盈通——率先铺货全线HD 2000显卡

全部65nm！盈通4款HD 2000显卡齐亮相

相信大家还记得在ATI发布HD 2900XT当天，盈通就率先将产品摆上了货架，而且组织了2899元团购HD 2900XT的活动。今天ATI正式发布HD 2600和2400系列显卡，盈通凭借与ATI良好的合作关系，再次抢得先机同步推出了多个版本的显卡。

● 蓝宝石——漂亮的非公版，用料扎实

蓝宝的卡每一款都很有个性，结构看上去普普通通，但外观确实很漂亮。

当然该卡的做工用料也令人刮目相看，6层PCB，日本化工固态电容，完整的低通滤波模块，以及比公版更强的漂亮散热器。这款HD 2600Pro GDDR4默认频率为800/1600MHz。

● 迪兰恒进——AIB品质公版规格

迪兰这两款HD 2600XT和2600PRO规格中规中矩，但是PCB设计明显比通路高出一筹，体现出了AIB的设计实力，价格方面也很厚道。

● 东翎——首款非公版HD 2600XT GDDR4 512MB

极速0.7ns GDDR4 非公版HD2600XT赏析

东翎（ZERO）作为新进入大陆市场的AIB厂商，凭借多年来的板卡研发经验，率先发布了首款非公版设计的HD 2600XT GDDR4显卡，除了优秀的非公版设计之外，在各项技术规格方面也令人惊讶不已：

    搭配大容量512MB GDDR4显存
    采用最快的0.7ns GDDR4显存颗粒
    改进的供电模块，配备6pin供电接口
    采用有口皆碑的思民VF900-Cu散热器
    标配HDMI接口，无需转接

第六章 HD 2600 VS. 8600性能测试

第六章/第一节测试系统配置和设置

为了统一测试平台，我们使用了Intel高端最强的X6800 CPU，搭配975X主板，这样能够完全发挥出显卡的3D效能，而且可以方便进行横向对比。

PCPOP.COM泡泡网显卡评测室
硬件系统配置
处理器	Intel Core 2 Extreme X6800 双核心, 2.92GHz, L2=4MB
主板	ASUS P5W64 WS Professional (975X)
显卡	HD 2600XT GDDR4 (800/2200MHz) HD 2600XT GDDR3 (800/1960MHz) HD 2600XT GDDR3 (650/1800MHz) 8600GTS (675/1450/2000MHz) 8600GT (600/1240/1600MHz)
内存	海盗船Corsair CM2X512-8500 2x 1GB DDR2-1066 (800 MHz, CL 5-5-5-15-1T)
硬盘	希捷Seagate ST380011AS
电源	TT Toughpower 750AP, 750W
软件系统配置
操作系统	Windows Vista Ultimate
DirectX	10.0
显示驱动	Forceware 158.45Beta Catalyst 8.38.9.1-RC2

由于ATI两款公版设计的HD 2600XT频率都很高，因此我们特意加入了一款频率较低非公版，默认650/1800MHz，事实上很多HD 2600PRO GDDR3的频率都要超过它。

对比测试自然少不了NVIDIA的8600GTS和8600GT，其中8600GTS为公版默认频率675/1450/2000MHz，但是8600GT并非是公版的540/1180/1400MHz，因为市面上很难找到一款频率如此保守的8600GT显卡，所以我们选择了已经大量出货的通路799元8600GT，默认频率600/1240/1600MHz。

测试基于Windows Vista Ultimate平台

● 游戏性能测试项目

越来越多的用户开始使用vista操作系统，而且想要体验新一代DX10显卡全部功能就必须工作在Vista系统下，因此我们此次所有测试都是在vista系统下进行的，包括游戏、视频和功耗测试。

       第二节 3DMark05/06理论性能测试
       第三节 3大DX9经典游戏：FarCry、Half-Life2、Prey
       第四节 3大优异赛车游戏：NFS10、TDU、DiRT
       第五节其他经典游戏：COD2、SCDA、STALKER
       第六节 3大最新DX10游戏：COJ、COH、LP
       第七节抗锯齿性能专项测试
       第八节高清视频解码能力测试
       第九节显卡功耗测试

● 视频性能测试方法说明：

相信更多的朋友关注的不只是3D游戏性能，而是HD 2600的视频加速能力，因此在游戏测试结束之后我们还会进行1080P视频播放测试。

测试平台不变，CPU更换为较弱的入门双核PD805（双核2.66GHz、L2=1MB×2）和入门单核CD3.06GHz，这样的话CPU占用率的差别就更加容易表现出来。

最新版本的PowerDVD能够完美支持NVIDIA新一代PureVideo HD2技术，对于AMD新一代Avivo HD（UVD）也完美支持，而且在vista下工作非常稳定，因此我们用它来播放HDTV视频，完成2600和8600的视频对比测试。

CPU占用率使用vista自带的性能监视器，统计100秒内播放视频时的平均值，然后绘制表格进行对比。

● 视频性能测试项目：

视频解码能力超强！HD2400XT名不虚传

H.264编码的测试影片选择了《007之皇家赌场》，索尼哥伦比亚出品蓝光H.264版本，平均码率大概35Mbps左右，峰值可达45Mbps以上，属于高码率！

CPU占用率仅1%！UVD高清视频加速初测

VC-1编码的测试影片选择了汤姆·克鲁斯主演的《最后的武士》，HD-DVD版本VC-1编码，平均码率大概是20Mbps，最高30Mbps，属于中等码率。

一切准备就绪，下面开始测试。

第六章/第二节 3DMark05/06理论性能测试

FutureMark公司出品的3DMark系列是目前最权威的专业显卡测试软件，3DMark05/06两代软件都在服役：

● 3DMark05

3DMark05是款纯DX9测试，从以往的经验来看偏向于像素渲染，拥有众多像素单元的X1000系列优势比较大。而HD 2000采用了统一渲染架构，那么其表现如何呢？

{imageTitle}

虽然HD 2600XT GDDR4的显存频率要比GDDR3版本高240MHz，但是它的3DMark05得分反而要低一些，这主要是因为GDDR4的延迟较高。

实际上通过后文中的游戏测试来看，GDDR4和GDDR3版的性能相差无几，总体来看还是高频率的GDDR4略占优势。

● 3DMark06

3DMark06作为目前最新的综合测试工具，包括了两个SM2.0测试和两个SM3.0测试场景，基本上达到了DX9C的画面最高境界，其测试结果对于很多主流游戏都有参考价值。

{imageTitle}

从3DMark06的测试成绩就可以看出，HD 2600XT的SM2.0得分落后8600GTS比较多，但是SM3.0得分要比SM2.0高400多分，一举反超8600GTS，看来HD 2600XT在DX9C游戏中将会有不错的表现。<

第六章/第三节 3大DX9经典游戏：FarCry、Half-Life2、Prey

FarCry、Half-Life2和DOOM3是DX9平台经久不衰的三大经典FPS游戏，由于使用这三大引擎的游戏数量众多，因此是我们显卡评测的必测项目。

● FarCry（孤岛惊魂）——首批经典DX9游戏，支持HDR：

双核心最强显卡!NV新旗舰7950GX2测试

FarCry是一款比较老的DX9游戏了，普通模式下对显卡的要求并不高，它以频繁更新的补丁而闻名。给FarCry打上一款款补丁之后，这款老游戏不但兼容性、游戏性得到了增强，而且它也成为了首批支持HDR技术的游戏之一，在高分辨率下打开HDR或者AA时，高端显卡也很难跑出高FPS。

游戏效果设置：内置所有特效全开最高（包括HDR和8xAF，不开AA）

{imageTitle}

虽然是老游戏，可打开HDR对几款显卡还是造成了不小的压力，FPS很难超过60帧。总体来看还是8600GTS稍胜一筹，但领先优势很微弱。

● Half-Life2:Episode One（半条命2：第一章）——Source引擎最新作

最早的半条命2连集成显卡都能跑得很顺畅，后期的资料片虽然还是基于Source引擎，但Valve一直都对引擎做改进和优化，大家所熟知的《失落海岸》和现在的《第一章》画面都有明显提高，能够支持HDR，同时对显卡提出较高要求。

游戏效果设置：内置所有特效全开最高（包括HDR和16xAF，不开AA）

{imageTitle}

半条命2和FarCry的情况差不多，这次是HD 2600XT领先，但领先幅度也不大。

● Prey（掠食者）——Doom3引擎的最新OpenGL游戏：

Prey这款游戏并不算老，但它依然采用了略显老迈的DOOM3引擎，因此我们用它来代替传统的Doom3和Quak4，做为唯一一款OpenGL游戏进行测试。

{imageTitle}

在N卡的传统强项OpenGL游戏中，HD 2600XT得以领先8600GTS，看来较多的纹理单元起到了关键性作用。

第六章/第四节 3大优异赛车游戏：NFS10、TDU、DiRT

风靡欧美的赛车类游戏近年来受到越来越多国内玩家的喜爱，《优品飞车》系列一直都有大批的忠实玩家，《无限试驾》可以体验到全新的游戏模式，最新的《克林麦克雷》则是追求真实的操作！

同为赛车类游戏，操作感却相去甚远，但它们有个共同点就是对显卡要求极为苛刻！下面就为大家献上三大优异赛车游戏的性能测试：

● Need for Speed Carbon（优品飞车10：卡本峡谷）

优品飞车10和前作优品飞车9相比，加入了动态模糊特效，大幅改善了赛道以及周围物景的渲染细节，画面整体质量大为改观，当然游戏对显卡资源的消耗也比前作更为苛刻，总体来看对像素渲染提出了很高的要求。

按照以往的成绩来看，X1000大胜GeForce 7，那么如今的HD 2000能否继续保持对GeForce 8的远远领先呢？

游戏效果设置：内置所有特效全开最高（包括各项异性过滤，不开AA）

由于优品飞车10对显卡的要求很高，中端显卡开AA无法保证流畅的FPS，因此测试模式为内置效果全开最高，包括各项异性过滤，但不开AA。

{imageTitle}

X1000系列在优品飞车10中拥有对GF7的决对领先优势，现在这一优势延续到了HD 2000身上，HD 2600XT大幅领先于8600GTS！

● Test Drive Unilimited（无限试驾）：

优品飞车10以漂移和速度而著称，而无限试驾强调的是真实感，游戏内容也更加丰富多彩，将游戏和休闲生活结合在了一块。而游戏画面也是别具一格，HDR光照无处不在，同时开启HDR+AA对显卡提出了很BT的要求。

游戏效果设置：内置所有特效全开最高（包括HDR但不开AA）

TDU能够直接支持X1000/HD 2000/GeForce 8的HDR+AA技术，但只有HD 2900和8800才能流畅运行，因此这里的测试只开HDR不开AA。

{imageTitle}

差距在1帧之内，只能说是打成平手。

● Colin Mcrae：DiRT（科林麦克雷拉力赛：尘埃）

这款以传奇拉力赛车手科林麦克雷为卖点的赛车游戏，追求精美的画面和真实的操作感。引入了经过授权的真实赛车，以及遍布世界各地的真实赛道。本作除了WRC世界拉力锦标赛外，还加入了许多不同种类的拉力越野赛事，让玩家尽享尘土飞扬的乐趣，其名称也由此而来。

画面设置选择游戏预设中的“Medium”，将AA关闭，其他设置保持不变，这种模式刚好可以让8600和2600等中端显卡跑出较为流畅的FPS。

{imageTitle}

克林麦克雷是目前最BT的DX9C游戏，对显卡的苛刻要求不输给失落星球等DX10游戏，8600/2600只能在1280分辨率下开中等特效跑出勉强的FPS，分辨率再高就完全没法玩了。

第六章/第五节其他经典游戏：COD2、SCDA、STALKER

经典游戏已经难不到如今的中端显卡了，接下来就进行几款对显卡要求很高的游戏，从XBOX360移植而来的COD2、全新引擎的SCDA和最近流行的STALKER。

● Call of Duty2（使命召唤2）：

使命召唤2使用了全新3D引擎设计不但让游戏画面更为细腻，而且在即时光影、爆炸、火光、烟雾等效果呈现上更为逼真，让玩家有亲临战场般的震撼，甚至游戏中还能玩家使用烟雾弹，或是靠烟雾因引来隐匿行踪，以及支援各种气候变化、晨昏光影变化而产生的视觉隐匿效果等，让游戏的战斗过程更逼真。

正是因为这些看似不起眼AI效果的使用，COD2对显卡的要求也是比较高的，高端显卡要上60帧也非常不易！

游戏效果设置：内置所有特效全开最高（包括各项异性过滤但不开AA）

{imageTitle}

COD2是款XBOX360移植游戏，上代显卡X1950比GF7有更多的优势，不过新一代8600GTS的性能却要略高于HD 2600XT。

● Splinter Cell：Double Agent（细胞分裂：双重间谍）

作为一款潜入类游戏，双重间谍的画面风格一如既往地潮湿昏暗，此时HDR所带来的光影效果就显得尤为重要，启用HDR之后能够充分的展示出一个间谍在夜晚中的秘密行动，同时渲染出来的黑暗环境也不会单调乏味。

游戏效果设置：内置所有特效全开最高（包括HDR和16xAF，不开AA）

双重间谍能够让A卡直接支持HDR+AA，但N卡需要特殊手段，对于中端显卡不开AA才能有流畅的速度。

{imageTitle}

细胞分裂4对显卡的要求也很高，特效全开并且开启HDR后8600/2600的表现都还不错，1280分辨率就能流畅玩了，两者的性能也相差无几。

● S.T.A.L.K.E.R（切尔诺贝利阴云）：

一款以切尔诺贝利核电站大爆炸为背景的FPS游戏，被融入了大量RPG游戏的元素，由此让该款游戏的可玩性大大增加，这款游戏虽然跳票四年之久，但还是加入了SM3.0支持，以及大量的HDR和动态光影效果。虽然游戏画面整体风格可能比不上众多新引擎的游戏，但S.T.A.L.K.E.R对显卡的要求还是非常高的。

游戏效果设置：内置所有特效全开最高
（包括HDR和16AF，此游戏不支持HDR+AA）

{imageTitle}

STALKER的成绩比较奇怪，1280分辨率下8600GTS领先于HD 2600XT，可当分辨率提高至1680之后，8600GTS性能下降很多，而HD 2600XT的性能损失很小，反复测试多次结果都是如此。

第六章/第六节 3大最新DX10游戏：COJ、COH、LP

5月份先后有3款DX10游戏公开发布，其中有《狂野西部》DX10测试版、《失落星球》DX10试玩版和《英雄连》DX10正式版补丁——现在DX10显卡终于告别了没有DX10游戏可玩的局面。

HD 2600和8600作为AMD和NVIDIA新一代DX10主力显卡，那么它们在DX10游戏下面的表现如何非常重要，因此我们将三款DX10游戏都拿来作为重点测试项目！

● Call of Juarez（狂野西部）

COJ是最早泄露出来的DX10游戏，但此前NVIDIA曾表示游戏有作弊嫌疑，因为N卡在开启AA之后无法运行游戏，而且测试成绩偏低。

为了保持测试的权威性和公正性，我们使用了官方网站上提供的COJ最新测试版本，游戏程序生成日期为5月25日。这个版本对N卡和A卡的兼容性都非常好，暂时没发现什么BUG。

{imageTitle}
COJ DX10视频设置：最低模式

测试时发现COJ DX10对显卡要求很高，特效全开最高的话HD 2900XT跑起来也有些卡，所以我们将游戏画面设置降为最低，从而保证合适的FPS。测试模式为1280×720（720p）Low noAA。

{imageTitle}

测试结果毫无悬念，2600XT继承了2900XT的架构，在COJ DX10中大幅领先于8600GTS。

● Company of Heros（英雄连）

《英雄连》本身就是款非常值得一玩的游戏，画面风格、细节处理、可破坏场景和AI设置都令人感到眼前一亮，此次DX10版本的推出让游戏的光影效果得到了明显改善、纹理贴图质量也是大幅提升，这使得《英雄连》与其他几大RTS游戏相比更具特色。

在已经发布的三款DX10游戏中，没有一款是等闲之辈，如果特效全开最高，即便8800Ultra和HD 2900XT这样的优异显卡跑起来都很吃力。所以在测试中端显卡时必须牺牲很多特效。

游戏视频设置图

测试模式选用了NVIDIA官方为8600GTS推荐的游戏设置，如上图所示，大部分设置开到Medium，分辨率为1280×1024，不开AA。

{imageTitle}

COH是目前唯一一款正式版DX10游戏，需要特别指出的是COH是NVIDIA The Way游戏之一，对N卡的兼容性和支持度非常好。

HD 2600XT能够在COH中领先于8600GTS的确是难能可贵，其DX10效能表现令人非常满意！

● Lost Planet（失落星球）

《失落星球》这款游戏是由XBOX360移植而来，由于NVIDIA参与了游戏的开发，因此这款游戏对N卡支持的非常好，而AMD则表示并不知情，目前的测试结果并不能代表HD 2000系列的真正性能。

由于目前DX10游戏并不多，因此还是保留了《失落星球》DX10测试，成绩像COJ一样供大家参考。

同样的，全部开HIGH只会让所有中低端DX10显卡成绩呈现个位数，这样没有任何实际意义。我们将一部分只有LOW和HIGH选项的设置为HIGH，有MEDUIM的选项设置成设置成MEDUIM，个别选项有所调整，具体设置如上图所示。

{imageTitle}

就如同HD 2600XT在COJ DX10中大胜8600GTS一样，在LP DX10中是8600大获全胜。但需要记住，NVIDIA参与了LP DX10的移植工作，AMD表示不承认A卡在LP DX10中的性能表现。

但通过测试我们还是看到了AMD所做出的努力，使用新驱动后，HD 2000系列运行LPDX10花屏的现象已经没有了，我们期待在LPDX10正式版中，A卡将会有更好的表现！

相关新闻：《提升游戏性能![失落星球]A卡补丁下载》

第六章/第七节抗锯齿性能测试

在前面的游戏测试中，我们都没有开启AA，这是因为很多新游戏对显卡的要求都很BT，对于中端显卡来说游戏内置特效全开跑起来都很吃力，开AA后FPS大跌根本无法流畅运行，十几帧甚至个位数的测试成绩并无实际意义。

比如三款DX10游戏都必须牺牲特效才能勉强保证20帧左右的成绩，DX9最新作DiRT也必须降低特效，SCDA、STALKER等游戏开HDR就无法开启AA。但有些老游戏开AA还是有意义的，这里我们进行了AA专项测试：

{imageTitle}

3DMark05不开AA的话HD 2600XT落后8600GTS并不多，但开AA后差距被拉开。

{imageTitle}

Prey这款OpenGL游戏中，不开AA HD2600XT得以超越8600GTS，但开AA后成绩下降很多。

{imageTitle}

在半条命2：第一章中也存在相同的问题，HD2600XT原本领先的成绩基本都被8600GTS反超。

通过咨询AMD官方之后，我们得到的消息是目前的驱动依旧不完善，AA效能不如人意。实际上在测试时我们也发现部分游戏项目成绩不正常，主要表现在场景切换或者Loading完成之后画面比较卡，由此导致平均FPS偏低，这在3DMark系列里面尤为明显！

HD 2600XT能够在绝大多数游戏项目中领先于8600GTS，反而在以往的强项3DMark05中失守，驱动出问题的可能比较大，相信今后放出新驱动之后性能还会有提升！

第六章/第八节高清视频解码能力测试

首先特别指出，RV630/RV610核心都集成了UVD模块，因此他们的视频解码能力没有任何区别，不同的频率、显存所造成的影响非常微小，基本可以看作是误差。对于G84/G86核心来说它们的解码能力也基本没有区别，这已经在我们之前8400GS的评测中得到证实。

因此这里的视频解码测试只用了两块卡作对比——HD 2600XT GDDR4和8600GTS，他们可以代表ATI UVD引擎和NVIDIA BSP+VP2的解码能力。

● 最后的武士——VC-1 1080P解码测试

CD3.06+HD2600XT播放VC-1时CPU使用率截图

CD3.06+8600GTS播放VC-1时CPU使用率截图

测试结果毫无悬念，由于8600GTS解码VC-1还是需要CPU配合，因此CPU占用率远高于HD 2600XT。

可以看出，单核心的赛扬D 3.06性能太差，无法通过软件完成VC-1解码，不过开启8600GTS的PureVideo技术后，GPU和CPU配合已经足够流畅播放了，虽然CPU使用率还是偏高。而HD 2600XT使用UVD独立完成VC-1解码，CPU占用率只有13%，赛扬D都能如此空闲。

换用双核心的PD 805之后，软件解码已变为可能，但8600GTS的辅助解码还很有效果，CPU从65%下降至34%；HD 2600XT更强，占用率仅为4%，纯硬件解码的确名不虚传！

● 【最后的武士】截图欣赏

● 007皇家赌场——H.264 1080P解码测试

CD3.06+HD2600XT播放H.264时CPU使用率截图

CD3.06+8600GTS播放H.264时CPU使用率截图

对于H.264来说，虽然8600GTS和HD 2600XT都是纯硬件解码，但通过多次反复测试来看，8600GTS的CPU占用率的确要比HD 2600XT稍高一点。

{imageTitle}

对于平均码率高达35Mbps的H.264视频来说，即便是双核PD805也无法软件解码，此时8600GTS和HD 2600XT的表现都不错，虽然有差距，但并不大，实际使用很难察觉到。

但毕竟差距还是存在的，UVD的确更胜一筹，CD3.06平台下比BSP+VP2低1.5%，而PD805平台下低3%。这可能就是BSP+VP2两个模块协同解码与UVD单独解码的差距吧。

● 【007皇家赌场】截图欣赏

第六章/第九节显卡功耗测试

RV630核心虽然使用了先进的65nm工艺，但同时我们也应该知道RV630核心内部包含了多达3.9亿晶体管，整整比G84多了一亿，另外HD 2600XT的核心频率高达800MHz，因此HD 2600XT的功耗到底高还是低很难说。下面我们就针对HD 2600XT的功耗进行专项测试。

我们的功耗测试方法就是直接统计整套平台的总功耗，既简单、又直观。测试仪器为Seasonic的Power Monitor，它通过实时监控输入电源的电压和电流计算出当前的功率，这样得到的数值就是包括CPU、主板、内存、硬盘、显卡、电源以及线路损耗在内的主机总功率（不包括显示器）。

只要把PSU电源线插在Seasonic的Power Monitor上，然后把Monitor插在电源插座上，就可以量测整个平台的消耗功率。测试平台保持不变，测得的总功率包括975X主板、PD 805 CPU、2GB内存、两块硬盘，再加上一块显卡的总功率。

这里注意CPU已经更换为PD 805，这是为了方便测试视频播放的功耗。测试显卡只选择了两块原厂公版卡：HD 2600XT GDDR4和8600GTS，其他频率的显卡未加入测试，因为非公版显卡频率并不标准，而且可能会出现偷加电压的情况，测试结果参考价值并不大。测试结果如下：

{imageTitle}

首先是待机模式，1080p分辨率Vista桌面待机，开启了Aero玻璃特效，因此功耗会比XP桌面高一些，结果是HD 2600XT GDDR4比8600GTS高了12W，不过GDDR3版本居然比8600GTS还要低，看来供电部分的设计差距很大。

{imageTitle}

3D模式的测试方法为默认分辨率跑3DMark06的最后一个场景，冰天雪地的粒子效果和HDR效果对显卡提出了很高要求。测试结果还是HD 2600XT的功耗高一些，但只高了3W，差别并不大。

{imageTitle}

然后是视频播放测试，用PowerDVD打开硬件解码全屏播放HDTV，此时CPU占用率很低，GPU Shader模块闲置，硬解码模块工作。由于HD 2600XT本身待机功率就高，因此播放视频时还是比8600GTS高9W。

{imageTitle}

播放VC-1视频的时候就是另一种情况了，由于8600GTS的CPU占用率比HD 2600XT高不少，因此最终系统整体功耗也要高。8600GTS比HD 2600XT GDDR4高14W。

总的来看HD 2600XT GDDR4的表现还是不错的，它的功率并不比8600GTS高多少，毕竟它的默认频率太高，晶体管数也很多，靠65nm工艺将功耗控制在这种地步已经向相当不容易。

实际上低频率版的HD 2600Pro功耗要比HD 2600XT低很多，另外GDDR3显存版也要比GDDR4低一些，总之这些显卡都无需外接供电，功耗和发热问题不必在意。

第七章全文总结和中端显卡市场分析

● 性能测试总结——足以击败8600

在9款DX9游戏和3款DX10游戏的性能测试中，HD 2600XT在COJ DX10、HL2、Prey、NFS10、STALKER五款游戏中比8600GTS有较大优势，在TDU、SCDA、COH DX10、DiRT四款游戏中和8600GTS斗得难解难分，HD2600XT有些优势但并不明显；在FarCry、COD2两款游戏中小幅落后于8600GTS，只有在LP DX10中大幅落后。

总的来看，HD2600XT并没有让人失望，在驱动还不完善的情况下，已经足以击败NVIDIA中端最强者8600GTS，这个结果让人非常满意！

功耗方面，我们的测试结果是HD 2600XT稍高于8600GTS，不过GDDR3的版本要稍低一些，看来不同的PCB设计对显卡的功率影响很大（主要是电压），好在功耗都不大。

● 视频性能总结——HDCP、HDMI、声卡免费赠送！

从一开始广大用户就对HD 2600/2400的视频性能寄予厚望，从我们实际测试的情况来看，HD 2600/2400所具备的三大HD技术的确名不虚传：VC-1完胜8600/8500，H.264也有一定的优势。

虽然8600/8500也能胜任HDTV播放，但需要注意的是，市售几乎所有的8600/8500显卡都不支持HDCP，能够支持HDMI的N卡更是寥寥无几。想要组建家庭影院的朋友无需任何考虑随便买一块HD 2600/2400显卡回去就能满足要求。

HDCP、集成声卡、HDMI就当作是AMD送给广大用户的免费礼物吧！

● AMD定价相当厚道，中端性价比新王诞生

AMD官方对HD 2600系列显卡的官方建议零售价格为：

HD 2600XT GDDR4——1199元
HD 2600XT GDDR3——799-999元（依厂商规格而定）
HD 2600PRO GDDR3——699元
HD 2600PRO GDDR2——599元

再来看看NVIDIA中端显卡的官方建议售价：

8600GTS——1399元
8600GT——799-1099元
8500GT——599元

AMD厚道的定价让HD 2600比起8600更具性价比，其中HD 2600PRO GDDR3版本目标直指8600GT，HD 2600PRO则用来和8500GT竞争，NVIDIA的中端产品线遭受到了前所未有的压力！

除了性能和价格，别忘了HD 2600系列还有很多8600所不具备的功能，三大HD卖点很可能会左右消费者的选择！

● 只有激烈的竞争，才会诞生更多超值的产品

回想3年前，R9550与FX5700之争让不少DIY玩家用上了高性价比的DX9显卡；而在今天，HD2600的到来同样促使DX10显卡步入平民。那些不屑于2400/8500游戏性能的DIY用户，高性价比的HD2600或8600将成为当前DX10显卡里最具性价比的选择。

在AMD发布HD 2600前夕，NVIDIA对8600系列显卡进行了大调价，8600GTS和8600GT分别降价200元。而首款在中关村上市的2600Pro DDR3-1.0ns定价仅为699元！面对即将来到的暑期市场，一场腥风血雨的DX10大战又将不可避免打响。作为消费者的您，准备好了吗？

如果您有更多的观点和想法要同其他读者分享，请在本文评论中畅所欲言……

● AMD正式发布HD 2600，您对它有何看法？

HD2600当中，你最看好哪款型号？

HD2600XT DDR4
HD2600XT DDR3
HD2600Pro DDR3
HD2600Pro DDR2

● 你对HD2600价格满意吗？

价格还不错
一般般
还是太贵了

● 目前的千元级DX10显卡中，您最看好哪一款？

HD 2600XT GDDR4
HD 2600XT GDDR3
HD 2600PRO GDDR3
8600GTS
8600GT OC

0人已赞

DX10显卡中端对决！HD2600大战GF8600

关注我们