ATI重登性能王座 48管线R580完全测试
评测文章导航 |
了解R580核心架构、48管线的来由——请点击查看 |
了解R580独有的特效——请点击查看 |
了解X1900家族、不同品牌的做工与外观——请点击查看 |
了解X1900的3Dmark及游戏测试性能——请点击查看 |
了解X1900的极限游戏性能——请点击查看 |
了解X1900在AMD/Intel平台性能有何不同——请点击查看 |
2006年1月22日(农历23) 星期日 晴
距离春节只剩不到一周,家在外地的同事已经在为火车票四处张罗。看着才从上周3Dmark06通宵测试中缓过劲的显卡频道兄弟们,真想让大家能在周天睡个安稳觉。但当得知快递刚刚将X1900XT样卡送到POP,犹豫了会后仍然拨通了小朋友、小米的电话。
“准备测试了……”
“OK,十一点公司见!”,略感了歉意的我从电话中感受不到兄弟们的一丝埋怨。收拾好背包,踏上前往鼎好的302路汽车。深冬的北京只有零下6摄氏度,但有这样一帮志同道合的兄弟们相伴,寒冷和加班又算得了什么……
● 王者之争再起,ATI R580再掀狂澜
2005年10月,ATI隆重发布了全新架构的Radeon X1000系列显卡。凭借业内领先的90nm制造工艺及率先使用了大容量高速GDDR3显存,基于R520核心、频率高达625/1500MHz的ATI旗舰产品Radeon X1800XT成为了当时速度最快的显示卡。
然而好景不长,X1800XT的王者之位尚未坐稳。一个月后NVIDIA同样推出了提升频率的7800GTX 512MB版,再次夺回了性能王座。此后尽管也有少数厂商推出过更高频率的X1800XT PE显卡,但从各方消息可以注意到,ATI显然已经将希望放在R520之后的新一代产品。
在《三年架构大革命!R520脱胎换骨全测试》的评测文章中我们就曾经提及,“R520作为ATI一个全新的契机,基于这个核心架构下不断衍变和发展将是ATI未来的产品方向”。终于,在R520发布不足4个月之后。ATI于北京时间1月24日正式发布了基于R580核心的高端系列——X1900系列,正式打响了2006年性能大战的序幕。
ATI最新推出的Radeon X1900XT
● 从98XT到19XT,ATI近年性能王者回顾
在正式介绍Radeon X1900XT显卡之前,我们不妨一起来重温ATI近年来旗舰级高端显卡的发展之路。
◎ Radeon 9800XT
核心代号为R3**系列显卡可以说是ATI赖以成名的经典之作。从Radeon 9700 Pro、9500直至后来的9550等,都成为帮助ATI 05年顺利登上零售市场NO.1的最大功臣。而其中代表R3**系列中的最高性能R9800XT更是当年AGP玩家的终极梦幻装备。
2003年10月发布的R9800XT拥有八条像素处理管线,采用改进后的R360核心,相比同时期NVIDIA的FX5950Ultra在大多数测试都要胜出。作为ATI当年的旗舰级产品,售价达到5899元的9800XT丝毫不比如今的1800XT逊色。
◎ Radeon X850XT PE
进入2004年后,虽然ATI 基于R420核心的16管线 X800系列性能同样不弱。但由于NV 6800Ultra较前一代FX5950有近一倍的提升,尤其在率先引入SM3.0、SLI等技术,使得X800与6800Ultra相比多少感觉稍有不敌。
然后就在04年底,ATI再次推出了一款X850XT PE,虽然核心架构上与X800相比没有多少改进。不过凭借着工作频率的再次提升,ATI还在04年末保住了3D性能之王的荣誉。当然,物以稀为贵的X850XT PE售价也曾达到了近6000元。
◎ Radeon X1800XT
虽然从9800XT的AGP成功过渡到X850XT PE的PCI-E时代,但高端产品的架构方面ATI仍然没有更本的改变,这也逐渐成为制约A卡规格、性能继续提升的主要障碍。因此,采用全新核心架构X1000系列显卡应运而生。
在X1800XT发布之前,其管线数量成为关注最多的话题。对于当时NV已经发布的24管线7800GTX,不少人猜测ATI会将1800XT管线数量设定在24/32条左右。不过最终的正式发布的X1800XT只有16条像素渲染管线,这也出乎了不少玩家的意料。
|
GeForce 7800GTX |
GeForce 7800GTX |
GeForce 7800GT |
Radeon X1900XT |
Radeon X1800XT |
Radeon X1800XL |
核心代号 |
G70 |
G70 |
G70 |
R580 |
R520 |
R520 |
工艺制程 |
110nm |
110nm |
110nm |
90nm |
90nm |
90nm |
显存位宽 |
256bit |
256bit |
256bit |
256bit |
256bit |
256bit |
显存类型 |
DDR3 |
DDR3 |
DDR3 |
DDR3 |
DDR3 |
DDR3 |
显存容量 |
512MB |
256MB |
256MB |
512MB |
512MB |
256MB |
核心频率 |
550MHz |
430MHz |
400MHz |
625MHz |
625MHz |
500MHz |
显存频率 |
1700MHz |
1200MHz |
1000MHz |
1450MHz |
1500MHz |
1000MHz |
像素管线 |
24 |
24 |
20 |
48 |
16 |
16 |
顶点管线 |
8 |
8 |
7 |
8 |
8 |
8 |
填充率 |
13200M/s |
10320M/s |
8000M/s |
30000M/s |
10000M/s |
8000M/s |
Shader |
3.0 |
3.0 |
3.0 |
3.0 |
3.0 |
3.0 |
多卡 |
SLI |
SLI |
SLI |
CorssFire |
CorssFire |
CorssFire |
众所周知,ATI现有的R520显示芯片仅仅拥有16个像素渲染单元,而对手NVIDIA的G70为24个,这使得R520在于G70的竞争当中处于不利局面,不得不依靠高频率来弥补不足。而现在ATI将R580的像素渲染单元一举提升至48个的境界,足足是R520的三倍,让人刮目相看!
48个像素渲染单元,R580显示芯片带给我们的震撼力是前所未有的,核心集成度如此之高那么功耗与发热量将会到什么样的地步?这恐怕是绝大多数人所担心的问题!
- R520到R580核心架构演变:
ATI并没有单纯的增加像素渲染管线,因为一味的提高管线数目对芯片工艺要求非常高。因此ATI巧妙通过增加像素渲染单元,让传统的每条像素渲染管线能够在单时钟周期内进行三次像素操作,从而大幅提升显卡的像素渲染能力!
那么像素渲染单元与通常所说的像素渲染管线到底有何区别呢?
众所周知,我们通常说X1800XT和7800GTX有多少条管线时,严谨的说法应该是16×1和24×1,因为他们的每条管线都拥有1个处理单元,所以像素渲染管线和像素处理单元是完全等同的。然而到了R580一代就不同了,虽然R580的规格依然是传统的16条像素渲染管线,但每条管线却拥有3个像素渲染单元,也就是相当于48条管线的规格!
-
48个像素渲染单元的指挥中心:R580 Ultra-Threaded技术
但是现在出现了一个矛盾:一方面为了要求并行计算,很多像素要求同时进行操作,将画面分成一个个小块来处理将能够很明显的提高效率,但是如果一个块中的像素需要进行不同的操作,那么将适得其反。另一方面,如果将每个像素作为最小的单位进行处理,那么出现问题的可能就没有了,但是这样效率将会很低,因为不同的像素的处理要求是不同的,简单的处理的快,复杂的处理的慢。
ATI的Ultra-Thearding Dispatch Processor便是用来解决这个问题的,首先,可以将每一个像素的处理过程理解成为一个“线程”,那么这个Ultra-Thearding Dispatch Processor的功能就是分配这些线程的执行。它可以动态检测到每个像素渲染单元的工作情况,避免了空闲的情况存在。
Ultra-Thearding通过一个庞大的联合线程计数器、小线程单元、专门的分歧单元,和一个巨大的、高性能任务堆栈列表,可以在高速的动态流控制和扩展并行处理见取得最好的平衡,这些技术可以让R580的像素渲染效率进一步提高,充分释放48个像素渲染单元的潜能,将新技术特效发挥得淋漓尽致!
- 为什么需要如此众多的像素渲染单元:
上图为近年来主流3D游戏当中使用像素渲染指令的变化曲线,可以看出未来游戏将更加频繁的使用像素渲染操作。这是因为当今主流3D API——微软DirectX自8.0开始导入可编程的渲染引擎之后,大量D3D游戏基于这一标准使用像素渲染变得非常普通,而且指令的复杂程度也是与日俱增!
这就是为什么ATI和NV的显卡像素渲染单元逐年递增的原因!
5800/5900(8)→6800(16)→7800(24)→7900(32)
9700/9800(8)→X800(16)→X1800(16)→X190(48)
- 渲染方式也发生了微妙变化:
渲染操作越来越频繁,渲染复杂程度越来越夸张,除此之外在游戏中的渲染方式也发生了微妙的变化。目前3D游戏中常用的渲染指令大致可以分为两类:
1.纹理操作:从显存中拾取数据
2.算术处理操作:完成数学变换
早期的渲染处理是粗略的把渲染资源平等的分配给上述两种类型的渲染指令,但近来分配给算术处理操作的渲染处理资源比重越来越大。在最近的游戏当中,两类渲染指令的比例大约为:算术处理操作:纹理操作=5:1。从很多游戏的设计蓝图来看,这一比例还有继续增大的趋势。
算术处理与纹理操作之间很重要的一个差异就是:纹理操作过多依赖于显存容量、速度和带宽这些外界因素,当在硬件条件限制下显存规格无法继续提升时,增加更多的纹理单元对纹理操作性能的提升非常有限;而算术处理则完全不同,它的处理能力完全取决于显示核心集成的算术处理单元数量。
- 为什么R580顶点处理单元维持8个不变?
人们在谈论一款显卡的规格时,最常提到的就是两个重要部分——像素渲染单元和顶点处理单元,这也成为了ATI和NVIDIA划分高中低端显卡的重要手段!举个简单的例子:7800GTX为24像素8顶点,而7800GT为20像素7顶点。前面刚刚介绍了像素渲染部分,下面就来看看R580的顶点引擎有何变化?
不管NVIDIA还是ATI,逐年提高像素渲染单元的数量绝大多数人都能够理解,这几乎成为了近年来显卡性能提高墨守成规的定律,然而回头看看几年来顶点处理单元似乎一直处于原地踏步状态,为什么两大巨头对顶点处理单元如此漠不关心?
如果按照3D图形处理顺序而言,顶点部分是需要首先执行的。很早之前,顶点坐标的运算是由CPU完成的,到了GeForce和Radeon以后,图形芯片便具备了T&L(Transform&Lighting 变换和光照)的功能。
不管是哪款显卡,3D图形的处理顺序都是最先从顶点部分开始,因为顶点是用来构造几何物体的,进行3D运算建模顶点是最基本最核心的内容。而像素对应工作就是将显卡合成的三维图形以二维的方式输出,简单说像素是二维而顶点则是三维的。这就是他们虽然都被称作Shader,而顶点常被译为处理、着色,而像素译为渲染的原因。
然而与3D息息相关的顶点运算的需求是取决于游戏本身,每一个游戏的3D模型一旦确定,在一个静态的3D场景中,顶点数目也就固定下来了,这并不会因为游戏的细节程度、特效和分辨率而发生改变。所以顶点引擎往往没有像素引擎那么繁忙,游戏开发者通常会利用贴图等手段控制模型的3D顶点数目。
因此R580与R520相比像素渲染单元翻了三倍,而顶点处理单元没有任何变化。关于R580顶点处理单元的细节部分资料,可参阅“三年架构大革命!R520脱胎换骨全测试”一文,此处不再多做介绍。
- 小结:
R520显示核心拥有16个像素单元和16个纹理单元,两者的比例为1:1,而R580拥有48个像素单元和16个纹理单元,两者的比例为3:1。
可以看出,R580与R520相比最重大的变化就是像素渲染单元翻了三倍达到了48个,纹理单元和顶点处理单元都没有变化。这是主要是因为按照游戏发展的趋势、以及当前硬件条件的限制,顶点处理单元够用即可,增加纹理单元对性能的提升非常有限;而提高像素单元、增加像素与纹理的比例,能够更加贴近未来游戏发展的需要,可以最大化显卡的渲染效率!
当然,ATI并没有单纯的增加像素渲染管线,因为一味的提高管线数目对芯片工艺要求非常高。因此ATI巧妙通过增加像素渲染单元,让传统的每条像素渲染管线能够在单时钟周期内进行三次像素操作,从而大幅提升显卡的像素渲染能力!
前面介绍过,ATI认为当前纹理单元没有必要继续提高处理能力,而像素渲染更加重要些。那么像素渲染除了本份的工作之外还能进行哪些操作呢?
ATI此次倾全力打造的R580芯片不但规格先进,而且一改之前跟着微软DirectX亦步亦趋的做法,集成了众多先进的技术和功能,而这些技术可以让ATI在未来的竞争中抢得先机、占尽优势:
- 让物体运动更加真实:GPU物理加速技术
随着GPU性能越来越强大,CPU逐渐地成为了渲染速度提高的瓶颈,这已经成为了无可争议的事实!因此GPU越来越强的渲染处理能力已经开始在共享原本属于CPU的工作量,例如在粒子系统、纺织物、流体流动这些物理仿真动作在CPU算不过来时,可以映射到GPU的工作列表中,使用GPU强大的渲染能力来处理。不过,这些从CPU处理列表中转移过来的资源毕竟原理标准的图形绘制范畴,所以更多的渲染处理被用来搭建负载平衡系统,其提高整体的帧渲染速度。
据之前对R520芯片的测试报告,R520的演示海洋波浪的物理运算能力相当于Intel P4 3.0GHz的3倍以上!因此GPU物理加速已经应用在了多款XBOX360游戏上面,相信今后将会有更多的PC游戏支持GPU物理加速技术,让劳累不堪的CPU解放出来!
-
R580和XBOX360不能不说的故事:
虽然整体架构不同,但是通过Xenos可以了解到原来48个像素渲染单元还有这么大的作用,不但能够处理像素、还能处理顶点,更能够分担纹理单元的工作!
- 让阴影边缘更加真实:阴影渲染加速和Fetch4技术
大多数阴影渲染效果都有一个局限性,那就是创造出来的通常都是一个轮廓鲜明的硬边线阴影,而在真实世界里,阴影都是软边线的。用技术手法创造软边线阴影通常都要做一些过滤阴影基本图的工作,需要进行巨大数量的样本纹理对照,这对GPU的纹理单元是一个巨大的负担。
动态分歧机制可以利用扫描阴影边缘像素的方法改善阴影绘制的速度,由于阴影的特效表现主要侧重于边线的描绘上,因此通过过滤的方法在提高阴影成像质量的同时大大缩短了成像的时间。
为了更大的促进这项软边阴影过滤技术,R580集成了一个新的纹理样本过滤器——Fetch4,它由四个组成部分(红绿蓝和透明度)。这些纹理单元被设计成可以从一个纹理地址同时采用和过滤全部四个组成部分,当单一的组成纹理过滤器去查找不同类型的纹理时,Fetch4可以同时用四个值在边线临近的地址去采用,这就能在使用4个样本对照的前提下有效的增加纹理采样的速度。完美的兼顾质量与速度。
如此一来,超线程的快速流控制加上具备快速纹理查找功能的Fetch4技术,R580强大的硬边阴影渲染加速能够生成更加贴近真实的软边阴影。
- 超高分辨游戏变为可能:增强的HierachicalZ技术
随着高清晰数字显示技术的成熟与普及,很多玩家开始尝试在1920×1200(WUXGA),2048×1536(QXGA)甚至是2560×1600(WQXGA)等超高分辨率下进行游戏,显然在这些超高分辨率下对显卡的像素渲染、填充速度和显存带宽都会造成沉重的负担。
ATI显卡都支持一个名为HierachicalZ的技术,这个可以在前面R580核心架构图中看见。这个技术是有针对性的满足席上不同分辨率的需求,他会检测出哪些会在最终成像画面被隐藏的像素点,并在要对他们进行渲染处理前丢弃。不过这一技术的前提是显存容量要足够大,否则HierachicalZ技术将会自动降低画面的渲染品质。
R580集成了比R520多出50%的HierachicalZ缓存,这样就能确保R580的性能不会在超高分辨率下急剧下降,HierachicalZ技术配合512MB显存控制器,再加上AVIVO显示引擎中的两个完整DVI接口,能够在高分辨率游戏中提供更出色的表现力,让R580的实力彻底发挥出来。
- 物体表面更加真实:视差映射技术
视差映射(parallax occlusion mapping)使用一个光线跟踪的样本与正规的映射相结合,能够添加更多水面2D细节、倒影和物体本身的阴影特性等特效处理,主要是利用强大的算术处理能力和动态流控制来增加3D渲染场景的真实性。
视差映射技术使用像素渲染流控制依据视角改变动态的对距离内像素进行反复扫描,从而让物体表面的细节部分更具层次感:
- 小结:
我们非常欣喜地看到R580能够在R520架构的基础上,集成和改进了如此众多而且实用的新功能和新技术。当然ATI所倡导的这些激动人心的技术都是建立在48个像素渲染单元强大性能的基础之上!
但是当今的主流游戏始终要慢D3D API和GPU硬件半拍,实际上现有的游戏程序只开发出了GPU像素渲染能力的一小部分,很多情况下都可能无法完全发挥出优势来。
ATI引以为傲的3Dc+纹理压缩技术、少有的HDR+AA、代替CPU而进行的物理加速技术、软边阴影以及视差映射技术等等,如果将这些技术应用起来,R580的速度可以达到R520的两倍以上,而且分辨率越高优势越明显!ATI所展示的玩具店Demo就能充分的反映出这一效果。
因此R580更加强调的是未来的性能表现,超前的规格虽然在现有软件环境下无法完全发挥出来,但是这些激动人心的特性都可以为下一代的产品拓展出更大的应用范围!只要有游戏采用了其中某项技术,就能够让R580的速度与画质优势发挥出来!
- X1900XTX:
XTX,真是个新颖的名字,ATI放弃了以往采用XT PE的命名方式来定义最优异的产品。
据称这是因为ATI要彻底摆脱以往XT PE有价无货的局面。大家都知道X800时代的X800XT PE和X850XT PE虽然性能非常优异,但由于市面上见不到这款产品而备受消费者指责。XTX意味着比XT拥有更高的频率和更强的性能,但您只要对这款优异的产品感兴趣就肯定可以买到,不用担心货源问题!
X1900XTX的核心频率为650MHz,显存频率1550MHz,这要比当前X1800XT 625/1500MHz的频率高25MHz,但比X1800XT超频版700/1600MHz低。再加上更高速显存的使用,看来此次ATI并没有将频率定到极限附近,而是给玩家预留了相当大的发挥空间!
- X1900XT:
X1900XT就是X1900XTX的低频率版本,核心显存频率分别为625/1450MHz,核心与X1800XT相同,但显存要低100MHz。我们此次要测试的产品就是这款X1900XT。
除了频率上的差异,X1900XTX与X1900XT的规格是完全相同的,同样拥有48个像素渲染单元和512MB显存。X1900XT的优势就在于价格要便宜不少,XTX定价649美元,而XT定价549美元。
- X1900 CrossFire Edition:
回顾ATI上两代CrossFire产品就可以发现,虽然交叉火力有不少缺点,不过其强大的性能足以根SLI一较高下,然而发布时间晚、迟迟不肯上市的交火主卡让CrossFire两次错失良机,浪费了与SLI同台竞技的非常好的时机!
因此,ATI为新一代X1900交叉火力做好了充分准备,X1900 CrossFire Edition与X1900XTX/X1900XT同时发布,并且马上就可以进入市场!对于众多高端用户来说无疑是个天大的好消息,不用再为CrossFire而苦苦等待了!
X1900 CrossFire Edition的频率和规格与X1900XT是完全相同的,因此将其称之为X1900XT CF似乎更加合适些,当然CrossFire的特性使得它与高频的X1900XTX也能够组建更强的交叉火力。
X1900 CrossFire的官方定价为599美元,比X1900XT贵50美元,与X1900XTX/X1900XT同期发布,即刻上市!
- All In Wonder X1900:
大名鼎鼎的AIW是ATI的拿手绝活,一直以来都是ATI家用娱乐级产品的镇宅之物,这种全能的显卡一般由主力娱乐显卡和接收电视信号的调谐器以及Theater系列视频处理芯片组成,在保留高速3D加速性能的同时,还提供了电视收看,视频输入输出及处理功能。虽然竞争对手NVIDIA近年也推出了NPC系列类似产品,但市场反应始终不及AIW。这和其独家的Theater系列视频处理芯片以及历史悠久的MMC整合软件还有ATI坚持在优异AIW显卡上使用旗舰级显示芯片的策略不无关系。
当前ATI最优异的产品为AIW X1800XL,随着X1900系列的推出,AIW X1900也在酝酿之中。据悉AIW X1900这款产品是肯定存在的,但不会与X1900XTX/XT/CrossFire同时推出。因此目前频率规格尚不可知,显存容量初步估计应该是256MB。
AIW X1900的官方定价为499美元,大概与当前X1800XT的售价相当。
- X1900XL:
前面的几款X1900系列产品都在预料当中,这些产品虽然名称有了变化,但与X1800系列依然是一一对应的。正当大家以为XTX就是之前的XT,而XT就是之前的XL时,漏掉的一款产品浮出水面了——那就是X1900XL:
X1900XTX和X1900XT的频率都比较高,而且频率差距非常小,这就不符合ATI对产品线划分的一惯策略。因此ATI要推出一款更低频率版的X1900XL也是在情理之中。
不过在ATI最初的计划中并不存在X1900XL这款产品,而且X1900XL也不会与X1900XTX/XT/CrossFire同期发布,因此频率规格与显存容量都是未知数。不过小编猜测之前的AIW X1900其实就是AIW X1900XL,两者的规格应该相同,显存都为256MB。
- Radeon Xpress 3200芯片组:
现在不是在介绍X1900系列的成员吗,怎么会冒出一款芯片组来呢?这是因为CrossFire的关系!ATI新一代显示芯片的代号为R580,而新一代主板芯片组的代号为RD580,这两者之间的关系就如同鱼和水!
现在显卡之间竞争已经不再局限于单卡对决,双卡互联的性能表现成为了非常重要的因素!因此ATI在CrossFire技术方面丝毫不敢怠慢。双卡互联需要一款强大的主板芯片组支持才能够发挥性能,NVIDIA的SLI技术凭借NF4 SLI系列如日中天、傲视群雄!而ATI的RD480芯片组则是略显底气不足,ATI虽然在Intel平台得到了975X的支持,但面对NV新一代双X16芯片组时,ATI需要一款能够与之匹敌的产品,这就是代号为RD580的芯片组。
前不久ATI已经将RD580正式命名为Radeon Xpress 3200,主要是为了强调RD580能够提供32个PCIE通道给显卡使用,从而组成全速的双X16交叉火力,让新一代X1900 CrossFire能够如鱼得水、蛟龙入海般的展现威力!
RD580的过人之处在于北桥就能提供多达44个PCIE通道,单从这一方面来说已经超越了老牌实力派的Intel和如日中天的NVIDIA。因为Intel最新的975X才刚刚依靠拆分技术提供两条PCIEX8供显卡使用,而NV是通过南北桥组合的方案提供了双X16的方案,南北桥加起来最多才40个通道,当然南北桥之间通讯带来的延迟也会一定程度上影响到SLI的性能!
ATI RD580芯片组其实早在三个月前就已开发出样品,现在已经非常完善了,原本计划与X1900系列同期发布,现在可能由于南桥方面的原因推迟发布。RD580未能和X1900 CrossFire达成强强组合同步发售这让人比较遗憾,不过预计春节过后将会与玩家们见面,届时各大主板厂商将大量出货!
ATI曾多次强调,此次X1900系列首发的三款产品X1900XTX、X1900XT和X1900 CrossFire与1月24日发布,然后就可以马上进入市场,不再像以前的产品一样造成有价无货的“难产”局面!
ATI以实际行动履行了自己的诺言,而且实际上X1900系列早在发布前就已经上市了。在20号左右,国外很多经销商就已经拿到了X1900XTX和X1900XT的正式版产品,并且开始接受预订,大多数都是等待ATI正式发布产品之后开始销售。当然总有些“不听话”的经销商私自提前开卖:
由于我们收到的三款产品除了Logo和ID有差别之外,其他细节部分和规格配置都是完全相同的,因此就以迪兰恒进的产品为例对这款X1900XT显卡进行详细介绍:
乍一看,X1900XT和X1800XT似乎没有任何区别,两者的PCB、散热器、接口部分都毫无二致。在设计之初,ATI的R580显示芯片与R520是Pin-to-Pin兼容的,也就是说X1900XT能够直接使用X1800XT的PCB,因此可以大幅缩短研发时间迅速上市。
事实是这样没错,不过由于R580的功耗比R520更大,而且显存规格也更高,为了增强稳定性,ATI在X1800XT的PCB基础上作出了改进,下面就来仔细作一对比:
可以很明显地看出差别来,供电部分在原来的空白处又增加了一项变为7项,另外也多出了一部分额外的显存供电模块。除了这两部分的之外,其它所有元件和PCB设计都是完全相同的。
-
X1900XT核心介绍:
-
三大优异GPU核心面积对比:
-
X1900XT显存规格:
-
板载视频处理芯片,具备VIVO完整功能:
- 优异显卡齐上阵:
ATI X1900XT作为06年高端主力,其性能表现备受期待。规格如此相近的两款显卡,X1900究竟比X1800强多少,与对手的7800相比又如何呢?为此我们搜集了市面上所有的主流高端显卡进行一次横向对比测试,看看X1900能否在强手如云的优异显卡中脱颖而出!
NV方面有三款产品参赛:7800GT、7800GTX和7800GTX 512MB,ATI方面也准备了目前已经上市的三款显卡:X1800XL、X1800XT和X1800XT PE(ATI用来对抗7800GTX 512MB的官方超频版)。
- 测试平台:
对于测试平台选择确实颇令人为难,06年双核心即将普及,以后会有更多的游戏为双核CPU进行优化。但由于目前游戏的现状双核CPU大多数情况都未能发挥性能,因此我们还是决定使用普及率非常高的单核CPU。
之前我们的所有测试都是在AMD+NF4平台下进行的,这主要是因为AMD高端CPU在3D测试中拥有出色的表现。而此次测试我们特别加入了Intel平台,看看Intel的CPU是否能够配得上ATI最新的X1900显卡。
●主力平台:
AMD测试平台 | |
处 理 器 |
|
主 板 |
DFI |
显 卡 |
7800GTX 512MB / X1800XT PE 512MB 7800GTX 256MB / X1800XT 512MB 7800GT 256MB / X1800XL 256MB |
内 存 |
威刚DDR 400 512MB×2 |
硬 盘 |
Seagate 7200.7 80GB |
显 示 器 |
爱国者 998FD |
驱动程序 | |
nForce Forceware 6.70WHQL | |
Forceware 81.98 WHQL 催化剂6.1WHQL版(X1800) | |
操作系统 |
Windows XP + SP2 |
配套芯片组并没有用NVIDIA最强的NF4 SLI X16,而是成熟的NF4 SLI,其实他们的性能是完全相同的,只不过在组建SLI时有所差别。DFI最强的Lanparty UT NF4 SLI-DR Expert是备受玩家钟爱的主板。
●Intel平台:
Intel测试平台 | |
处 理 器 |
Intel Pentium Extreme Edition 3.73GHz |
主 板 |
技嘉GA-8N-SLI-QUAD Royal |
显 卡 |
7800GTX 512MB / X1800XT PE 512MB 7800GTX 256MB / X1800XT 512MB 7800GT 256MB / X1800XL 256MB |
内 存 |
威刚DDRII-533 512MB×2 |
硬 盘 |
Seagate 7200.7 80GB |
显 示 器 |
爱国者 998FD |
驱动程序 | |
nForce Forceware 6.82WHQL | |
Forceware 81.98 WHQL 催化剂6.1WHQL版(X1800) | |
操作系统 |
Windows XP + SP2 |
虽然AMD与Intel平台差异非常大,但是为了尽可能做到公平,主板同样使用了NVIDIA的NF4芯片组,内存统一为威刚的产品。技嘉GA-8N-SLI-QUAD Royal是最强大的NF4 SLI X16 IE主板。
- 3DMark03:
-
3DMark05:
-
3DMark06:
-
小结:
与3DMark系列需要在默认分辨率下跑分数不同作为参考不同,在游戏中侧重的是实际可玩度,相信没有人会用7800/X1800/X1900显卡在1024分辨率下玩游戏吧。因此我们的测试从1280分辨率起跳,并且在1600分辨率下打开AA、AF,以考验优异显卡的实力!
- DOOM3:
- Quake4:
- 小结:
OpenGL是NV的传统强项,ATI不论是那一代的产品,在与NV的对阵中都没能占得任何便宜,这些都在预料之中。
不过需要注意的是,此前ATI所开发的一款OpenGL专用优化工具,能够大幅提高ATI X1000系列在OpenGL中的性能表现,在高分辨率下能够超越NV同级产品。而在测试中我们仅仅使用了标准的催化剂6.1,因此未进行任何优化,这里作一简单声明。如果ATI能够将优化工具整合在催化剂驱动当中的话,用户使用起来就非常方便了!
- Half-Life 2:
-
FarCry:
-
小结:
- Slinter Cell:Chaos Theory:
- Call of Duty 2:
- Need for Speed 9:
- Age of Empires 3:
-
小结:
- 高端显卡的用途:追求完美游戏效果
-
超高分辨率测试:
-
为何HDR和AA水火不容?
无论FarCry、细胞分裂、帝国三还是最新的3DMark06,我们已经充分的从这些游戏中感受到了来自HDR的视觉震撼力!然而仅仅有HDR还是远远不够的,时不时显现出的锯齿令人非常反胃!
HDR达到的是更加真实的光影效果,而全屏抗锯齿则是为了追求高精密的图像质量。可以说两者并无直接关系,但是为什么大多数游戏和大多数显卡都无法在开启HDR的情况下打开AA呢?
NVIDIA采用了OpenEXR做为HDR运算的缓存格式,GeForce 6/7系列显卡都提供了对OpenEXR的16位浮点(FP16)贴图、过滤、混合、存储支持(即高精度动态范围)。然而在DirectX 9.0模式下运行FP16时,会占用到原本属于FSAA(全屏抗锯齿)的缓冲区域,使得在开启HDR效果后无法进行FSAA处理。这也就是为什么在大部分FP16游戏无法同时支持FSAA和HDR的主要缘故。
- ATI X1000独门绝技,HDR+AA:
ATI X1000系列显卡具备的一个重大特性,那就是能够同时开启HDR和AA,当然ATI新一代的X1900系列完整了支持这一激动人心的特效!那ATI究竟是如何做到的呢?
ATI X1000系列显卡是通过另外指定缓冲区来解决这个缓冲区占用问题的,不过由于是来自API的限制,程序设计者仍必须对游戏进行单独处理才能实现HDR+AA效果,因此能够同时支持这两种特效的游戏数量还十分有限。
目前能够同时开启HDR+AA的游戏只有FarCry 1.4,而且处于测试阶段,暂时只支持HDR+2AA(4/6AA无效);另外最新的3DMark06也能够在两项SM3.0测试中开启AA,最高可以支持HDR+4AA模式(6AA不可用)。不过这已经足够用来测试X1900XT的实力了!
- FarCry 1.4:HDR+2AA的效果不是盖的!
在以上四幅一组的图当中,很明显下面两张就是开启HDR之后的效果,明暗反差非常鲜明;而左边两张没有开AA,右边打开2xAA。通过废旧的栏杆、货架和箱子都够非常明显的观察出反锯齿效果的差别。
虽然FarCry1.4预发布版暂时仅支持2xAA,但同时支持HDR和AA使得画面表现力提高了一个档次!那么就看看在如此完美的画面下显卡的速度如何?
91%的性能提升幅度!X1900XT头一次让人感到如此兴奋,FPS从30提高到55帧,游戏可玩度大增。这才是48个像素渲染单元的真正威力,诸如HDR+AA等等ATI独有的技术都需要强大渲染能力的支配才能够展现出来!
- 3DMark06:看清楚华丽的外表之下是什么?
相信大家一定被3DMark06中所呈现的完美特效所折服,尤其是后面两个SM3.0游戏测试中无处不在的华丽HDR效果更是让人赞叹不已!但有没有注意过隐藏在华丽的外表之下的细节部分表现如何呢?
首先来看看3DMark06第一个SM3.0游戏测试Canyon Flight中的表现:
以上截图全都在1600×1200分辨率下,AF开到8x时获得。可以非常明显的看出,没有AA和4xAA的差距非常大,尤其在遇到棱角鲜明的物体时更为明显!
虽然A卡在3DMark06中的表现普遍不佳,不过在SM3.0/HDR测试场景中,开4AA8AF的情况下,X1900XT比起频率相近的X1800XT优势还是非常明显的!
- 小结:
无论FarCry还是3DMark06,或者是其他的游戏,HDR带给我们震撼视觉效果的同时,无法开全启全屏抗锯齿让画面的细节部分表现力不足,这让人感到非常遗憾!
鱼和熊掌始终不能兼得吗?随着越来越多的游戏开始支持HDR+AA这种特性,X1900给了我们完美的答案!HDR+AA让画面的视觉效果更上一层楼,当然这一切都是在X1900强大渲染能力的支持下展现出来的,没有足够的FPS,一切都将是空谈!
X1900XT在FarCry 1600×1200 HDR+2AA+16AF这种极限设置下都能跑出55帧很流畅的成绩(高出X1800XT近一倍),何况这还是在驱动并不成熟情况下的表现,48像素引擎果然实力不凡!
以往谈起3D性能,绝大多数人都会对AMD竖起大拇指。AMD的CPU虽然主频较低,但是却拥有Intel P4难以企及的高高运算效能,在3D游戏中占尽优势。因此之前我们几乎所有显卡和3D测试都是在AMD+NF4平台下进行的。
实际上使用Intel平台的高端玩家占有相当大的比例,而且Intel平台也有多款芯片组支持SLI或者CrossFire技术。因此,我们特意加入了Intel平台的测试,看看Intel的高端CPU能否配得上X1900XT!
Intel的CPU选用了Pentium Extreme Edition 3.73GHz,这是Intel单核心至尊版CPU中最高频的产品,二级缓存2M,虽然比3.8GHz的P4 670频率略低,但却拥有1066MHz前端总线。测试中打开超线程。由于手头没有AMD最高频的FX57,只好选用了Althon 64 FX 55,主频2.6GHz,二级缓存1MB。因此拿它来和P4 EE 3.73比有点不公。但我们的目的并不是测试两款CPU孰强孰弱,而是以FX55作为对比,看看Intel CPU的表现如何?
测试项目 |
设置 |
FX55 |
EE 3.73 |
3DMark03 |
1024×768 |
17435 |
18644 |
1600×1200 |
12176 |
12942 | |
1600×1200 4AA8AF |
7651 |
8264 | |
1600×1200 6AA16AF |
6194 |
6752 | |
3DMark05 |
1024×768 |
10498 |
9039 |
1600×1200 |
8536 |
8100 | |
1600×1200 4AA8AF |
7071 |
7319 | |
1600×1200 6AA16AF |
6451 |
6833 | |
3DMark06 |
CPU |
1030 |
1122 |
1024×768 总分 |
5166 |
5474 | |
1024×768 SM2.0 |
2306 |
2387 | |
1024×768 SM3.0 |
2719 |
2876 | |
1280×1024 总分 |
4628 |
4939 | |
1280×1024 SM2.0 |
2062 |
2175 | |
1280×1024 SM3.0 |
2248 |
2385 | |
1600×1200 总分 |
4134 |
4421 | |
1600×1200 SM2.0 |
1448 |
1551 | |
1600×1200 SM3.0 |
1305 |
1402 | |
DOOM3 |
1280×1024 |
111.6 |
107.9 |
1600×1200 |
92.4 |
93.1 | |
1600×1200 4AA |
65.3 |
68.9 | |
Quake4 |
1280×1024 |
94.1 |
89.2 |
1600×1200 |
84.7 |
81.9 | |
1600×1200 4AA |
69.3 |
68.2 | |
Half-Life2 |
1280×1024 |
140.73 |
139.7 |
1600×1200 |
138.25 |
136.7 | |
1600×1200 4AA16AF |
133.9 |
134.05 | |
FarCry 1.33 |
1280×1024 |
118.75 |
111.54 |
1600×1200 |
112.11 |
111.01 | |
1600×1200 4AA4AF |
92.16 |
100.53 | |
分裂细胞3 |
1280×1024 |
98.74 |
99.94 |
1600×1200 |
77.41 |
91.45 | |
1600×1200 4AA8AF |
58.22 |
62 | |
1280×1024 HDR |
76.64 |
80.77 | |
1600×1200 HDR |
58.37 |
61.9 | |
1600×1200 HDR16AF |
57.42 |
60.88 | |
使命的召唤2 |
1280×1024 |
61 |
61 |
1600×1200 |
47 |
49 | |
1600×1200 4AA |
40 |
43 | |
优品飞车9 |
1280×1024 |
62 |
51 |
1600×1200 |
50 |
42 | |
1600×1200 AA |
41 |
38 | |
帝国时代3 |
1280×1024 |
55 |
48 |
1600×1200 |
51 |
45 | |
1280×1024 HDR |
40 |
34 | |
1600×1200 HDR |
31 |
27 |
-
小结:
纵观所有测试成绩,两款CPU呈交替领先状,谁也没有绝对的优势。在三代3DMark测试中的表现尤为明显!
从前几款主流游戏的得分来看,Intel的CPU虽然在低分辨率下落后,但提高分辨率、打开AA之后开始反超。这主要是得益于Intel高前端总线高内存带宽的优势,看来AMD得尽快进入DDR2了。
在后面几款新游戏当中,游戏本身FPS较低对CPU的依赖程度很大,此时AMD拥有绝对优势。
AMD方面未能使用单核最高频的FX57确实比较遗憾,因此测试成绩仅供参考!
ATI最新的X1900XT与X1800XT的核心频率都为625MHz,而显存频率X1900XT要低50MHz。而核心除了诸多技术改进之外,最显著的差别就是X1900XT拥有多达48个像素渲染单元。
那么就对这两款频率相近的产品作一对比,看看ATI新一代产品的优势在哪?以下为全部测试成绩对比:
测试项目 |
设置 |
X1800XT |
X1900XT |
领先幅度 |
3DMark03 |
1024×768 |
16897 |
17435 |
3.18% |
1600×1200 |
11600 |
12170 |
4.91% | |
1600×1200 4AA8AF |
7470 |
7651 |
2.42% | |
1600×1200 6AA16AF |
6147 |
6194 |
0.76% | |
3DMark05 |
1024×768 |
9159 |
10498 |
14.62% |
1600×1200 |
6507 |
8536 |
31.18% | |
1600×1200 4AA8AF |
5634 |
7071 |
25.51% | |
1600×1200 6AA16AF |
5313 |
6451 |
21.42% | |
3DMark06 |
1024×768 总分 |
4448 |
5166 |
16.14% |
1024×768 SM2.0 |
1943 |
2306 |
18.68% | |
1024×768 SM3.0 |
2140 |
2719 |
27.06% | |
1280×1024 总分 |
3786 |
4628 |
22.24% | |
1280×1024 SM2.0 |
1615 |
2062 |
27.68% | |
1280×1024 SM3.0 |
1689 |
2148 |
27.18% | |
1600×1200 总分 |
3238 |
4143 |
27.95% | |
1600×1200 SM2.0 |
1371 |
1837 |
33.99% | |
1600×1200 SM3.0 |
1343 |
1866 |
38.94% | |
1600×1200 4AA8AF总分 |
2498 |
3276 |
30.78% | |
1600×1200 SM2.0 4AA8AF |
1039 |
1448 |
39.46% | |
1600×1200 SM3.0 4AA8AF |
949 |
1305 |
37.51% | |
DOOM3 |
1280×1024 |
106.8 |
111.6 |
4.49% |
1600×1200 |
84.3 |
92.4 |
9.61% | |
1600×1200 4AA |
62.53 |
71.7 |
14.66% | |
Quake4 |
1280×1024 |
92.9 |
94.1 |
1.29% |
1600×1200 |
82.1 |
84.7 |
3.17% | |
1600×1200 4AA |
67.1 |
69.3 |
3.28% | |
Half-Life2 |
1280×1024 |
138.72 |
140.73 |
1.45% |
1600×1200 |
127.93 |
138.25 |
8.07% | |
1600×1200 4AA16AF |
117.44 |
133.9 |
14.02% | |
FarCry |
1280×1024 |
106.16 |
118.75 |
11.86% |
1600×1200 |
102.67 |
112.21 |
9.29% | |
1600×1200 4AA4AF |
80.94 |
92.16 |
13.86% | |
1280×1024 HDR 2AA16AF |
43.64 |
55.66 |
27.54% | |
1600×1200 HDR 2AA16AF |
29.05 |
55.52 |
91.12% | |
Splinter Cell 3 |
1280×1024 |
85.71 |
98.74 |
14.89% |
1600×1200 |
65.95 |
77.41 |
17.38% | |
1600×1200 4AA8AF |
52.53 |
58.22 |
10.83% | |
1280×1024 HDR |
64.56 |
76.63 |
18.70% | |
1600×1200 HDR |
48.04 |
58.37 |
21.50% | |
1600×1200 HDR16AF |
40.19 |
57.42 |
42.87% | |
Call of Duty 2 |
1280×1024 |
45 |
61 |
35.56% |
1600×1200 |
35 |
47 |
34.29% | |
1600×1200 4AA |
31 |
40 |
29.01% | |
Need for Speed 9 |
1280×1024 |
50 |
62 |
24.00% |
1600×1200 |
36 |
52 |
44.44% | |
1600×1200 AA |
30 |
41 |
36.67% | |
Age of Empires 3 |
1280×1024 |
46 |
55 |
19.57% |
1600×1200 |
35 |
51 |
45.71% | |
1280×1024 HDR |
22 |
40 |
81.82% | |
1600×1200 HDR |
16 |
31 |
93.75% |
两款OpenGL游戏也几乎没有提升,两款较早的经典DX9游戏:Half-Life2和FarCry在低分辨率下提高幅度较小,而在高分辨率尤其是开AA/AF的情况下,48像素渲染单元才能发挥出优势来。
较新的几款游戏,运行时FPS普遍较低,此时X1900XT依靠强大的渲染能力领先幅度较大,普遍都在30%以上。
最能发挥48像素渲染实力的就是在ATI的专长——HDR+AA模式或者高分辨率HDR模式下,性能提升幅度可达80%-90%以上,至少也有50%左右!
- 晶体管数增加20%,性能提高20%以上,ATI的路走对了!
虽然R580拥有的48个像素渲染单元没能带来三倍于R520的性能提升,但是其优秀的表现已经出乎了我们的预料!实际上性能提高多少不应该按照象素渲染单元的数目来计算,因为它仅仅是GPU核心规格的一部分。笼统地说,ATI在晶体管数增加20%的情况下性能提高了20%-100%,新一代产品的提升幅度非常可观了,而且这只是在驱动尚未完善的情况下的表现,按照ATI以往新显卡的规律,X1900的性能还有进一步提升的可能!
当然晶体管数增加带来的负面影响也不容乐观, X1900比X1800功耗和发热又增加了,这在相同制造工艺下是没有办法的事。
- 48个像素渲染单元的实力如何发挥?
除了驱动方面的原因,X1900所拥有的48个像素渲染单元在很多情况下性能优势并没有想象中的明显。
纵观所有测试项目可以发现,X1900XT在较早的游戏,比如3DMark03,Half-Life2、FarCry、DOOM3、Quake4当中,表现可以说一般,与X1800XT相比性能提升仅在10%以下。而在新款游戏当中,如3DMark05、3DMark06、使命召唤、优品飞车、帝国时代,性能表现非常出色。这也就充分验证了ATI多次强调的一个观点,未来的游戏需要更多的像素操作,像素与纹理的比例在持续增长,因此只有在新游戏当中R580的48个像素渲染单元才能充分的发挥优势!
另外,几款老游戏当中,X1900XT在高分辨率开AA和AF的情况下性能表现也能令人满意。这就意味着游戏对显卡的要求越严酷,X1900的48个像素渲染单元越是能发挥作用!
- ATI的新技术未来能否利用起来?
在R580的诸多新技术与特性中,给我们印象最深的非HDR+AA莫属,FarCry中令人刮目相看的表现、3DMark06中完美的画面与不错的成绩。可以说在这方面ATI是没有对手的,因为N卡不能在HDR下打开AA。当然ATI并没有就此原地踏步,X1900XT在X1800XT的基础上性能提高了将近100%,让HDR+AA这一技术更加实用,这都是48像素渲染单元的功劳!
除此之外,前面介绍过的HierachicalZ技术也在我们的超高分辨率测试中表现了出来。在帝国三2048×1536分辨率下开HDR+16AF,X1900XT的性能是7800GTX 512MB(XFX默认超频版)的三倍!HierachicalZ技术的优势非常巨大,9帧根本没法玩游戏,而25帧单机玩起来已经非常流畅了,由不能玩到能玩这就是质变!
在我们之前测试3DMark06时曾提到过,3DMark06中CPU测试项目加入了不少物理计算来考验CPU性能。实际上将这部分运算交给GPU更加合适,R580具备了更强的物理加速技术,但这需要游戏的支持。很多XBOX360游戏已经将物理加速交给了GPU处理,我们有理由相信将来会有不少PC游戏涉及物理运算,并且让GPU来处理,届时X1900系列的潜能就可以进一步发挥!
视差映射与阴影加速技术也是同样的道理,我们希望这些激动人心的技术并不仅仅是出现在ATI的Demo中,如果今后有更多的游戏采用这些技术的话,那么可以说X1900系列的前途一片光明!
- ATI重返3D性能之王宝座,为何刻意保留实力?
我们测试的产品并非ATI最高端的型号,然而X1900XT已经能够在绝大多数测试项目中击败NV最强者7800GTX 512MB。更高频率的X1900XTX自然是毋庸置疑的新一代3D性能之王!
ATI最高端X1900XTX的频率为650/1550MHz,比X1900XT 625/1450MHz没有高出太多。此次ATI并没有特别在意显卡的频率规格,主要是因为核心架构拥有48个像素渲染单元,可以说实力非常雄厚!
答案很简单,以R580的规格不用太高频率就能轻易击败7800GTX 512MB,然而R580的最大的敌人并非G70,而是3月份(或更晚?)将要推出的G71(90nm工艺,32管线)。因此ATI故意保留了相当一部分实力,以彼之道还施彼身来对抗7900GTX。
现在X1900系列称王没有什么悬念,X1900唱独角戏也似乎没什么意思。然而不久之后当G71发布之时又将是怎么一番情形呢?
有竞争才有发展,数年来显卡的性能发展一直都处于螺旋上升趋势,两大巨头你来我往、互不相让。皇帝轮流坐明年到我家,3D性能之王的宝座从未有一款产品能够稳坐半年以上的。而此次ATI在X1800系列推出还不到4个月就发布了下一代产品X1900系列,而且看起来似乎已经摆好了与7900决战的姿态,究竟先入为主占优还是后发制人得利,好戏还在后头呢?