三年架构大革命!R520脱胎换骨全测试
Ibiza(伊比沙岛),一个西班牙的旅游胜地,今年它再度闻名世界,并不是因为它优美的风景,也不是因为它的狂欢之夜,而是因为一家图形芯片公司——ATI。
伊比沙岛是世界闻名的旅游胜地
2005年10月5日,ATI在伊比沙岛发布了他们最新的图形芯片,人们期待已久的R520。
在这次ATI在伊比沙岛发布R520的时候,有发烧友带去了800升的液氮,现场进行超频测试,结果将一块X1800XT显卡的频率超到了877/1980MHz,单卡3DMark05成绩达到12278分,打破了由7800GTX单卡创造的世界纪录。
超频成绩
在这之前,R520的发布一再推迟,让大家不免产生种种担心。然而经过这次发布会,一切谣言已经不攻自破,玩家们对ATI的信心倍增。
今天,我们就和大家一起走进ATI全新一代图形芯片的世界。
在ATI正式发布之前,一家名为HardwareAnalysis的网站公布了所谓的R520的测试成绩,在这次测试成绩中,R520的成绩并不是很好,多数项目表现都不如竞争对手。
这个成绩让大家颇为吃惊,我们等了这么久的R520真的是这样的么?人们的讨论非常激烈,这个时候,大家期待着ATI站出来说句话。
当Guru3D网站联系到ATI的负责人的时候,ATI作出了解决的回答:“虚构。我不相信这个成绩是在R520上跑出来的。”并且称:“我们认为这测试成绩完全在愚弄大家,我们认为测试成绩是载超频的X850上跑出来的,请打电话给我们的显示卡合作伙伴,问问他们有没有X1800XT的实物,这种所谓的测试成绩甚至不接近(ATI掌握的真实成绩)。”
事实证明,HardwareAnalysis的成绩欺骗了大家,R520的发布让这个谣言不攻自破。
不过这也反映了一个事情,就是人们对R520的关注程度已经达到了近乎疯狂的程度,因为我们已经等得太久了。
对于R520的延期,IT业界流传着种种原因,有说良率达不到的,有说90nm工艺不成熟的。然而事实是怎样的呢?今天我们将独家为大家揭示。
上个星期,ATI在北京召开了面向媒体的技术培训会,小编有幸参加,会上,来自ATI的R520研发小组的负责人,David Wang先生给我们介绍了R520的细节。
在会后的专访中,记者问及了R520延期的问题,David Wang解释说:“R520延期的原因并不是良率的问题,我们的R520其实在三个月之前已经就绪,不过发现了一个小的bug,为了寻找这个bug并且消除它,我们花费了一些时间。”
这个答案并没有让小编十分满意,在回到家以后,小编给David Wang写了一封信,询问这件事情(由于David Wang是从台湾省前往加拿大总部工作的,汉语讲的非常好,所以小编就使用的繁体中文。):
“……
您提到三個月前R520就ready了,但是為了找一個小的bug耽誤了時間,您能不能透露一下這個的具體細節呢?這個bug導致了什麼現象?如何找到的?這個bug究竟是什麼呢?
……”
第二天,David Wang就给小编回了信:
“……
Regarding R520 bug
It is a circuit bug and the impact is that R520 could only run reliably at very low voltage and therefore limited its speed. After the bug is fixed, we can now run R520 at normal voltage to achieve much higher clock rate.
……”
从回信中,我们可以看到,R520的延期主要是因为一个电路上的问题而导致的,这个问题使R520的电压只能维持在比较低的水平,所以频率也上不去,导致了性能的不足。不过现在这个问题已经解决了,于是R520的核心电压可以达到正常水平,频率也可以比原来高很多。
对于90nm的工艺,当时的专访上,David Wang先生就明确表示,90nm工艺并没有影响R520的良率,相反,它能否让R520的频率达到更高。
“管线”这一概念不知道是什么时候开始深入人心的,讨论管线概念的最高潮应该是在GeForce 6 系列和Radeon X800系列的时候,人们逐渐形成了一种观念,这就是管线数越高,性能越好。
到了2005年,人们的目光放在了ATI和NVIDIA的最新图形芯片R520和G70身上,人们开始分分猜测他们的管线。
6月22日,NVIDIA率先发布了他们的图形芯片,G70,这款图形芯片给大家带来了24条像素渲染管线。
到了这个时候,人们争论的焦点已经完全集中在了R520身上,人们纷纷开始猜想R520的管线数目,24条甚至是32条的说法被广为流传,似乎唯有更多的管线数目才是R520的救命稻草,然而事实是什么呢?
当人们都在猜想ATI会通过更多的管线来赢得胜利的时候,ATI却走了一步人们没有想到的一招棋,他们向非管线论迈出了坚实的一步。准确的讲,R520不应该再以管线数目来评定。下面,我们就来看看R520的架构。
R520在像素渲染管线方面仍然采用了16条的设计,看到这个结果的时候不知道大家是怎么想的,可能和小编一样,有点莫名其妙吧。
但是随着笔者对R520的了解逐渐增加,不仅理解了ATI的做法,还觉得这样的方法实在是有其高明之处。
◎ R520主要看点一览:
一、架构采用独创Ultra-Theareding Dispatch Processor处理器控制程序流程,减小空闲,提高效率。
二、独创环形内存控制总线,内存管理速度提高。
三、全面支持SM3.0,全速128bit渲染。
四、全面支持HDR技术,增强画质。
五、独创自适应抗锯齿模式,在性能和画质中取得非常好的效果。
六、支持AVIVO视频功能,加速解码MPEG4。
首先我们还是来看一下R520的顶点渲染管线部分,因为如果按照3D图形处理顺序而言,这部分是需要先执行的。很早之前,顶点坐标的运算是由CPU完成的,到了GeForce和Radeon以后,图形芯片便具备了T&L(Transform&Lighting 变换和光照)的功能。
我们注意到,在R520图形芯片上,顶点渲染单元的数目为8个,这个数目是和NVIDIA的G70是相同的,比上一代的R4XX系列的6个增加了两个。
也许有朋友会问,为什么顶点渲染管线的数目的增加没有像素渲染管线的增加那么快,每代产品的增加并不会达到太大的幅度。
这是因为顶点运算的需求是决定于游戏本身的,每一个游戏的3D模型一旦确定,顶点数目是固定的,有的游戏提供了几种不同细节程度的模型供玩家选择,但是多数的游戏的模型是固定的,为了保证游戏的性能,游戏开发者通常会利用贴图等手段控制模型的3D顶点数目。游戏在执行的过程中,顶点部分的运算也是不会受分辨率,特效等设置而改变的。
所以对于顶点渲染单元,虽然是非常重要,但是却是需要始终本着够用的原则进行设计,游戏设计者也通常不会突然设计出对顶点运算要求非常高的游戏来的。这就是为什么我们看到从R9800到X800,到今天的X1800的增长显得非常平稳的原因。
我们看到,在每个顶点运算单元中,都由三部分组成,它们分别是:
- 上图中橙色的128bit精度的向量(vector)算术运算单元。
- 上图中红色的32bit精度的标量(scalar)算术运算单元。
- 上图中黑色的程序流控制单元(Flow Control)。
前面我们已经提到,R520全面支持SM3.0特性,可以执行多达1024条指令,借助于程序流控制的功能,可以执行的指令数就达到了无限条。
经过前面的顶点渲染单元的处理,每个时刻的3D模型中的顶点的位置和状态就被运算出来了,接下来,这部分数据被送到了顶点渲染引擎的后半部分:
现在我们就来看看这个部分的四个功能模块:
隐面消除技术节省大量资源
Backface Cull,这个功能叫做隐面消除,就是将3D模型中,不会显现在用户面前的那些三角形去掉,不进行下面的渲染,隐面消除技术能够非常有效地节省资源,当年的Kyro显示芯片就是因为这项技术声名大噪,虽然Kyro没有成功,但是这一思想在后来已经被NVIDIA和ATI学到了手里。
Clip,这个部分的功能是将位于屏幕边缘的三角形进行裁剪,将那些三角形重新修正成为和屏幕适合的三角形。
Persctive Divide 这部分是将3D模型中的三角形转换为平面信息重要步骤,这个功能模块可以称为透视除法,它将齐次坐标系下的坐标转换为2D坐标。
Viewport Transform 这个部分的功能是将已经生成的三角形顶点的2D坐标再进行转换,以便适应新的要求,缩放到小的矩形区域中。
Setup Engine
经过前面的顶点渲染引擎的处理,最基本的每个模型的顶点信息已经转换为2D坐标了,但是这个2D坐标并不是最终的画面分辨率的信息,只是一些点的2D坐标。
如果要进行下一步的操作,就必须进入Setup引擎进行处理。生成最终的每个像素的信息。
Setup,我们最常见的这个词的意思就是“安装”,但是在这里我们可以理解成,它用一个网格去比对前面得到的三角形顶点的2D坐标信息,将这些数据光栅化,从而得到像素信息,也就是得到了屏幕上每个点的数据信息。
进行这部分操作的时候也生成了每个点的Z轴信息,这些信息将被传输到Z轴缓冲中,以备后用。
当3D模型的数据按照用户的视角转换成为了屏幕上的像素的信息之后,现在就需要进行最重要的操作了,这也是图形处理中最关键,性能消耗更大的部分。
这个时候的像素信息,是不完全的像素信息,只知道这个像素是属于哪个三角形的,还有很多方面是没有确定的:
这个三角形上贴的图是什么?这个三角形收到那些光源的照射?这个顶点是否在三角形的边缘,会不会在抗锯齿操作中被处理?等等
所以整个像素渲染引擎是整个3D图形生成过程中最麻烦的一个操作过程,也是对性能要求最大的一个部分。
ATI在这次R520上特别增加了一个被称之为“Ultra—Thearding Dispatch Processor”的部件,这个单元负责将线程分派给下面的像素渲染管线。
我们知道,对于一个画面,是有很多数据需要处理的,而这些数据几乎都是平等的,像素之间,或者顶点之间。于是我们的每个图形芯片都需要能够同时执行这些操作,也就是并行运算。
但是现在出现了一个矛盾:一方面为了要求并行计算,很多像素要求同时进行操作,将画面分成一个个小块来处理将能够很明显的提高效率,但是如果一个块中的像素需要进行不同的操作,那么将适得其反。
另一方面,如果将每个像素作为最小的单位进行处理,那么出现问题的可能就没有了,但是这样效率将会很低,因为不同的像素的处理要求是不同的,简单的处理的快,复杂的处理的慢。
ATI的Ultra—Thearding Dispatch Processor便是用来解决这个问题的,首先,我们可以将每一个像素的处理过程理解成为一个“线程”,那么这个Ultra—Thearding Dispatch Processor的功能就是分配这些线程的执行。它可以动态检测到每个像素渲染单元的工作情况,避免了空闲的情况存在。
借助于这个单元,R520可以同时处理多达512个线程,这样就可以大大的提高效率,这也是R520只有16个像素渲染管线同样能够表现得如此好的原因了。
如果要理解这个概念,我们就必须先理解“粒度”这个概念,粒度就像是砂子的颗粒的大小,过小会数目增多而影响速度,过大而会导致冲突增多浪费资源。
R520同时处理的像素块的大小是16像素,也就是4*4像素的一个方块,这个数据相对于G70来讲要小一些。
我们来看一个例子:
我们看到,我们现在要进行的是一个阴影处理的情况,一共分为三种可能,一种是在阴影中,一种是不在阴影中,还有一种就是处在阴影的边缘。
我们看到,由于分支处理的操作能够和线程的操作并行进行,所以节省了操作需要进行的时间。原来需要20个流程周期完成的任务只需要14个就可以完成了。
◎ 全新像素渲染管线设计,不靠数量定胜负!
前面介绍了R520核心中的关键,Ultra—Thearding Dispatch Processor,这个单元让R520在像素管线数目不变的情况下提高了效率。那么现在我们就来看看R520新一代的像素渲染管线。
在R520中,16个像素渲染管线是被分成4组的,每组有四个像素渲染管线,这样的设计和我们所熟悉的其他显示芯片也是类似的。
对于每个像素渲染的内部结构,我们看到也是比顶点渲染管线要复杂的多,其中分为三个主要的部分:
- 紫色的是分支处理单元,主要用来处理分支流程。
- 红色的是标量运算单元,这个部分是两级设计结构,所以有两个标量运算单元,用来处理标量数据。这两个标量运算单元能够同时运行,一个处理一个ADD指令再加上一个Input Modifier操作,另外一个执行一个ADD命令或者是MUL命令,或者是MADD命令。
- 棕色的时向量运算单元,我们知道,像素的颜色信息通常是以向量数据存储的,这个单元也分为两个部分,同时能够执行两个三维向量指令。这两个指令包括:一个ADD命令加上一个Input Modifier命令;或者是ADD、MUL、MADD命令中的一个。
◎ R520通用寄存器阵列!显示核心的L2缓存!
在顶点渲染管线下面,我们发现了一个名叫“General Purpers Register Arrays”的区域,直译过来就是通用目的寄存器阵列的意思。
我们看到,整个R520芯片中,很多部分都和它相连着,看来这个区域的作用是相当的大,不但作为像素渲染管线数据的输出对象,还连接着Z缓存,材质缓存等模块。
如此看来,这块区域的左右就有点像是CPU的L2缓存,各种数据都能调用它。
在像素渲染引擎后面就是“Render Back End”了,翻译过来应该称之为渲染后端单元。这个部分是负责图像的后期处理的。
这个部分的功能模块比较多,主要是一些像是Z轴或模板比较的操作,抗锯齿的操作等等。
经过这个模块以后,输出至帧缓冲,就是最后的图像了。
◎ 创新双环形内存总线架构:完全自由缓存映射提高性能
上面介绍的都是R520处理核心方面的一些特型,除了这些,R520在内存管理上也有很大的改进。
在R520身上,ATI引入了双向高速环形内存总线的结构,这样就让R520内部的总线位宽达到了512bit的程度。双向环形总线大大提高了对内存的访问控制。
R520的内存总线是由两个256bit的环状总线组成的,这样数据可以双方向传输,提高了传输的效率。
在总线上,一共有四个RingStop,每个上面有两颗显存,并且连接两个Client Interface,中间由一个“Write Crossbar Switch”控制,这样的设计就能让显存和需要数据的部分最快的进行数据传输。
缓存映射
像CPU一样,图形芯片也不是直接访问显存的,也是通过一块高速缓存充当内存的镜像后访问的。
但是我们知道,缓存由于在芯片内部,所以容量不会太大,R520在缓存和显存的映射上进行了改进。
在原来的时候,采用的是直接映射方式,显存是分块被直接映射到缓存上的,这样如果有数据更新,整个缓存的数据就要清空,重新映射其他的区域,这样就会有大量的失效的情况发生。
在R520中,缓存和显存的映射已经变为完全自由的映射关系,自由度增大,数据刷新只需要更新局部的数据就可以了。
我们来看看ATI提供的内存映射成功率测试:
我们看到,在两个测试中,无论是Z轴数据还是材质数据,X1800XT的缓存失效率都要低于X850的水平。
在去年X800系列发布的时候,ATI的老大何国源就曾经表示,ATI将会支持SM3.0以及HDR技术。
R520的发布果然给我们带来了令人欣喜的SM3.0支持以及HDR效果,令人高兴的是,在R520中,HDR效果和抗锯齿并不冲突,我们可以在R520上实现开抗锯齿状态下的HDR效果。
自适应抗锯齿
R520以及它的衍生产品,RV530,RV515还支持一种全新的抗锯齿功能,自适应抗锯齿,这种功能实现了以多点采样的速度实现超级采样的效果。在部分透明的情况下的提升尤为明显。
这种功能分为两种模式,性能模式和质量模式,并且能够和其他ATI抗锯齿技术完美结合。
强化的纹理过滤功能
在R520中,对各项异性过滤的模式也进行了一定的改进,增加了三线性过滤的精度,提升了画面质量。
3Dc+
另外,在X800上创新的3Dc技术也得到了增强,在X1000系列图形芯片中,增加了对单通道贴图的压缩功能。这样就能对Z轴数据,模板数据等单通道数据进行压缩节省空间了。
接下来让我们先来认识一下今天将要测试ATI X1000系列显卡……
X1800XT、X1800XL以及X850XTPE ATI高端三强
R5**系列的发布标志着ATI显卡走向一个新纪元
本次抵达PCPOP的四款显卡:X1800XT、XL、X1600XT、X1300Pro
NVIDIA GF7800系列将是ATI X1800显卡的主要对手
从最低79美元的X1300HM到549美元的X1800XT,ATI Radeon X1000列显卡针对不同价位的市场划分为X1300、X1600和X1800三大子类,涵盖了低中高不同档次。下面我们将依次带来的图片介绍。
Radeon X1800XT是目前X1000系列显卡中最优异的产品,R520晶体管数量达到了3.21亿,采用90nm工艺,具备16条渲染管线和8个顶点处理单元,支持GDDR3/GDDR4显存类型,位宽256bit。零售价格为549美元。
ATI公版Radeon X1800XT显卡
X1800显卡PCB长/宽与GF7800GTX的完全相同
首款采用90纳米工艺的R520显示芯片
英飞凌1.2ns GDD3颗粒
ATI在高端X1800XT中采用的是德国英飞凌显卡颗粒,与三星1.2ns颗粒相同,英飞凌这款标号为HYB18H512321AF-12的显存可以规格同样为16M×32bit,1.2ns的额定工作频率能够达到1.6GHz,8颗就能组成512MB容量、256bit位宽的超强配置。
X1800 XT的频率达到625/1500MHz,采用双槽散热器,其PCB相比之前的RADEON显卡要大出不少。256MB版本的X1800XT价格为499美元
大家看到的Radeon X1800XL来自ATI优异合作伙伴蓝宝科技。显卡采用ATI全新架构的R520核心,领先的90纳米工艺制程。据悉显卡将在11月份陆续在国内上市。
蓝宝X1800XL正式零售版本
单槽加长版的Radeon X1800XL显卡
X1800XL GPU晶体管数量达到3.21亿,采用ATI命名的所谓Ultra-threaded架构,具备16条渲染管线和8个顶点处理单元,配备256MB显存,频率500/1000MHz。支持SM3.0、dual-link DVI输出和Avivo引擎等。
全新架构的R520核心
136 FBGA封装的三星GDDR3 1.4ns显存颗粒
与熟悉的144 FBGA封装1.6/2.0ns GDDR3显存颗粒不同,X1800XL显存部分使用了136 FBGA 1.4ns显存颗粒(外观扁长),显存运行频率大大提高。单颗规格仍然是8×32,组成显卡256MB显存容量、256bit位宽的显存规格。
揭开散热片可以看到VT1103S PWM辅助芯片
输入输出的配置上,X1800XT/XL显卡均搭载了RAGE THEATER视频编码器/解码器,使得显卡具备VIVO(视频输入/输出)功能。此外,支持HDTV高清输出、H.264硬件解码也是R520显卡最大特色。
面向主流产品的X1600,以下图片就是ATI Radeon X1600 XT的实物照片。显卡同样完全支持Shader Model 3.0和最新的Avivo视频引擎,GPU晶体管数量达到1.57亿个,具备12条渲染管线和5个顶点处理单元,支持Dual-link DVI输出。
定位在2000元档次的Radeon X1600 XT
虽然只要4颗显存,但显卡却拥有256MB显卡容量
代号为RV530核心的X1600系列显卡,拥有8条像素渲染管线
编号为K4J52324QC-BJ12的三星GDDR3显存颗粒规格为16M×32bit。因此显卡只需要使用4颗就能够组成256MB、128bit主流显存规格,运行频率为590/1380MHz。
如此高工作频率当然配备优良的散热、供电部分
除了大家看到的256MB版本,X1600XT同样也拥有128MB版本,定价分别为249/199美元。此外,X1600系列还有频率更低一些的PRO版本,价格在149~199美元之间。
Radeon X1300是ATI X1000系列显卡中的低端产品,显卡全部采用RV515核心。具体产品型号则分为X1300Pro、X1300和X1300 HyperMemory,价格则从79美金~149美金不等。
X1300 Pro采用的PCB与X1600完全相同
对比X1600能够发现,两款显卡不同之处于供电和显存部分
RV515核心的Radeon X1300 Pro图形芯片
采用了16×16规格的DDR2显存颗粒
它的GPU也是采用TSMC 90nm工艺,集成约1.05亿晶体管。显卡整体为单槽设计,具备Dual-link DVI输出,支持Shader Model 3.0和最新的Avivo视频引擎,具备4条渲染管线和2个顶点处理单元。
纯铜制金属风扇
X1300的供电设计
输出接口部分
这片RADEON X1300 PRO的核心/显存频率为600/800MHz,配备了256MB显存,建议零售价格为149美元。此外RADEON X1300系列还有另外两种规格,分别是频率450/500MHz($129 256MB / $99 128MB)和支持HyperMemory技术(核心频率450MHz,板载32MB显存,1000MHz频率,价格79美元)的产品。
◎ 测试平台介绍
本次ATI R5**测试我们仍然采用了GeForce 7800GTX测试时的高配置平台:处理器使用了AMD高端的Athlon 64 FX55,6000~7000元的价格也是目前最优异的PC用处理器之一;所搭配的主板也是在AMD平台中广受DIY玩家欢迎的华硕A8N SLI;内存方面则是双条海盗旗(CORSAIR)DDR400 组成的双通道。
ATI Radeon X1800XT测试平台实拍
蓝宝Radeon X1800XL测试平台实拍
硬件系统 | |
处 理 器 | AMD Athlon FX55(2.6GHz) |
主 板 | 华硕A8N-SLI Deluxe |
内 存 | Kingston DDR 400 512MB×2 |
硬 盘 | Seagate 7200.7 80GB |
显 示 器 | 爱国者 998FD |
参测显卡 | ATI Radeon X1800XT 512MB 蓝宝 Radeon X1800XL 256MB ATI Radeon 1600XT 256MB ATI Radeon 1300Pro 256MB ATI Radeon X850XTPE 256MB ATI Radeon X700 128MB ATI Radeon X550 256MB |
NVIDIA GeForce 7800GTX 256MB NVIDIA GeForce 7800GT 256MB NVIDIA GeForce 6600GT 128MB NVIDIA GeForce 6600 128MB | |
驱动程序 | |
主板驱动 | nForce Forceware 6.66 |
显卡驱动 | NVIDIA Forceware 81.84 WHQL ATI 催化剂 5.10 WHQL 官方正式版 ATI 8.19/ 8.173.2.3 Beta |
操作系统 | 英文版 Windows XP + SP2 |
◎ 测试项目介绍
测试部分依旧分为基准测试和游戏测试两部分。基准测试仍主要以大家关注的3DMark03、3DMark05得分最准;而游戏测试则包括《DOOM3》、《HalfLife2》、《FarCry》等经典游戏性能测试。测试分辨率则为1024×768和1600×1200,以及开启游戏特效。
加入的全新游戏性能测试
随着Radeon X1000系列显卡的发布,ATI也正式跨入SM3.0大门。PC游戏的SM3.0时代已经全面向人们走来!本次测试也特别增加多款2005年即将或已经发布的最新游戏大作,如《帝国时代3》、《使命的召唤2》、《英雄萨姆2》、《F.E.A.R》和《分裂细胞3》等。
◎ 3DMark03得分
从3DMark03的基准测试成绩看,高端X1800XT击败了NV GF7800GTX,领先幅度达5%左右,但X1800XL却落败于7800GT;而在中高端方面,X1600XT领先对手6600GT只有10%,作为一款定位1600元的产品,这样的性能表现显然是不尽如人意。而在低端同为4管线的1300Pro在于66标版对抗中也是一胜一负。
◎ 3DMark03(4×FSAA、8×AF)得分
开启特效之后,拥有512MB显存的X1800XT发挥出惊人的能量。在1024×768、1280×1024性能分别分别领先GF7800GTX达10%和20%。但在中低端情况依旧不是那么理想,均搭配了256MB显存的X1600XT、1300Pro均落败于只拥有128MB显存的6600GT和6600脚下。
◎ 3DMark05得分
◎ 3DMark05(4×FSAA、8×AF)得分
开启特效之后,ATI显卡领先优势越发明显。在1024×768分辨率中X1800XT和1600XT就分别领先7800GTX、6600GT达24%、50%之多。
虽然基准测试方面ATI略占上风,那么游戏测试部分又会如何呢?我们接着往下看……
◎ DOOM3测试成绩
对于OpenGL性能更加出色的N卡来说,A卡在DOOM3的测试里向来占不到任何便宜,此次ATI最新的R520也同样如此。我们可以看到,7800GTX和7800GT在所有DOOM3的测试测试场景中均胜出。
◎ DOOM3(4×FSAA)测试成绩
开启4倍全屏抗锯齿后,7800GTX领先优势进一步扩大。1024、1600两组分辨率中N卡测试成绩均领先超出了20以上。
◎ HalfLife 2测试成绩
Valve出品的HalfLife 2同样也是最关注的游戏之一,它没有像DOOM3那样对显卡的依赖程度高,游戏本身对于配置的要求更趋于合理。测试成绩我们看到,在1024分辨率下几款高端卡之家的差距是微乎其微;然而到了1600分辨率,7800GTX却悄然爬上了性能榜首的宝座。
◎HalfLife 2(4×FSAA、8×AF)测试成绩
在要求更高的测试环境下,高频率、大显存的X1800XT再次发挥威力。不仅一举在1024×768 4×8×分辨率下反超7800GTX,更在1600分辨率中将与7800GTX的领先差距拉大到17%。
由此ATI X1000系列显卡加入了对SM3.0技术的支持,为了保证在游戏中的正常显示,育碧先后发布了FarCry的1.31和1.33补丁。因此本次测试也将FarCry升级至1.33版本。
◎ FcrCry 1.33测试成绩
在普通分辨率测试中,依旧是NV的7800GTX稍占到优势,以微弱的优势保持对X1800系列的领先态势。
◎FarCry 1.33(4×FSAA、8×AF)测试成绩
果不其然,X1800系列显卡开始反攻。1024特效下,X1800XL就已经超越了7800GT,换成更高1600分辨率后,X1800XT也能够领先7800GTX 27%以上。
◎ Halo 测试成绩
Halo是微软早期推出的DX9游戏之一,通过测试成绩可以看到。双方显卡几乎呈僵持张体,对手间性能差异不超过2个FPS。
《分裂细胞:混沌理论》测试将分为三个SM1.1、SM1.1 4AA、8AF和SM3.0三组分别进行,用来考察显卡在不同模式下的性能表现。
◎ Slinter Cell:Chaos Theory SM1.1测试成绩
在SM1.1模式下的较量中,ATI X1800XT稍稍胜出。
◎Slinter Cell:Chaos Theory SM1.1(4×FSAA、8×AF)测试成绩
◎Slinter Cell:Chaos Theory SM3.0(HDR、8×AF)测试成绩
由于X850/X700/X550系列显卡不支持SM3.0技术,因此SM3.0模式下的测试中,这三块显卡没有任何得分。在性能对比上,X1800XT和X1800XL均是领先于7800GTX、7800GT,不难看出ATI X1000系显卡在SM3.0游戏中同样有不错的表现。
◎ 《帝国时代3》测试成绩(Shader Quality:High)
◎《帝国时代3》测试成绩(Shader Quality:Very High)
《帝国时代3》是05年最值得期待的一款游戏,PCPOP为此也推出了多篇相关测试文章。详细请见:《即时战略超级盛宴《帝国时代3》专题》
从测试结果中,大家可以看到N卡在《帝国时代3》中的巨大优势,除了1024×768分辨率与X1800XTPE战成平手,余下的几个测试选项里N卡均是大幅胜出。而在开启Very High选项后,N卡优势更加几乎接近一倍。X850XTPE、X700、X550由于不支持SM3.0,因此Shaders Quality无法开启至Very High。
◎ 《F.E.A.R》测试成绩
◎ 《F.E.A.R》测试成绩(FSAA:4× AF:8×)
《F.E.A.R》是第一款正对提供在菜单里对NVIDIA SLI技术进行支持的游戏,它的单机、多人试玩版中均提供了相关的测试程序。程序能够提供了测试最终的平价得分(Average)、最高得分(Maximum)。
对于玩家来说,平价得分显得更为重要。在普通分辨率的测试中,7800GTX、7800GT领先X1800系列优势非常明显,最高时接近一倍;而X850XTPE则是因为不支持SM3.0技术,测试成绩也相对较高,最后在复杂场景的测试中,虽然X1800系列夺得了最高得分,但几个重要的平价得分依旧掌握在7800GTX手中。
◎ 《英雄萨姆2》测试成绩
◎ 《英雄萨姆2》测试成绩 4×FSAA 8×AF
《英雄萨姆2》是近期几个备受关注的游戏之一。从测试结果看,游戏对显存配置的要求也称得上十分苛刻。我们将画面品质调整到最高,此时的6600GT也不过有8个FPS。
在测试中,由于X1600XT所使用的8.173驱动进去游戏后出现黑屏状况。所以X1600XT在《英雄萨姆2》测试中没有得分。
◎ 《使命的召唤2》测试成绩
◎《使命的召唤2测试成绩(4×FSAA)
对于《使命的召唤2》游戏的热情,小编丝毫不逊色与帝国时代3。为此我们也特别制作了相关专题奉献给广大读者。详细请见:《深入、全面!《使命的召唤2》专题盛宴》
在之前的测试我们已经了解到,COD2对于显存的容量尤为明显,当时512MB X800XL性能甚至可以超过X850XT。不难看出,X1800XT也是应此获益,在绝大多数测试中项中成绩都要领先与竞争对手。
X700显卡在COD2测试中出现重启启动现象,使用催化剂5.10问题依旧;而6600/6600GT则是在COD2 1600×1200 4AA模式里无法进入游戏。
在测试《使命的召唤2》这款游戏的时候,我们遇到了一些有意思的事情,首先是测试方法的问题,为了更精确的测试出FPS,我们仍然打算使用游戏自带的功能进行测试。
开启COD2中的控制台选项
这一部进行的比较顺利,进入游戏设置,打开命令行功能之后,按“~”进入命令行,非常简单,然后根据我们的经验试验了几个命令,很快就发现了录制Demo的命令是“Record”,播放demo的命令是“Demo XX”,需要进入测试模式则需要将“timedemo”设置为1。于是我们就开始了测试,每次测试完成的时候,我们发现在Demos目录下会生成一个CSV文件,里面有测试的数据。
Timedemo后游戏生成的CSV数据文件
于是,我们就开始了测试,但是当我们最后一个通宵整理数据的时候,发现了一个问题,1024的成绩比1600的成绩低,不开特效的成绩比开特效的成绩低,我们差点一下子蒙了,因为要从头测试这么多显卡,已经来不及了,我们曾经考虑是不是我们的成绩文件放颠倒了,但是后来觉得又不可能,于是我们忽然想到,CSV成绩文件中,每一帧后面跟的那个数字的意义是帧数么?
根据观察这些数据,我们发现这些数据全都是整数,于是我们进行了一次大胆的猜测,这个数字会不会是每一帧所耗费的时间呢?
1/平均值(25.9611)×1000(换算为秒)=平价测试帧数
于是我们把这个数据当作每一帧耗费的毫秒数,重新进行了计算,成绩终于正常了,为了验证,我们在跑Demo的时候用Fraps验证了几次,发现数据完全一样,证明了我们的猜想是正确的。感兴趣的玩家可以尝试一下!
◎ 测试总结
以上的测试结果证明,ATI采用全新架构的X1800XT显卡在管线数量没有增加的情况下,通过独特的“Ultra—Thearding Dispatch Processor”提升Shader执行效能以及较高的核心/显存工作频率也达到了提升效能目的。而实际测试项目中大家也都看到,16管线的X1800XT确实在不少测试项目中取胜24管线的GeForce 7800GTX。
除了高端的X1800XT之外,ATI X1600/1300在中低端市场中的意义显然更为重要。
◎ 看点一:性能更强!
通过X1000系列的布局大家已经了解到,X1600、X1300将分别用来接替目前市面中的X700、X500系列显卡。相比较X700、X550目前的性能状况,X1600/1300不仅加入了对SM3.0技术的支持,性能上也是得到大幅度提升。
测试中我们大致了解了X1600XT的性能表现,但按照ATI通常的产品策略,XT规格不会成为真正走量的产品。再加上1.2ns 16×32 显存颗粒的价格昂贵,最终大量上市仍将是配备2.0ns、1.6ns的普通128MB 1600Pro版本。那么这些1600XT的降频版本性能又会如何呢?相信这些才是大家想了解的重点。
GPU | 核心频率 | 显存频率 | 显存容量 | 建议零售价 (美元) | |
Radeon X1300 HyperMemory | RV515 | 450 | 1000 | 32(128) | $79 |
Radeon X1300 | RV515 | 450 | 500 | 128 | $99 |
Radeon X1300 | RV515 | 450 | 500 | 256 | $129 |
Radeon X1300 Pro | RV515 | 600 | 800 | 256 | $149 |
Radeon X1600 Pro | RV530 | 500 | 780 | 128 | $149 |
Radeon X1600 Pro | RV530 | 500 | 780 | 256 | $199 |
Radeon X1600 XT | RV530 | 590 | 1380 | 128 | $199 |
Radeon X1600 XT | RV530 | 590 | 1380 | 256 | $249 |
Radeon X1800 XL | R520 | 500 | 1000 | 256 | $449 |
Radeon X1800 XT | R520 | 625 | 1500 | 256 | $499 |
Radeon X1800 XT | R520 | 625 | 1500 | 512 | $549 |
Radeon X1000系列全家福
◎ 看点二:价格更便宜?
与性能紧密相关的就是价格因素,虽然X1000系列显卡还未正式上市,但从ATI 官方公布的产品定价看显卡依旧较为偏贵。有消息显示,ATI此举是为了减少X550、X700系列退市遇到的阻力;而一旦大量铺货后,X1600/X1300也会像目前的X700、X550一样迅速降至大家能够接收的较低价位。
另外从ATI官方得到的消息,将于近期推出的新版X1000显卡催化剂驱动不仅能够解决目前所遇到的一些Bug,对于显卡性能也会带来不小的提升。由此可见,X1000系列作为全新产品架构,通过驱动程序来挖掘性能潜力依旧巨大。目前,各家X1300Pro、X1300以及X1800XL显卡已经逐渐到货,而RV530核心的X1600系列和优异的X1800XT也将于11月初正式上市。
◎ R520,ATI新的起点!
从Radeon 9700 初入DX9时代的锋芒毕露,到Radeon 9800XT时代ATI的无限风光,直至X800XTPE、X850XTPE的换汤不换药,核心架构上的瓶颈已经成为制约ATI高端产品继续发展的绊脚石。在被竞争对手NVIDIA 在6800Ultra迎头赶上后,ATI已经落后于对手7800GTX近一代产品。此时此刻,R520所代表的已不仅仅一款产品型号这么简单。
对于竞争对手NVIDIA而言,R520终于能够使ATI在高端争夺战中拿出与7800GTX正面交锋的旗舰产品,这对于股票投资者以及DIY玩家信心建立能够起到决定性作用;对于ATI自身而言,R520将是一个全新的契机,基于这个核心架构下不断衍变和发展将是ATI未来的产品方向。就如同R520研发小组的负责人David Wang介绍那样:“在完善R520架构后,ATI接下来将怎么做就一目了然了……”
稍后将奉上ATI X1000显卡的画质对比及H.264视频解码测试,敬请关注!<