双核对抗四芯!ATI新旗舰1950XTX测试
IT领域可谓是变幻莫测,对于显卡而言2006注定是个不平凡的年份。从年初的ATI吞并XGI(图诚科技)图形部门、到一个多月前正式宣布的AMD重金收购ATI,太多的惊喜和意外让不少业内人士也为之咋舌。
在众多飞速发展的IT产业中,3D图形技术永远都是最吸引眼球,而显示卡无疑是游戏玩家非常关注的部分。这几年正是ATI和NVIDIA之间的激烈竞争将3D性能和特效推向了新的巅峰,才让普通玩家花较少的代价就能获得高性能的显卡。ATI和NVIDIA之间的竞争推动了整个图形芯片产业的发展,也让所有游戏玩家都尝到了甜头!
AMD&ATI联姻宣告了一个新时代的来临,ATI今后还会一如既往地带给我们更强、更具性价比的显卡产品。在ATI被收购一月之后,当ATI刚刚过完21周岁生日之时,ATI终于用实际行动打响全面反击NVIDIA GeForce 7系列的战斗!
去年,NVIDIA在GeForce 6系列形势一片大好的情况下,提前发布了GeForce 7800GTX,凭借G70核心24条管线以及日渐深入人心的SLI技术给ATI造成了不小的压力!R520的延期让ATI错失良机,X1800XT市场表现不如预期。
2006年初,卧薪尝胆的ATI先发制人,推出了拥有48个像素单元的R580核心,像素渲染能力翻了三倍的X1900XTX显卡实力雄厚,NVIDIA两月之后发布的7900GTX依然无法击败它!
X1900XTX的发布让ATI打了一个漂亮的翻身仗,与此同时ATI的交叉火力技术也已成熟,X1900 CrossFire也在更多新游戏中显示出了令人生畏的实力,SLI头一次面临巨大挑战!
在新一代GPU的竞争中,NVIDIA与ATI走上了完全相反的道路:G71核心通过缩减晶体管和采用新工艺的方式严格控制成本和发热,G71与G70相比仅仅是频率的提高,这让人有些失望;而ATI一心想要提高性能,R580比R520的像素渲染单元翻了三倍,晶体管也增加不少,在性能大幅提升的同时成本、功耗和发热的增加不可避免!
由此,高端产品发展思路的不同导致G71与R580两款GPU各具优缺点:G71成本低、功率小但暴露出了性能相对不足的缺点;R580性能强,但成本高、功率大。在下一代3D图形API依然遥遥无期的情况下,NVIDIA和ATI以这两款核心的基础上相继作出改进,先后发布了7950GX2和X1950XTX两款完全不同概念的显卡,意在弥补G71和R580固有的缺陷,继续提升性能!
文章导航:
『ATI X1950XTX发布背景及显卡最新特性』
『了解X1950XTX(R580+)核心架构优势』
『了解ATI X1950XTX(R580+)诸多核心技术』
『ATI独有完美HDR+AA效果对比赏析』
『X1950XTX显卡完全拆解,全新散热器赏析』
『X1950XTX显卡供电、做工用料最强解析』
『X1950XTX CF主卡规格完全分析』
『了解本次测试平台以及测试方法介绍』
『点击查看X1900XTX 3DMark系列得分』
『点击查看X1900XTX 各项游戏性能得分』
『查看文章总结及编辑评述』
ATI之前的最强武器X1900XTX发布至今已经有整整7个月了,按照显卡行业半年推陈出新的规律,ATI也该拿出新的产品增强竞争力。在NVIDIA发布双核心的7950GX2之后,ATI更不可能坐视不理,于是推出了加强版的X1950XTX。
从X1900XTX到X1950XTX,ATI到底在什么方面做出了改进?
● X1950XTX显卡的推出背景:DX10延期,7950GX2的压力
近年来显卡技术和速度的发展非常迅速,不过相信很多人都看出来了,进入2006年之后显卡的前进脚步明显放缓,3D性能和画质的发展出现了瓶颈效应!造成这一现状并非ATI和NVIDIA两大图形巨头之过,真正的罪魁祸首是3D图形API制定者Microsoft!
DirectX 9.0从诞生至今已经3年有余,即便是最新版本的DirectX 9.0C在位时间也达到了2年之久,要知道之前任何一个版本的3D API寿命均只有1年!下一代DirectX 10的屡次延期不但吊足了游戏玩家的胃口,也让NVIDIA和ATI DX9和DX10 GPU产品线间出现断层,此时两大巨头早已将研发重心转移到了DX10芯片R600和G80上面,所以不可能再针对DX9C推出新架构的GPU!
今年上半年,ATI和NVIDIA相继发布了X1900XTX和7900GTX。而到了下半年,微软DX10依然遥遥无期,据最新消息,Vista携DX10可能将会于明年初发布,这就意味着在DX9C的支配下,ATI和NVIDIA之间还有一场较量,这就是7950GX2和X1950XTX——两款皆非真正意义上的全新产品。
● X1950XTX是X1900XTX的改进版:
R580是一款非常优秀的核心,强大的像素处理,完美支持DX9C的动态分支预测,少有的HDR+AA,SM3.0性能和抗锯齿性能都非常出色,即便在高分辨率下运行只会造成少量的性能损失。这些特性都使得X1900XTX在与7900GTX的竞争中占有优势!
不过X1900XTX的缺陷也是显而易见的,庞大的像素渲染单元让R580核心的晶体管增加不少,核心面积膨胀,由此造成了X1900XTX成本高、功耗大、发热大、噪音大的缺点。X1900XTX性能固然强大,但这些主观上的缺点让对手7900GTX挽回了不少颜面。
于是ATI对R580核心作了一些优化,推出了基于R580+核心的X1950XTX显卡,成为业界首款支持GDDR4显存的显卡。高达2GHz的显存不但让X1950XTX的性能得到提高,而且功耗下降不少,超频强力巨大,可谓是一举数得!同时ATI重新设计了全铜热管散热器,很好的控制了显卡的发热和噪音,也弥补了X1900XTX的缺点!
● X1950XTX的特性:全新散热和GDDR4显存
看到X1950XTX显卡,映入眼帘的就是火红色外壳巨大散热器,这款全铜材质、热管风道式结构配以大口径涡轮风扇,其散热效率非常出色,因此风扇转速无须太高就能很好的控制温度,噪音控制令人满意!
由于散热器是向外吹风的设计,显卡的巨大发热量可以直接排出机箱之外,所以即便使用两块X1950XTX显卡组建交火,也不会对机箱的散热造成额外压力,ATI新版的散热器造型虽然夸张,但结构、性能和噪音都非常好!
X1950XTX的第二大特色就是首次采用了先进的GDDR4显存,频率达到了2GHz。超高的显存频率对于显卡的抗锯齿性能和HDR性能有莫大的帮助,由此可以进一步提高ATI在SM3.0游戏、抗锯齿、高分辨率以及HDR+AA等特效下的性能!
● 2006年优异显卡规格对比:
X1950XTX的R580+核心是在R580核心的基础上改进而来,下面就详细介绍下R580/R580+先进的架构和技术特性!
去年10月,ATI正式发布了X1000系列显卡,最新的R580+核心以及下月即将发布的RV560/570核心都是基于X1000架构,完全按照DirectX 9.0c的规格设计。最高端的R580+除了拥有强大的像素处理能力之外,还集成了众多ATI引以为傲的先进技术和功能,这些技术让ATI在未来的竞争中抢得先机、占尽优势:
● 令人生畏的实力——48个像素渲染单元:X1000系列的第一代R520核心仅拥有16条像素渲染管线,而对手NVIDIA的G70为24条,这使得R520在与G70的竞争当中处于不利局面,不得不依靠高频率来弥补不足。而ATI的R580/R580+的像素渲染单元一举提升至48个的境界,足足是R520的三倍,让人刮目相看!
不过也有人对ATI的这种架构表示质疑,R580/R580+虽然拥有48个像素单元,但纹理单元依然保持16个不变,按传统意义上的说法R580+还是只有16条管线,只不过架构上变成了16×3=48个像素渲染单元。
R580已经发布了半年有余,时间证明了ATI这种像素:纹理=3:1的架构对2006年新游戏的适应性非常好,X1900XTX除了在老游戏中表现不佳之外,在绝大多数主流游戏中都击败了拥有完整传统意义上24条管线的7900GTX,而且优势比较明显!
新游戏对像素处理的要求日益增多,而纹理处理所占比重呈下降趋势
因此ATI下半年即将推出的所有显卡——X1950XTX、X1950Pro、X1650XT、X1650Pro、X1300XT,都将全面贯彻像素:纹理=3:1的架构,以满足当前和未来新游戏的需要。
当然,ATI并非是忽视纹理单元的性能,实际上3D渲染纹理操作过多的依赖于显存容量和速度,因此ATI通过改进显存控制器、采用高速GDDR4显存的方式增强了纹理渲染能力,并且集成了后面将要提到的Fetch4纹理样本过滤器,提升了纹理渲染效率!
今后的游戏极其依赖于显卡的像素处理能力,像素渲染单元也被赋予了更多额外的处理和运算,因此除了给GPU设计更多的像素单元之外,如何高效能的分配像素处理操作,是提高显卡性能的关键所在!
● 强大的DX9C效能——超线程引擎支配48个PSU:
R580+的像素渲染引擎当中除了48个像素渲染单元之外,最核心的部分是一个叫做“Ultra-Thearding Dispatch Processor”(超线程调度引擎)的模块,这一部分的作用就是将线程分派给下面的像素渲染单元。而且可以看出Ultra-Thearding能够统一调度48个像素单元和16个纹理单元之间的协同工作:
传统的像素渲染架构(Pixel Shader Engine)设计造成大量的延迟及运算周期的浪费,这主要体现在动态分支(Dynamic Branching)的执行能力上,这是Pixel Shader 3.0中常用的指令,令Pixel Shader程序可以执行不同的分支或是根据运算而循环执行。
R580/R580+核心进一步优化了动态分支的运算。Ultra-Threaded Pixel Shader Engine能把一个庞大的像素渲染操作分拆为大量较小的执行簇,然后平衡地分给各个像素渲染单元,在同样的Shader程序下其执行簇被分割成细少的Pixel Blocks,因此为排除了部份单元需要等待其它单元完成的结果而造成闲置,减少了不必要的延迟并提供更快的执行效率。
动态分支被认为是Pixel Shader 3.0的重要新特性,可以让Pixel Shader根据计算出来的数值来跑不同的分支或者循环。如果正确使用的话,动态分支能显著地提高性能。例如在使用阴影贴图的时候,如果要对阴影作边缘柔和取样,使用动态分支可以在遇到不需要作取样的像素例如的时候就跳过去,以节省大量的Pixel Shader计算资源。
● 少有的HDR+AA技术——鱼和熊掌可以得兼:
DirectX 9.0c的主要规格就是升级到了Pixel Shader 3.0和Shader Model 3.0,前面提到ATI严格按照PS3.0架构设计,动态分支执行力大幅提高,在新版DX9C游戏中的表现非常出色。而SM3.0所带来的HDR(高动态范围光照)技术则让人又爱又恨,因为所有的游戏在打开HDR之后就无法开启AA(全屏抗锯齿)——这是在NVIDIA的显卡之上!
HDR和AA难以取舍,只有X1000才能支持HDR+AA
ATI在X1000架构设计之初就意识到了HDR的重要性,也考虑到了仅有HDR难以满足追求完美画质游戏玩家的要求。于是在X1000系列的高中低端所有GPU都集成了特殊的缓冲区域,通过驱动或者游戏引擎调用这部分缓冲区同时开启HDR和AA。
但由于是来自API的限制,程序设计者仍必须对游戏引擎进行改进,重新指定缓冲区域才能实现HDR+AA效果。由于绝大多数游戏都是按照FP16 HDR模式设计,支持SM3.0的A卡开启HDR后还是会占用FSAA缓冲区,因此能够同时支持FP16 HDR+FSAA的游戏数量还比较少,有些需要打补丁或者安装特殊驱动才能开启,这也算是不成熟的SM3.0历史遗留问题,怨不得ATI。
自从ATI HDR+AA技术被炒热之后,完美的画面表现力征服了越来越多的游戏玩家。从最早的3DMark06、孤岛惊魂1.4、英雄萨姆2,到较新的上古卷轴4、分裂细胞3以及西部枪战,随着时间的推移也有更多的游戏能够支持HDR+AA技术。
这其中上古卷轴4可以说是HDR+AA技术应用的转折点,ATI著名的“Chunk”驱动能够从API底层接管AA,然后在游戏中开启HDR,如此一来理论上能够让大部分SM3.0游戏直接支持HDR+AA,相信今后会有更多游戏开启完美游戏画面,不必在HDR和AA特效之间犹豫不决!
● 超高分辨率游戏变为可能——增强的HierachicalZ技术:
液晶显示器的普及让游戏玩家欣喜不已,大屏幕、宽屏成为了近年来出现频率最高的词汇,如今主流用户已经用上了17/19寸普通液晶,不少用户喜欢19/20/22寸宽屏,高端玩家目光瞄准了24/30寸宽屏。
玩游戏,显卡和显示器要匹配,高分辨率对显卡的要求非常苛刻!
液晶显示器的迅速普及让游戏玩家尝试在1920×1200(WUXGA),2048×1536(QXGA)甚至是2560×1600(WQXGA)等超高分辨率下进行游戏,显然在这些超高分辨率下对显卡的像素渲染、填充速度和显存带宽都会造成沉重的负担。
ATI显卡都支持一个名为HierachicalZ的技术,这个可以在前面R580核心架构图中看见。这个技术是有针对性的满足上不同分辨率的需求,它会检测出哪些会在最终成像画面被隐藏的像素点,并在要对他们进行渲染处理前丢弃。不过这一技术的前提是显存容量要足够大,否则HierachicalZ技术将会自动降低画面的渲染品质。
R580/R580+集成了比R520多出50%的HierachicalZ缓存,这样就能确保R580+的性能不会在超高分辨率下急剧下降,HierachicalZ技术配合512MB GDDR4显存控制器,再加上AVIVO显示引擎中的两个完整DVI接口,能够在高分辨率游戏中提供更出色的表现力,让R580+的实力彻底发挥出来。
目前游戏显卡的最高输出分辨率为2560×1600,这正好是30寸液晶显示器的分辨率,在这种极端显示模式下X1950XTX的性能表现如何呢?HierachicalZ技术能否起到关键作用?感兴趣的玩家请留意后文中2560分辨率下的游戏测试。
前面向大家介绍R580/R580+的诸多技术,比如48像素单元以及3:1的架构、超线程调度引擎、动态分支、HDR+AA技术、HierachicalZ超高分辨率游戏等功能,已经得到了广泛的应用,并且在X1900XTX显卡身上得到了充分的证明。
实际上R580/R580+核心还有不少特技尚未得到普及,虽然应用范围不够广泛,但从中也可以看出ATI为提高GPU功能和性能所做出的努力,强大的R580+核心被ATI赋予了更多超前的技术:
● 让物体运动更加真实:GPU物理加速技术
随着GPU性能越来越强大,CPU逐渐地成为了渲染速度提高的瓶颈,这已经成为了无可争议的事实!因此GPU越来越强的渲染处理能力已经开始在共享原本属于CPU的工作量,例如在粒子系统、纺织物、流体流动这些物理仿真动作在CPU算不过来时,可以映射到GPU的工作列表中,使用GPU强大的渲染能力来处理。不过,这些从CPU处理列表中转移过来的资源毕竟远离标准的图形渲染范畴,所以更多的渲染处理被用来搭建负载平衡系统,其提高整体的帧渲染速度。
据之前对R520芯片的测试报告,R520的演示海洋波浪的物理运算能力相当于Intel P4 3.0GHz的3倍以上!因此GPU物理加速已经应用在了多款XBOX360游戏上面,而ATI也在今年正式公布了基于X1000系列显卡的物理加速方案,并且演示了不少技术Demo:
事实上目前独立的物理加速方案才刚刚起步(Ageia的物理加速卡),而GPU物理加速尚未进入实际应用阶段,但ATI先人一步通过灵活多变的解决方案和演示Demo证明了X1000架构的优势,相信今后将会有更多的PC游戏支持GPU物理加速技术,让劳累不堪的CPU解放出来,3D画面和速度提升的新的境界!
● 软边阴影性能再提高——阴影渲染加速和Fetch4技术:
大多数阴影渲染效果都有一个局限性,那就是创造出来的通常都是一个轮廓鲜明的硬边线阴影,而在真实世界里,阴影都是软边线的。用技术手法创造软边线阴影通常都要做一些过滤阴影基本图的工作,需要进行巨大数量的样本纹理对照,这对GPU的纹理单元是一个巨大的负担。
动态分歧机制可以利用扫描阴影边缘像素的方法改善阴影绘制的速度,由于阴影的特效表现主要侧重于边线的描绘上,因此通过过滤的方法在提高阴影成像质量的同时大大缩短了成像的时间。
为了更大的促进这项软边阴影过滤技术,R580/R580+集成了一个新的纹理样本过滤器——Fetch4,它由四个组成部分(红绿蓝和透明度)。这些纹理单元被设计成可以从一个纹理地址同时采用和过滤全部四个组成部分,当单一的组成纹理过滤器去查找不同类型的纹理时,Fetch4可以同时用四个值在边线临近的地址去采用,这就能在使用4个样本对照的前提下有效的增加纹理采样的速度,完美的兼顾质量与速度。
如此一来,超线程的动态流控制加上具备快速纹理查找功能的Fetch4技术,R580+强大的硬边阴影渲染加速能够生成更加贴近真实的软边阴影。
● 物体表面更加真实:视差映射技术
视差映射(parallax occlusion mapping)使用一个光线跟踪的样本与正规的映射相结合,能够添加更多水面2D细节、倒影和物体本身的阴影特性等特效处理,主要是利用强大的算术处理能力和动态流控制来增加3D渲染场景的真实性。
视差映射技术使用像素渲染流控制依据视角改变动态的对距离内像素进行反复扫描,从而让物体表面的细节部分更具层次感:
● 小结:
我们非常欣喜地看到R580+能够在R580和R520架构的基础上,集成和改进了如此众多而且实用的新功能和新技术。当然ATI所倡导的这些激动人心的技术都是建立在48个像素渲染单元强大性能的基础之上!
但是当今的主流游戏始终要慢D3D API和GPU硬件半拍,实际上现有的游戏程序只开发出了GPU像素渲染能力的一小部分,很多情况下都可能无法完全发挥出优势来。
ATI引以为傲的3Dc+纹理压缩技术、少有的HDR+AA、代替CPU而进行的物理加速技术、软边阴影以及视差映射技术等等,如果将这些技术应用起来,R580的速度可以达到R520的两倍以上,而且分辨率越高优势越明显!ATI所展示的玩具店Demo就能充分的反映出这一效果。
因此R580更加强调的是未来的性能表现,超前的规格虽然在现有软件环境下无法完全发挥出来,但是这些激动人心的特性都可以为下一代的产品拓展出更大的应用范围!只要有游戏采用了其中某项技术,就能够让R580的速度与画质优势发挥出来!
在众多图形技术和特效当中,HDR+AA无疑是最受关注的一项,这不仅仅是因为HDR+AA能够大幅提高游戏画面表现力,最关键之处就是ATI X1000显卡能够支持这种技术,而NVIDIA无法开启,那么下面就通过实际游戏截图来展示ATI独有的HDR+AA技术:
● 最具代表性的3DMark06:
为了便于对比,我们将HDR+AA和HDRnoAA做成了Gif动画给大家展示了出来,这样虽然损失了一些颜色数,但可以非常清楚直观地看到,3DMark06的两个SM3.0场景如果没有开启AA的话,锯齿效果令人非常反胃!
● 教科书式的FarCry 1.4:
FarCry是款非常经典的FPS游戏,它虽然发布时间早但能够支持最新的特效,安装了1.4补丁之后,它就能够开启HDR+AA效果,虽然目前的版本还只能支持2xAA,但画面的改善已经很明显了:
有关FarCry 1.4开启HDR+AA的方法以及更多的图片请看“ATI/NV高端卡对决FarCry1.4”一文,拥有48个像素单元的R580/R580+在开启HDR+AA时性能损失很小。
● 完美的上古卷轴4,大名鼎鼎的Chunk驱动让更多游戏开启HDR+AA:
上古卷轴4是对HDR+AA支持最完美的一款游戏,Chunk版的催化剂驱动能够直接打开6xAA和HDR,画面效果比FarCry明显提升!
下面的图片左边都是只开了HDR,而右边为HDR+AA,点击放大可以看得一清二楚:
A卡最高能够提供6xAA,而上古4就能同时开启HDR和6xAA,完美的画质令人无可挑剔,同时也反映出了ATI的HDR+AA技术从硬件上来说是非常成熟的。
现在针对上古4的Chunk特殊驱动已经能够让细胞分裂和西部枪战等游戏完美开启HDR+AA,由此可见HDR+AA技术的通用性相当好,这些游戏官方并没有宣称支持HDR+AA,而ATI通过驱动底层实现了6xAA的非常好的特效,现在ATI每发布新驱动都会放出最新的Chunk版HDR+AA驱动,以便让A卡用户享用到最完美的特效!
● 小结:
无论FarCry还是3DMark06,或者是其他的游戏,HDR带给我们震撼视觉效果的同时,无法开全启全屏抗锯齿让画面的细节部分表现力不足,这让人感到非常遗憾!
鱼和熊掌始终不能兼得吗?随着越来越多的游戏开始支持HDR+AA这种特性,X1900/X1950给了我们完美的答案!HDR+AA让画面的视觉效果更上一层楼,当然这一切都是在X1900强大渲染能力的支持下展现出来的,没有足够的FPS,一切都将是空谈!
了解了R580+核心架构以及相关技术之后,我们就来详细认识下基于R580+核心、GDDR4显存的X1950XTX这款优异显卡:
● X1950XTX的造型焕然一新:
NVIDIA从7800GTX 512MB到7900GTX,PCB和散热器没有做任何改动,外观一模一样;ATI从X1800XT到X1900XTX,PCB小幅改动、散热器没有变化;单从外观上很难区分两代显卡,而新款的X1950XTX的造型让人眼前一亮:
X1900XTX的公版散热器备受指责,温度高噪音大,由于R580/R580+核心本身发热量就大,因此ATI重新设计了一款全新的散热器,不但外观漂亮,而且效能出色:
● 高效能散热器——全铜、热管、大口径涡轮风扇:
X1950XTX的散热鳍片数量和长度明显比X1900XTX多,而且在铜底和散热片之间镶嵌了一个U型热管,有助于将核心的热量迅速的导出到大面积散热片的边缘,这样鳍片上的热量分布更加均匀,散热效率大幅提高!
涡轮风扇侧吹,平行风槽式热管散热片结构
我们也可以看到,ATI这款新散热器的结构与散热大厂Arctic Cooling的ATI Silencer系列产品的结构有些相似,通过使用大口径涡轮风扇,可以在提供大风量的同时保持较低转速,这样就能很好的控制噪音。同时侧吹式的风道能够将显卡的热量直接吹到机箱之外,不但不会给机箱的散热造成压力,而且强筋的风扇能够帮助提高机箱的通风效果!
这个7CM涡轮风扇采用了双滚珠轴承,电机额定电流0.75A、+12V供电,全速运行时转速达4800转,噪音为55分贝,风量16.1CFM,风压0.512英寸水柱。如果风扇全速运转,噪音还是比较大的,不过这个风扇采用了4Pin全自动温控调速,在默认情况下X1950XTX的风扇转速仅为12%,它会根据监控到的核心温度自动控制风扇转速,经过我们长时间的测试发现风扇转速不会超过50%,噪音非常小,温度控制也比较出色。
● 改进的R580+核心,集成GDDR4显存控制器:
通过对比R580+和R580核心,我们可以发现它们并没有明显区别,连核心周围的电阻都是一模一样的。ATI设定的默认频率也都是650MHz:
实际上这两颗核心确实没有重大变化,否则ATI将会把新核心命名为R590而不是R580+了。
R580+修正了R580的一些BUG,是R580的改进版,主要就是针对已经量产的GDDR4显存做了优化,能够更好的发挥高频率下的效能。
● GDDR4显存首次亮相,频率高达2000MHz:
当前最快的GDDR3显存为1.1ns,已经被广泛地用在7900GTX和X1900XTX和部分中端显卡上面,不过GDDR3已经没有继续提高频率的潜力,因此三星、现代等DRAM大厂已经开始量产GDDR4。而ATI X1950XTX是首款采用GDDR4显存的显卡:
GDDR3与GDDR4并没有本质区别,封装都是FBGA 136Ball,所以外观是一样的,目前GDDR4电压维持在1.8/2.0V,与GDDR3基本相同。不过GDDR4与GDDR3显存的内部存储结构已经发生了变化:
X1950XTX所采用了三星GDDR4显存颗粒采用了8bit预取,它内部为8bank存储单元(Cell),每个Cell单元拥有32bit位宽,经过放大器后8个cell组合成256位内部总线,然后通过8位的数据预取单元处理后传输到输出缓存,输出数据总线是32bit位宽,通过提高频率和在时钟上升延及下降延传输数据,虽然输出总线位宽变窄,但是数据传输率是一样的。
通过8bit-prefetch结构可以在相同的Cell工作频率上把数据传输率倍增(相对于4bit-prefetch结构),有效的解决了内存发展所遇到的瓶颈。由于DRAM结构的限制,内部存储单元的频率是比较困难的,而且成本较高。也就是说在相同Cell频率下,GDDR4的数据传输率比GDDR3提高一倍,换句话说,在相同的数据传输率下,GDDR4的Cell工作频率只有GDDR3的一半,这样为显存发展又扫清了障碍,显存频率提升又回到一条康庄大道上!而2GHz也仅仅是GDDR4的起跳频率,GDDR4显存拥有冲击高频率的潜力,据称3.2GHz的GDDR4显存也即将量产!
看来GDDR4显存的实力不可估量,X1950XTX应该拥有很强的超频潜力!
● 依然保留视频输入输出功能:
NVIDIA自7800GTX之后,所有显卡均取消了对VIVO(视频输入输出)的支持,而ATI并没有省掉显卡的视频输入功能,我们可以看到在X1950XTX显卡上依然保留了ATI Rage Theater这款成熟的视频芯片:
ATI Rage Theater系列的优势就是其驱动已经包含在催化剂驱动包(WDM驱动)内,安装显示驱动时就被一并安装,非常方便实用。虽然视频输入用到的机会并不多,但显卡集成此项功能使用起来非常方便快捷,由此可见ATI强化多功能的设计。
X1900XTX显卡的性能本身就非常强悍,但令人遗憾的是功耗非常恐怖,散热器噪音较大,为此ATI在X1950XTX显卡上面花了很大的功夫来能缓解这两大缺陷。前面已经介绍过X1950XTX使用了新版散热器,温度和噪音控制的相当出色,那么ATI如何做到降低显卡功耗呢?这还得从显卡的供电说起!
X1950XTX的PCB版型看上去和X1900XTX非常相似,实际上ATI是重新开发了新的PCB,重点就在于对供电模块做出了改进,以便降低显卡的整体功率!
● 增强的供电模块,转换效率更高:
如上图所示,1号位置的长条形芯片就是给GPU供电的主控芯片,VOLTERRA的VT1115MF,采用了SOP封装40Pin,它能够控制多项回路
2号位置的4项供电模块,是4个电感搭配相同的4颗VT1115SF,这种芯片采用了CSP 53Pin封装,它们在1号位置VT1115MF主控芯片的支配下每个提供30A电流,这样4路并联就是120A。而X1900XTX显卡使用了5个较早的VT1105芯片,总共25×5=125A电流。因此X1950XTX虽然少了一相供电,实际输出功率是基本相同的,而预留的一相空位则可以在必要时将X1950XTX的供电能力再提高30A!
3号位置的两组模块(两个小芯片各自对应一个电感)并不相同,但它们都是给GDDR4显存供电。靠上的VT233是主控芯片,CSP封装62Pin,它是控制芯片也提供电流输出,因此芯片面积和针脚也比较多,VT233能提供12A电流。较小的VT232为CSP封装41Pin,提供8A电流输出,两路并联可以给显存输出20A电流。
X1950XTX的供电模块设计非常复杂,除了六个磁闭电杆和整齐排列的陶瓷电容比较显眼之外,隐藏在条形散热片下面的六颗控制芯片都集成了MOS,构成了六相供电回路,其中显存两相、GPU可以根据自身功率删减模块,X1950XTX用了四项。那么这种复杂的供电回路有什么优势呢?
VT1115SF是CSP封装,所以电气特性好,散热效率高,条形散热器依靠涡轮风扇的少量进风就能很好的完成散热。
VT1115SF内建MOS和驱动电路,所以散热好可以通过大电流,而且是数字式,可以避免MOS这类传统模力元件长期工作在大电流下,老化以及精度下降的缺点。
当然最明显的优势就在于这套芯片的损耗非常小,整体转换效率高。X1950XTX的VT1115最大可以提供150A电流,效率前可以达到85%;7950GX2上的简单双路PWM可以分别提供的60A电流,转换效率只有70%;X1900XTX的VT1105在120A输出的情况下转换效率达到了80%。
X1950XTX的功率比X1900XTX低了整整22W!
得益于全新设计的供电模块,X1950XTX得电流转换效率比X1900XTX提高不少,因此总功率得到了较为明显的下降,据测试功率下降了22W之多,比7950GX2更省电!
● 多层陶瓷电容(MLCC),优异做工与用料
通过前面的分析我们知道供电模块的VT1115主控芯片拥有很高的转换效率,这种高效率主要依靠的是高达1.5MHz的开关频率,在如此高的频率下普通的铝电解电容无法满足要求,而更高级的钽电解(包括聚合物)电容,在开关频率高于1MHz的情况下,电气性能会大为下降(普通显卡所使用的PWM开关频率为300KHz左右)。
所以在X1800/1900/1950显卡的供电模块看不到任何的普通直立电容和钽电容,而只能看到一排排昂贵的MLCC(多层陶瓷电容)。MLCC被广泛的用在军用雷达、电子干扰发射机等高精密电子设备之上,近年来被高频率的CPU所采用(Intel CPU背面就有很多MLCC),因为MLCC能够在很高的频率下工作,而且拥有极强的抗干扰能力。MLCC的上限工作频率可以高达100GHz以上,而铝/钽电容工作频率还没有高于1MHz的!
MLCC的另一个优势就是ESR值(等效串联电阻)特别小,大家认为优品的SANYO OSCON电容拥有最小的ESR值(一般此时电容值高达1500uF以上) 都在10毫欧姆左右,而MLCC(22UF)很轻易达到1毫欧姆以内,可以说不是一个级别,正是MLCC的这些优品特性奠定了它电容之王的地位!
ESR值是一个非常重要的电容参数,比如即使1毫欧姆乘以100A的电流=0.1V,而显卡的核心工作电压只有1.3V左右,显存在1.8V左右,细微的电压波动可以直接造成死机或花屏!即使1950XTX用了那么高档的MLCC仍然要多颗并联才能让ESR进一步降低。X1950XTX使用的是优品22UF 0805 X7RMLCC电容,成本自然非普通铝/钽固体电容可比!
在X1950XT PCB背面和输出部分,也使用了不少钽电解电容,这些电容与核心、显存两个耗电大户无关,主要给一些小PWM滤波,这些PWM负责风扇和辅助芯片的供电。X800系列和7800/7900的主供电模块依靠钽电容滤波,而X1950XTX竟然用钽电容给风扇和小芯片供电,ATI高端显卡奢华的做工和不惜工本的用料可见一斑!
● 小结:
X1950XTX是ATI新的旗舰级产品,从她身上再次看出了ATI豪华的用料和优秀的设计做工。单单是一个全铜热管散热器,成本就要高达50美金左右;首次采用GDDR4显存也让ATI重新设计了复杂的PCB;12层PCB和最优秀的供电模块搭配密密麻麻的陶瓷电容,完美的做工令人无可挑剔!
令人难以置信的是,这款成本高昂的优异显卡上市价格仅为449美元(国内低于3999元),这个售价非常厚道,要低于NVIDIA的7950GX2,仅和7900GTX相当,要知道即便是双核的7950GX2,其成本也要远低于X1950XTX!
从X850 CrossFire、X1800 CrossFire到X1900 CrossFire,如今ATI的X1950XTX CrossFire已经是交叉火力的四款产品了。不过从实现方案的技术角度来讲,X1950XTX CF与X1800 CF和X1900 CF并没有本质区别,依然是第二代交火:
● X1950XTX CrossFire的实现方案与X1900 CrossFire完全相同:
● 实现交叉火力的关键——CrossFire合成引擎:
● 小结:
从X1800XT发布到X1800 CF上市整整花了3-4个月的时间,由此直接导致X1800 CrossFire失去了同7800GTX SLI同台竞技的机会,所以ATI吸取教训之后的X1900 CF与X1900XTX同期发布,并且发布后立即上市,使得X1900 CrossFire迅速创下了多项世界纪录。
而X1950XTX CrossFire是完全针对NVIDIA 7950GX2 Quad SLI而来的,目前NV的Quad SLI技术还不够成熟,那么ATI凭借双核心能否击败四核心呢,下面就通过实际测试来进行说明。
● 测试平台:
测试平台 | |
处理器 | AMD Althon 64 FX62(2.8GHz,L2=1MB×2) |
主 板 | 富士康 M2N32-SLI(NVIDIA Quad SLI平台) 微星(ATI CrossFire平台) |
显 卡 | X1950XTX 512MB(650/2000MHz) X1950 CrossFire(650/2000MHz) 7950GX2 1024MB(500/1200MHz)×2 |
内 存 | 宇瞻DDR2 667 1GB×2 |
硬 盘 | Seagate 7200.7 80GB |
显示器 | Dell UltraSharp 3007WFP |
驱动程序 | |
nForce Forceware 9.34Beta | |
Forceware 91.36 WHQL 催化剂6.8 R580+专用版 | |
操作系统 | Windows XP + SP2中文版 |
如今AMD和ATI已经是一家人了,测试平台选择了AMD&ATI自家的优异配置:AM2 FX62处理器,专为交火设计的RD580芯片组,以及X1950XTX双卡:
● 测试方法说明:
如今的优异显卡性能越来越强,显卡更新换代速度之快令人目不暇接,然而游戏玩家对显卡的要求也是与日俱增。对于高端用户而言,使用大屏幕显示器在高分辨率玩游戏是常事,而且抗锯齿、各种游戏特效以及HDR技术能开的都统统打开。
实际上对于高端显卡来说,在低分辨率下跑测试意义不大,过百的游戏FPS基本感觉不出来有什么差别,因此我们顺应历史潮流将测试分辨率提高,选择了1600×1200(高端CRT显示器非常好的分辨率,也能够代表20/22寸宽屏显示器的分辨率)、1920×1200(24寸宽屏液晶非常好的分辨率)和2560×1600(30寸宽屏液晶非常好的分辨率)三种最具代表性的分辨率。
优异显卡单卡就能够在1600分辨率下流畅运行任何游戏,对于双卡互联系统来说,高端用户至少会为其配备一台24寸液晶,因此X1900XTX CrossFire和7950GX2 Quad SLI我们只测试了1920和2560两种分辨率,因为在低分辨率玩游戏没有任何意义!
所有的游戏自然是所有特效全开最高,能开HDR、SoftShadow、AA的尽量都开启,下面我们就来看看最强显卡之间的较量。
首先从家喻户晓的3DMark系列测试软件开始,由于3DMark的默认跑分测试在玩家当中有很高的地位,因此保留默认设置下的3DMark成绩:
● 3DMark03:
在开启4AA和16AF之后,X1950XTX奋起直追,在2560分辨率下并没有落后太多,由此我们可以得出这样一个结论:X1950XTX在高分辨率下拥有不错的性能,同时AA的性能损失也比较小!那么我们在后面的测试中检验一下,看看X1950XTX能否保持上升的势头?
7950GX2双卡就是NVIDIA近期主推的Quad SLI技术,X1950XTX交火在3DMark03依然无法击败7950GX2双卡,不过极端模式下的成绩已经比较接近了。
● 3DMark05:
终于,在打开AA之后,X1950XTX在2560分辨率下成功反超7950GX2,虽然领先优势不多,但至少证明了R580+核心的实力,单核并不弱于双核!
X1950XTX单卡不敌7950GX2,但在双卡互连之后,7950GX2 Quad SLI的效能就比较低了,轻松被CrossFire反超,X1950XTX CrossFire取得了完胜,而且可以看出,分辨率越高,CrossFire领先的幅度就越大!
● 3DMark06:
3DMark06的成绩也在意料之中,7950GX2在低分辨率下大幅领先于X1950XTX,分辨率从1920提高到2560,7950GX2的成绩损失较大,而X1950XTX的发挥很稳定,虽然还是落后,但差距已经很小了。
7950GX2 Quad SLI效能低下的状况在3DMark06种没有得到改善,X1950XTX CrossFire火力全开,大打翻身仗,尤其是SM3.0/HDR性能领先比较多。
另外,X1950XTX能够开启SM3.0测试的HDR+AA,而7950GX2不行,两者之间无法进行对比,因此没有进行测试。
● 小结:
在3DMark单卡测试中,双核心的7950GX2是毫无疑问的胜者。默认分辨率下跑分7950GX2遥遥领先,中等分辨率下优势也非常明显。即便在2560分辨率下也有一定的优势,但是在这些优势背后却隐藏着一丝不安要素,那就是X1950XTX在高分辨率和抗锯齿的模式下性能损失要比7950GX2小!
而在组建双卡之后,7950GX2就暴露出了固有缺陷,它本身就是一款基于SLI技术的显卡,双核心的效能当然非常高,因此“单卡”对比能够全面领先于X1950XTX。但是双卡之后Quad SLI就是四核心,效能损失严重,被X1950XTX CrossFire击败并不意外。
3DMark理论测试反映出来的是不是普遍存在的?下面就通过实际游戏来检验。
● 半条命2:遗失的海岸:
遗失的海岸采用了Int16精度的HDR,因此N卡也能够开启HDR+AA,可以看出,在这种模式下7950GX2拥有很大的优势,无论哪种模式,是否开启AA,都没有给X1950XTX任何机会。
双卡互连,X1950XTX CrossFire的优势开始体现,分辨率越高优势越明显,这就是HierachicalZ技术的功劳。
● 孤岛惊魂:
FarCry使用的是标准的FP16 HDR,因此A卡能够开启HDR+AA,而N卡不行,所以每种分辨率我们使用了4AA8AF模式和HDR8AF模式进行对比。
通过成绩可以发现X1950XTX的AA性能要高出一筹,而7950GX2的HDR性能具有较大优势。可惜的是强大的7950GX2无法同时开启HDR和AA!
从上面的成绩可以看出,Quad SLI在遗失的海岸中性能发挥还不错,但成绩表现并不稳定,看来四核心非常依赖于驱动的性能优化。CrossFire依然占据主动,一扫单卡落后的局面!
● FEAR:
使命召唤2是款XBOX360移植大作,A卡自然全面领先,而且优势非常明显!
依然是没有悬念的对比,CrossFire的优势明显。不过Quad SLI凭借四核心,在SLI8AA对比CrossFire8AA的模式下扳回一局。
● 细胞分裂:混沌理论:
细胞分裂的成绩完全在意料之中:开HDR的话7950GX2优势明显,开AA两者的差距缩小。
对于N卡来说细胞分裂HDR和AA无法共存,而A卡则可以通过特殊驱动开启HDR+AA,方法同上古卷轴4类似。
● 小结:
让X1950XTX对抗拥有双核心和1GB显存的7950GX2,的确是有点强人所难,7950GX2凭借成熟的SLI技术,在绝大多数项目中都拥有明显的性能优势。虽然X1950XTX采用了高速的GDDR4显存,但面对高效能的7950GX2还是无能为力。不过我们可以欣喜的看出,高分辨率和打开AA的情况下,X1950XTX与7950GX2的性能差距已经很小了!
组建双卡之后,7950GX2风光不再,Quad SLI四核心在多数游戏中的性能损失都比较大。而CrossFire拥有两颗R580+核心,ATI双卡技术也比较成熟,效能出色,所以在单卡模式下就有较好表现的X1950XTX组建交火之后成功反超7950GX2 Quad SLI,性能表现令人非常满意!
● 性能测试总结:
通过以上多个游戏及综合测试我们可以发现,新发布的X1950XTX的确没有辜负ATI寄以的厚望,两款旗舰显卡性能争霸战中几乎打成平手,在不同分辨率下互有胜负。
首先,在单卡较量中,单卡双核心构造的7950GX2在绝大多数分辨率下占有绝对优势,毕竟SLI和1GB显存的威力不可小视。从另一个侧面也反应出NVIDIA对显卡成本控制已是的驾轻就熟;不过,单核心的X1950XTX在2560×1600高分辨率下也体现出极大的优势——高分辨率下性能损失很小,而且AA性能强悍!
虽然单卡不敌7950GX2,但X1950XTX交火与7950GX2 Quad SLI形势立刻发生逆转。原本强势的7950GX2组建Quad SLI之后,四颗核心的效能大幅下降。Quad SLI技术虽已发布近半年,但NVIDIA依然没有很好的解决驱动支持和效能优化,于是日渐成熟的CrossFire显现出很强的实力,在绝大多数项目中都能击败Quad SLI。可以说,对于追求极端性能的玩家来说,双卡的X1950XTX CrossFire是目前3D性能最强的解决方案!
● Quad SLI革命尚未成功,驱动还需努力!
7950GX2的强大是有目共睹的,而支配7950GX2的正是成熟而且深入人心的SLI技术!Quad SLI虽然已经正式发布,但是效能问题依然没能很好的解决,很多情况下四核心其实只发挥出了双核心的性能。
高分辨率下Quad SLI效率会比较高,性能有一定的提升,但此时Quad SLI遇到的对手是专为高分辨率优化过的R580+核心,X1950XTX单卡就在极限模式下表现出了优异的成绩,CrossFire的性能自然不会低。
不过7950GX2 Quad SLI拥有较大的潜力,就看NVIDIA何时将它完全释放出来,这就要依赖于NV的驱动编写团队了。
● X1950XTX的优势:
通过测试,我们总结出了ATI新旗舰级显卡X1950XTX的一些优势:
1. 3999元的上市价格非常厚道,要知道X1950XTX的成本比X1900XTX增加不少,X1950XTX的低价上市和X1900XT平价让路销售让高端显卡不再高高在上!
2. 全新的散热器温度控制出色、噪音小,而且可辅助机箱散热
3. 日后会有更多的游戏HDR+AA技术,采用GDDR4显存的X1950XTX显然拥有更强的HDR+AA效能,因为HDR和AA是两个非常消耗显存的特效;
4. 高分辨率性能损失小,AA性能强,新游戏中有优势;
5. X1950XTX CrossFire的性能强大,而且效能稳定,搭配30寸液晶显示器是完美优异游戏平台!<