泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

ATI重登性能王座 48管线R580完全测试

    前面介绍过,ATI认为当前纹理单元没有必要继续提高处理能力,而像素渲染更加重要些。那么像素渲染除了本份的工作之外还能进行哪些操作呢?

    ATI此次倾全力打造的R580芯片不但规格先进,而且一改之前跟着微软DirectX亦步亦趋的做法,集成了众多先进的技术和功能,而这些技术可以让ATI在未来的竞争中抢得先机、占尽优势:

  • 让物体运动更加真实:GPU物理加速技术

    随着GPU性能越来越强大,CPU逐渐地成为了渲染速度提高的瓶颈,这已经成为了无可争议的事实!因此GPU越来越强的渲染处理能力已经开始在共享原本属于CPU的工作量,例如在粒子系统、纺织物、流体流动这些物理仿真动作在CPU算不过来时,可以映射到GPU的工作列表中,使用GPU强大的渲染能力来处理。不过,这些从CPU处理列表中转移过来的资源毕竟原理标准的图形绘制范畴,所以更多的渲染处理被用来搭建负载平衡系统,其提高整体的帧渲染速度。

    据之前对R520芯片的测试报告,R520的演示海洋波浪的物理运算能力相当于Intel P4 3.0GHz的3倍以上!因此GPU物理加速已经应用在了多款XBOX360游戏上面,相信今后将会有更多的PC游戏支持GPU物理加速技术,让劳累不堪的CPU解放出来!

  • R580和XBOX360不能不说的故事:
{imageTitle} {imageTitle}
XBOX360及其GPU
 
    当Xenos架构首次被曝光时,人们都认为它与R520的架构非常相似,现在看来Xenos与R580更具血缘关系!Xenos最大的特性就是拥有统一的48个像素渲染单元,这种渲染架构将传统像素渲染管线与顶点处理单元的功能合二为一。
 
{imageTitle}
XBOX360图形芯片Xenos核心架构图
 
    早在DirectX 8.0时代就有传闻:在DirectX 9.X的某个版本或者DirectX 10中,Pixel Shader和Vertex Shader将合二为一,这就是所谓的Combo Shader。DirectX是微软定的标准,现在微软在其XBOX360的Xenos上率先采用了这种架构,ATI与微软走得如此之近(想想第一款DX9.0芯片9700的出现让NV多么难堪)。可以预见,DirectX 10当中没有Combo Shader几乎是不太可能的了。

     虽然整体架构不同,但是通过Xenos可以了解到原来48个像素渲染单元还有这么大的作用,不但能够处理像素、还能处理顶点,更能够分担纹理单元的工作!
 
    实际上程序中的纹理是一个可以加以利用的重要技术技巧,首先可以通过加上相应的约束参数把像素渲染程序用来生成算术的纹理,通过这样来变相的减少用于存储纹理数据的显存容量和带宽;除此之外渲染程序还可以用来添加变化和现有纹理的细节,以此来减少存储于显存中不同纹理模板的数量。这两种运用的技巧虽然过程不同,但都异曲同工,用来降低纹理操作对外界因素的依赖,减少对显存容量和带宽的需求。
  • 让阴影边缘更加真实:阴影渲染加速和Fetch4技术

    大多数阴影渲染效果都有一个局限性,那就是创造出来的通常都是一个轮廓鲜明的硬边线阴影,而在真实世界里,阴影都是软边线的。用技术手法创造软边线阴影通常都要做一些过滤阴影基本图的工作,需要进行巨大数量的样本纹理对照,这对GPU的纹理单元是一个巨大的负担。

{imageTitle}
ATI通过柏特农神庙Demo展示了其软边阴影渲染能力

    动态分歧机制可以利用扫描阴影边缘像素的方法改善阴影绘制的速度,由于阴影的特效表现主要侧重于边线的描绘上,因此通过过滤的方法在提高阴影成像质量的同时大大缩短了成像的时间。

    为了更大的促进这项软边阴影过滤技术,R580集成了一个新的纹理样本过滤器——Fetch4,它由四个组成部分(红绿蓝和透明度)。这些纹理单元被设计成可以从一个纹理地址同时采用和过滤全部四个组成部分,当单一的组成纹理过滤器去查找不同类型的纹理时,Fetch4可以同时用四个值在边线临近的地址去采用,这就能在使用4个样本对照的前提下有效的增加纹理采样的速度。完美的兼顾质量与速度。

{imageTitle}

    如此一来,超线程的快速流控制加上具备快速纹理查找功能的Fetch4技术,R580强大的硬边阴影渲染加速能够生成更加贴近真实的软边阴影。

  • 超高分辨游戏变为可能:增强的HierachicalZ技术

    随着高清晰数字显示技术的成熟与普及,很多玩家开始尝试在1920×1200(WUXGA),2048×1536(QXGA)甚至是2560×1600(WQXGA)等超高分辨率下进行游戏,显然在这些超高分辨率下对显卡的像素渲染、填充速度和显存带宽都会造成沉重的负担。

    ATI显卡都支持一个名为HierachicalZ的技术,这个可以在前面R580核心架构图中看见。这个技术是有针对性的满足席上不同分辨率的需求,他会检测出哪些会在最终成像画面被隐藏的像素点,并在要对他们进行渲染处理前丢弃。不过这一技术的前提是显存容量要足够大,否则HierachicalZ技术将会自动降低画面的渲染品质。

    R580集成了比R520多出50%的HierachicalZ缓存,这样就能确保R580的性能不会在超高分辨率下急剧下降,HierachicalZ技术配合512MB显存控制器,再加上AVIVO显示引擎中的两个完整DVI接口,能够在高分辨率游戏中提供更出色的表现力,让R580的实力彻底发挥出来。

  • 物体表面更加真实:视差映射技术

    视差映射(parallax occlusion mapping)使用一个光线跟踪的样本与正规的映射相结合,能够添加更多水面2D细节、倒影和物体本身的阴影特性等特效处理,主要是利用强大的算术处理能力和动态流控制来增加3D渲染场景的真实性。

{imageTitle}
ATI玩具店Demo,雨天路面动态水流效果非常真实

    视差映射技术使用像素渲染流控制依据视角改变动态的对距离内像素进行反复扫描,从而让物体表面的细节部分更具层次感:

{imageTitle}
与传统“一张纸”似的虚假贴图相比 应用视差映射技术带来的路面层次感非常强烈
 
    虽然视差映射技术是非常实用的,而且视觉效果非常出色,能够广泛应用于周边环境比如墙壁砖块贴图上面。不过3DMark制作小组的人员却认为这种技术并不适合于用在诸如刀刃物体边缘和球体这类物体上面,所以他们认为应用范围比较狭窄。
  • 小结:

    我们非常欣喜地看到R580能够在R520架构的基础上,集成和改进了如此众多而且实用的新功能和新技术。当然ATI所倡导的这些激动人心的技术都是建立在48个像素渲染单元强大性能的基础之上!

    但是当今的主流游戏始终要慢D3D API和GPU硬件半拍,实际上现有的游戏程序只开发出了GPU像素渲染能力的一小部分,很多情况下都可能无法完全发挥出优势来。

    ATI引以为傲的3Dc+纹理压缩技术、少有的HDR+AA、代替CPU而进行的物理加速技术、软边阴影以及视差映射技术等等,如果将这些技术应用起来,R580的速度可以达到R520的两倍以上,而且分辨率越高优势越明显!ATI所展示的玩具店Demo就能充分的反映出这一效果。

    因此R580更加强调的是未来的性能表现,超前的规格虽然在现有软件环境下无法完全发挥出来,但是这些激动人心的特性都可以为下一代的产品拓展出更大的应用范围!只要有游戏采用了其中某项技术,就能够让R580的速度与画质优势发挥出来!

1人已赞

关注我们

泡泡网

手机扫码关注