泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

三年架构大革命!R520脱胎换骨全测试

  当3D模型的数据按照用户的视角转换成为了屏幕上的像素的信息之后,现在就需要进行最重要的操作了,这也是图形处理中最关键,性能消耗更大的部分。

  这个时候的像素信息,是不完全的像素信息,只知道这个像素是属于哪个三角形的,还有很多方面是没有确定的:

  这个三角形上贴的图是什么?这个三角形收到那些光源的照射?这个顶点是否在三角形的边缘,会不会在抗锯齿操作中被处理?等等

  所以整个像素渲染引擎是整个3D图形生成过程中最麻烦的一个操作过程,也是对性能要求最大的一个部分。

  ATI在这次R520上特别增加了一个被称之为“Ultra—Thearding Dispatch Processor”的部件,这个单元负责将线程分派给下面的像素渲染管线。

  我们知道,对于一个画面,是有很多数据需要处理的,而这些数据几乎都是平等的,像素之间,或者顶点之间。于是我们的每个图形芯片都需要能够同时执行这些操作,也就是并行运算。

  但是现在出现了一个矛盾:一方面为了要求并行计算,很多像素要求同时进行操作,将画面分成一个个小块来处理将能够很明显的提高效率,但是如果一个块中的像素需要进行不同的操作,那么将适得其反。

  另一方面,如果将每个像素作为最小的单位进行处理,那么出现问题的可能就没有了,但是这样效率将会很低,因为不同的像素的处理要求是不同的,简单的处理的快,复杂的处理的慢。

  ATI的Ultra—Thearding Dispatch Processor便是用来解决这个问题的,首先,我们可以将每一个像素的处理过程理解成为一个“线程”,那么这个Ultra—Thearding Dispatch Processor的功能就是分配这些线程的执行。它可以动态检测到每个像素渲染单元的工作情况,避免了空闲的情况存在。

  借助于这个单元,R520可以同时处理多达512个线程,这样就可以大大的提高效率,这也是R520只有16个像素渲染管线同样能够表现得如此好的原因了。

  如果要理解这个概念,我们就必须先理解“粒度”这个概念,粒度就像是砂子的颗粒的大小,过小会数目增多而影响速度,过大而会导致冲突增多浪费资源。

  R520同时处理的像素块的大小是16像素,也就是4*4像素的一个方块,这个数据相对于G70来讲要小一些。

  我们来看一个例子:

R520

  我们看到,我们现在要进行的是一个阴影处理的情况,一共分为三种可能,一种是在阴影中,一种是不在阴影中,还有一种就是处在阴影的边缘。

R520
 
  三种情况分别要使用不同的操作来执行,我们来看看不同的“粒度”带来的不同效果:
 
  当粒度为4*4(16像素)时:
 
R520
 
  我们看到大部分的块操作都是有效的,所以这样的情况是效率比较高的。
 
  当粒度为16*16(256像素)时:
 
R520
 
  这样的情况中,红色的方块的面积就更大了,这些块中拥有两种不同的像素需要处理,所以这种分块操作是无效的。
 
  当粒度为64*64(4096像素)的时候:
 
R520
 
  这个时候,我们看到每个块中都同时存在阴影和非阴影,所以这时的块操作就是无效的。
 
  通过上面的例子,我想大家已经理解了粒度的重要性,在R520芯片中,ATI的设计理念是减小粒度的大小。但是,我们知道,粒度小了,需要执行的线程就多了,这是一个矛盾,那么ATI如何去提高性能的呢?
 
  关键就在于前面我们提到的这个独立的Ultra—Thearding Dispatch Processor,这个处理器能够和像素渲染管线同时运行,将这些很小很多的线程分配给不同的单元。
 
  我们再来看一个例子:
 

  我们看到,由于分支处理的操作能够和线程的操作并行进行,所以节省了操作需要进行的时间。原来需要20个流程周期完成的任务只需要14个就可以完成了。

0人已赞
第1页:单卡也破3DMark世界记录!全球最强显卡诞生第2页:发布之路多坎坷!R520性能测试遭遇伪造风波第3页:POP独家揭密:R520延期只因核心Bug并非良率第4页:抛弃管线论概念! R520全新架构之六大看点第5页:全面支持SM3.0!R520顶点渲染引擎大解析第6页:效率、性能!R520超线程分支控制器应用详解第7页:重点技术解析:首创双环形内存总线架构第8页:画质改进明显!自适应抗锯齿、AA+HDR不冲突第9页:X1000系列家族展示:ATI新老高端卡全汇集第10页:ATI最强者!Raeon X1800XT完全解析第11页:目标锁定78GT!蓝宝X1800XL零售版全面曝光第12页:装备1.2ns显存!ATI X1600XT上演高频风暴第13页:全面接替X550系列!中低端X1300Pro正式亮相第14页:测试平台及测试项目说明:最新游戏大作加入第15页:基准性能测试:3DMark03 、3DMark05第16页:OpenGL/D3D经典游戏测试:DOOM3、HalfLife 2第17页:经典游戏性能测试:FarCry 1.33、Halo第18页:经典游戏性能测试:Slinter Cell:Chaos Theory第19页:最新游戏性能测试:Age of  Epires 3(帝国时代3)第20页:最新游戏性能测试:F.E.A.R(极度恐惧)第21页:最新游戏性能测试:Serious Sam 2(英雄萨姆2)第22页:最新游戏性能测试:Call of Duty 2(使命的召唤2)第23页:《使命的召唤2》测试花絮!测试方法大揭密第24页:新起点,新征程!ATI未来之路更精彩

关注我们

泡泡网

手机扫码关注