完美DX10!ATI新王者HD2900XT权威评测
分享
第四章\\第五节 Ultra-Threaded Dispatch Processor(超线程分配处理器)
熟悉A卡的朋友应该知道,从R520核心开始ATI就集成了Ultra-Threaded Dispatch Processor,这就是ATI引以为傲的超线程分配处理器,通过这个特殊的模块来管理庞大的像素渲染单元。如今R600的Thread Processor不仅仅是管理像素单元这么简单了,统一渲染架构的GPU Shader部分需要同时处理像素、顶点、几何等方面的操作,Thread Processor的任务更加艰巨!
我们可以看到,Thread Processor集成了三个指令队列,分别为顶点、几何及像素,这也就是GPU最常见的三种渲染操作,从Setup Engine流出的数据在此汇集排队,并且根据不同的程序动态分配三种Shader的比例,比较常见的情况就是像素>顶点>几何。Shader指令分配完毕就开始等候仲裁器指定相应的单元进行处理。
R600拥有四组Shader阵列,每组阵列各对应2个Arbiter(仲裁器)和2个Sequencer(定序器),通过它们来决定渲染操作由哪部分SIMD Array执行,并且对指令的优先权进行排序。仲裁器能够最小化队列中线程之间的延迟,在最短的时间内找出优先度最高的线程交由空闲的SIMD执行,以此来保证庞大的统一着色单元时时刻刻都处在满负载状态。
某些高优先级的指令可以直接插队立即执行,而低优先级的指令可以被暂时存放在高速缓存之中,等待空闲时机再进行处理。Thread Processor的队列中能够同时保存数百条指令,这样不但可以让SIMD处于饱和状态,而且指令之间的延迟也被降至最低,Thread Processor一旦发现将要执行的指令数据尚未到位,则会立即替换下一条指令,直至数据重新获得为止。
顶点和纹理指令拥有专门的仲裁器、定序器和缓存,因为他们在执行前必须经过纹理单元进行采样操作。
由于R600统一着色单元架构的特殊性(超标量SIMD架构),每个着色单元包括5个1D标量ALU,因此Thread Processor需要负责将各种组合形式的指令分类打包,最大限度地发挥着色单元的运算能力,与R600的执行效率息息相关!
总的来说,可以把Thread Processor看作是一个大型的联合线程计数器、小线程单元、专门的分歧单元,和一个高性能任务堆栈列表,可以在高速的动态流控制和扩展并行处理间取得最好的平衡。R600的Shader部分就是庞大的SIMD(单指令多数据处理器),而Thread Processor用相对较少的控制器来控制大规模处理器,同时对一组数据中的每一个分别执行相同的操作来实现空间上的并行性,由此来提高统一渲染架构的效率和SIMD的执行效率。这也是R600的能否发挥真正实力的关键所在!
0人已赞
第1页:完美DX10!ATI新王者HD2900XT权威评测第2页:完美DX10!ATI HD2000系列评测提纲第3页:2007显卡年!AMD/NVIDIA决战图形市场第4页:奋起直追!全新Radeon HD 2000产品线解析第5页:功能化发展!Radeon HD2000系列亮点逐个看第6页:第二章:统一渲染架构解析第7页:第二章/第二节:革命!R600的统一渲染架构第8页:4第9页:第三章:DirectX发展回顾以及DirectX10详细介绍第10页:第二节 DX10的架构特性 以及带来的好处第11页:第三章/第三节:ATI 3Dc功能回顾第12页:3第13页:3第14页:3第15页:3第16页:集众家之长,R600架构总览第17页:R600架构分块介绍第18页:Setup Engine(装配引擎)第19页:Ultra-Threaded Dispatch Processor(超线程分配处理器)第20页:Stream Processing Units(流处理器)第21页:R600的超标量SIMD架构第22页:4第23页:5第24页:ATI片内缓存相关技术第25页:Memory Control(显存控制器)第26页:第六章 R600的神工鬼斧——Tessellation技术第27页:第六章\\第二节 传统的虚拟3D技术回顾第28页:第二小节 凹凸贴图 Bump mapping第29页:第六章\\第二节\\第三小节 法线贴图(normal mapping)第30页:视差贴图技术parallax occlusion mapping第31页:位移贴图(displacement mapping)第32页:Ati的独门秘籍 Trumform 第33页:Tessellation技术第34页:神奇的小数点——细分网格算法中小数位的意义第35页:Tessellation效率的源泉——控制“笼子”第36页:Tessellation技术的流程第37页:Tessellation技术的应用和前景第38页:1第39页:AA发展第40页:CFAA第41页:123第42页:ATI显卡产品形象代言人——Ruby四度出击第43页:X800 & X850 Ruby第44页:DX9C的最高境界 X1800 Ruby第45页:R600 DX10 Ruby高清晰截图赏析第46页:R600 DX10 Ruby引擎和技术解析第47页:23第48页:R600 DX10 Ruby所用图形引擎揭秘第49页:1第50页:2第51页:第九章\\第二节第52页:庞大的运算资源,R600单卡就能物理加速第53页:3第54页:第四章:AMD高清视频功能解析第55页:22第56页:第三节 硬件视频加速第57页:第四节 UVD 引擎解码流程第58页:第五节 UVD测试第59页:第一节 电脑音频的数码之路第60页:第二节 HDMI数字音频技术背景第61页:第三节 各种显卡HDMI接口方案第62页:第四节 R600系列方案第63页:第五节:实战R600音频播放第64页:第六节 HD 2900XT怎么用?第65页:显卡介绍第66页:123123第67页:显卡介绍第68页:123第69页:显卡介绍第70页:3第71页:123123第72页:测试系统配置和设置第73页:阿苏大发送颠覆第74页:113123第75页:4第76页:05第77页:06第78页:游戏第79页:游戏第80页:123第81页:6第82页:6第83页:交火第84页:功耗测试第85页:1第86页:第二节 客观,公正,专业,全面,泡泡网为您带来最权威的DX10测试第87页:第三节 Call of Juarez游戏DX10测试 第88页:第四节 DirectX SDK测试(微软官方2007年四月版)第89页:第四小节:Draw Predicated第90页:第七小节:MotionBlur10第91页:第十小节:Skining 10第92页:第十四章 总结 另觅蓝海!AMD让ATI看得更远第93页:123