泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

完美DX10!ATI新王者HD2900XT权威评测

● 第二章/第二节/第三小节:ATI的第一代统一渲染架构:XENOS

    这一节,我们主要回顾下ATI第一代统一渲染架构:用于XBOX360的XENOS的图形核心。

{imageTitle}
 
XBOX360

    ATI从2003年9月与MICROSOFT签订协议,为新一代游戏主机XBOX360开发图形核心,由此开始,ATI正式着手研发第一代基于统一渲染架构的图形核心:XENOS。XENOS(研发代号C1)的研制工作于2005年底结束,也成为世界上第一个的统一渲染架构的图形核心

    Xenos一共由两个图形运算核心构成,主内核拥有2亿3200万晶体管,核心频率为500MHz,拥有48个Unified Shader。Daughter Die附内核拥有1亿晶体管,由NEC 90nm工艺制造,负责处理所有采样运算,包括色彩读写、混合,多重采样AA,Z轴运算等。

{imageTitle}
 
Xenos核心

Xenos核心的特点如下:

(1)是世界上首个基于统一渲染架构的图形核心,可以支持更加优化、效率更高的图形算法。
(2)具有硬件线程分派单元,可以充分提高shader单元的利用效率,配合unified shaders使核心的Shader负载更加平衡。
(3)具有智能的内嵌式存储器,可以提供高到320M/S的带宽,具有专门的逻辑控制单元以及加速反锯齿、 alpha blending等操作。
(4)可以和把数据直接读取或写入到CPU的缓存,更加高效的处理流式指令。
(5)Xenos有自己专门的编译器。

{imageTitle}

 点击查看大图

● Xenos的统一渲染架构:

{imageTitle}
 
Xenos的渲染架构

    统一渲染架构,从硬件的角度来说,就是指不再有Vertex、Pixel Shader单元的划分,显示核心不再为Shader类型不同而配置不同类型的Shader单元,在统一渲染架构中这两种Shader单元被统一为Unified Shader,所有的Unified Shader单元都可根据需要需要进行处理,不管和是Pixel Shader类型还是Vertex Shader类型。

{imageTitle}
 
Xenos架构图

    Xenos具备48个“4D+1D”(矢量+标量)的Unified Shader,其ALU单元为SIMD结构,每16个着色单元被合并为一个着色矩阵,调配哪几组Shader单元负责处理何种指令或者进行什么类型的计算,则由一个被称为thread arbiter(线程仲裁器)的部分来控制。不过,在Xenos中每个矩阵内部同一周期内只能执行同一类别的指令,要么Pixel Shader要么是Vertex Shader,虽然不太灵活,但还是实现了统一着色架构,大大提高了Shader单元的负载平衡。

{imageTitle}    {imageTitle}
 
shader array

    Xenos具备三组线程控制器,最大可以支持64个并行的线程,可以充分提高shader单元的利用效率,有效掩盖了着色管线的延迟问题。其统一渲染架构具备三组渲染单元(每个渲染单元具备16个Shader单元,总共具备16x3=48个Shader单元),也就是说每一组渲染单元都将具有一组独立的线程控制器,而更多的仲裁器显然可以更加优化Shader指令的分派,根据ATI的测试表明,在通用图形计算中,Xenos的shader array可以达到95%的利用率。

{imageTitle}    {imageTitle}
 
 Geometry Tessellation Uni

    虽然没有引入Geometry Shader,但是Xenos中增加了一个Geometry Tessellation Unit镶嵌处理单元,可以对输入的三角形,矩形、正方形进行分割处理。不过,Xenos的Tessellation单元为固定功能的单元,不具有可编程性,也可看作是Geometry Shader的一个雏形,而Tessellation后来也成为DirectX 10中引入的Geometry Shader的功能之一。由于没有Geometry Shader,Xenos自身并不能生成多边形。不过Xenos中的MEMEXPORT、CPU streaming 技术可以实现类似于DirectX 10中的stream-out功能,所以,Xenos可以把数据发送给CPU的cache,然后通过复用实现生成多边形的目的。值得一提是MEMEXPORT可以直接和系统存储器交换向量数据,它的引入也提高了Xenos的通用计算性能以及可编程性(即扩展了shader program 的长度)。

{imageTitle}

    同时,Xenos的数据流控制效率更高,ATI还为vertex、pixel计算引入了统一指令集,可以更快速的执行一些复杂的图形算法,如高次表面和全局照明等等。

{imageTitle}
 
纹理拾取单元

    Xenos还拥有16个纹理拾取单元(过滤纹理单元,带LOD)和16个顶点拾取单元(无过滤/点取样单元)。如果需要还可以增加若干的附属纹理处理单元。所有这些元件都是由纹理处理阵列控制,且每一个纹理单元都有自己的纹理地址处理器。每一个过滤纹理单元都具备双线性取样能力,并可以支持三线性或更高的排列过滤技术(如Anisotropic Filtering,各向异性过滤)。由于XBOX36O采用了是UMA控制器类型,因此整个RAM系统都将支持纹理取样。为了弥补10MB eDRAM在进行反锯齿的时候容量不足的问题,Xenos以Tile Rendering 的方式来实现 FSAA。 此外,Xenos也支持Multiple Render Targets (多目标渲染)、Hierarchical Stencil Buffer(层次模板缓冲)、Alpha-to-Mask等主流技术。
 

{imageTitle}

0人已赞
第1页:完美DX10!ATI新王者HD2900XT权威评测第2页:完美DX10!ATI HD2000系列评测提纲第3页:2007显卡年!AMD/NVIDIA决战图形市场第4页:奋起直追!全新Radeon HD 2000产品线解析第5页:功能化发展!Radeon HD2000系列亮点逐个看第6页:第二章:统一渲染架构解析第7页:第二章/第二节:革命!R600的统一渲染架构第8页:4第9页:第三章:DirectX发展回顾以及DirectX10详细介绍第10页:第二节 DX10的架构特性 以及带来的好处第11页:第三章/第三节:ATI 3Dc功能回顾第12页:3第13页:3第14页:3第15页:3第16页:集众家之长,R600架构总览第17页:R600架构分块介绍第18页:Setup Engine(装配引擎)第19页:Ultra-Threaded Dispatch Processor(超线程分配处理器)第20页:Stream Processing Units(流处理器)第21页:R600的超标量SIMD架构第22页:4第23页:5第24页:ATI片内缓存相关技术第25页:Memory Control(显存控制器)第26页:第六章 R600的神工鬼斧——Tessellation技术第27页:第六章\\第二节 传统的虚拟3D技术回顾第28页:第二小节 凹凸贴图 Bump mapping第29页:第六章\\第二节\\第三小节 法线贴图(normal mapping)第30页:视差贴图技术parallax occlusion mapping第31页:位移贴图(displacement mapping)第32页:Ati的独门秘籍 Trumform 第33页:Tessellation技术第34页:神奇的小数点——细分网格算法中小数位的意义第35页:Tessellation效率的源泉——控制“笼子”第36页:Tessellation技术的流程第37页:Tessellation技术的应用和前景第38页:1第39页:AA发展第40页:CFAA第41页:123第42页:ATI显卡产品形象代言人——Ruby四度出击第43页:X800 & X850 Ruby第44页:DX9C的最高境界 X1800 Ruby第45页:R600 DX10 Ruby高清晰截图赏析第46页:R600 DX10 Ruby引擎和技术解析第47页:23第48页:R600 DX10 Ruby所用图形引擎揭秘第49页:1第50页:2第51页:第九章\\第二节第52页:庞大的运算资源,R600单卡就能物理加速第53页:3第54页:第四章:AMD高清视频功能解析第55页:22第56页:第三节 硬件视频加速第57页:第四节 UVD 引擎解码流程第58页:第五节 UVD测试第59页:第一节 电脑音频的数码之路第60页:第二节 HDMI数字音频技术背景第61页:第三节 各种显卡HDMI接口方案第62页:第四节 R600系列方案第63页:第五节:实战R600音频播放第64页:第六节 HD 2900XT怎么用?第65页:显卡介绍第66页:123123第67页:显卡介绍第68页:123第69页:显卡介绍第70页:3第71页:123123第72页:测试系统配置和设置第73页:阿苏大发送颠覆第74页:113123第75页:4第76页:05第77页:06第78页:游戏第79页:游戏第80页:123第81页:6第82页:6第83页:交火第84页:功耗测试第85页:1第86页:第二节 客观,公正,专业,全面,泡泡网为您带来最权威的DX10测试第87页:第三节 Call of Juarez游戏DX10测试 第88页:第四节 DirectX SDK测试(微软官方2007年四月版)第89页:第四小节:Draw Predicated第90页:第七小节:MotionBlur10第91页:第十小节:Skining 10第92页:第十四章 总结 另觅蓝海!AMD让ATI看得更远第93页:123

关注我们

泡泡网

手机扫码关注