泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

开创DX11宏图霸业!镭HD5870权威评测

第五章/第三节 RV870核心控制引擎

    R870的图形架构可以拆分为以下几个模块,一个一个来看都有什么改进:

  • Command Processor(指令处理器)
  • Graphics Engine(图形装配引擎)
  • Ultra-Threaded Dispatch Processor(超线程分配处理器)
  • Stream Processing Units(流处理器)
  • Texture Units(纹理单元)
  • Cache & Buffer(缓存及缓冲区)
  • Shader Export & Render Back-Ends(像素输出部分)
  • Memory Control(显存控制器)
  • Display Controllers(输出接口控制器)

Command Processor(指令处理器)

    Command Processor负责从PCI-E总线发出或者接受指令流,让GPU在驱动程序给定的时间间隔中完成恒定数据流操作,此过程需要通过Parallel DMA Engine,调用系统内存或者是本地显存的相关资源。

● Graphics Engine(图形装配引擎)

    之前这个模块被称为Setup Engine,是GPU负责指令分配和安装的模块,主要负责给GPU内部各大模块将要执行的指令准备数据,我们将其称之为装配引擎。装配引擎之中有很多模块,包括Tessellator(镶嵌器)、Vertex Assembler(顶点装配器)、Geometry Assembler(几何装配器)、Rasterizer(光栅器)、Hierarchial-Z(多级Z缓冲模块)等。

    RV870相比RV770,最主要的变化就是拥有两个光栅器和多级Z缓冲模块,而此前的GPU都只有一个。这可不是因为RV870本身是“双核”的关系,因为顶点装配器和几何装备器都只有一个。

    装配过程:顶点数据装配完毕后,顶点三角形内插操作不再使用独立的硬件单元,而是交由流处理器处理,由DX11中新增的外壳着色器和域着色器替代,这两个着色器将辅助镶嵌器进行细分操作,生成新的顶点。

    接下来三角形顶点的2D坐标信息经过Rasterizer(光栅器)之后就得到了像素信息,也就是得到了屏幕上每个点的数据信息。进行这部分操作的时候也经过扫面转换生成了每个点的Z轴信息,这些信息将被传输到Z轴缓冲之中,以备后用。

    现在我们就可以理解为什么RV870要设计两个光栅器和多级Z缓冲模块了,因为DX11 Tessellator的关系,最终的模型将变得十分复杂,需要处理的指令数量很多,合理的分配任务并暂存数据很关键。RV870改进了连续存取缓存时的性能。

    Hierarchical Z是一项非常智能的技术,在GPU完成坐标转换之后,Hierarchical Z会不断对比各个顶点的Z轴位置,一旦Hierarchical Z发现这个顶点不需要显示,将会直接将其剔除避免后续无效渲染,它将有效控制由Tessellator所带来的性能损失。

    即便是在DX9或DX10应用中,双倍的Rasterizer和Hierarchical Z也能大幅提升GPU在高分辨率和多屏超高分辨率下的性能表现。

 Ultra-Threaded Dispatch Processor(超线程分配处理器)

    最后,所有的像素/顶点/几何/纹理/颜色等数据经过Interpolators(排序器)之后交给Shader进行处理,当然在此之前还有一项必备的工序,那就是数据的重新封装打包,以及指定相应的统一渲染单元运算,这部分任务由超线程分配处理器完成。

2人已赞
第1页:DX10大势已去!首款DX11显卡HD5870发布第2页:DX10.0大革命:画面很完美、但速度很慢第3页:DX10.1小修补:片面追求画面行不通第4页:DX11时代来临:为高效率游戏而生第5页:DX11特性解读:Shader Model 5.0第6页:DX11特性解读:多线程处理第7页:DX11特性解读:两种新的纹理压缩格式第8页:DirectCompute与Stream/CUDA/OpenCL的关系第9页:DirectCompute 10/11版本间的区别第10页:DirectCompute 11新特效:顺序无关透明化第11页:DirectCompute 11新特效:景深第12页:DirectCompute 11新特效:高清晰环境光遮蔽第13页:DX11重要技术:Tessellation前身今世解读第14页:2002年R200:Tessellation的鼻祖TruForm第15页:2005年Xenos:Tessellation登陆XBOX360第16页:2007年R600:孤掌难鸣的Tessellation第17页:2009年RV870:纳入DX11修成正果第18页:DX11版Tessellation的改进第19页:DX11版Tessellation在游戏中的应用实例第20页:DX11游戏并不遥远:第4季度发布4款2第21页:DX11游戏:《异形大战铁血战士》第22页:DX11游戏:《科林麦克雷:尘埃2》第23页:DX11游戏:RTS网游《BattleForge》第24页:DX11游戏引擎:《Frostbite Engine 2》第25页:DX11游戏引擎:《Cry Engine 3》第26页:RV870核心架构图及规格全对比第27页:RV870架构解析:竟然是单芯片“双核心”第28页:RV870架构解析:图形控制引擎第29页:RV870架构解析:流处理器规格特性第30页:RV870架构解析:纹理单元和缓存第31页:RV870架构解析:光栅单元和抗锯齿第32页:RV870架构解析:更高频更节能的第三代GDDR5第33页:ATI Eyefinity三屏/六屏显示技术解析第34页:Matrox三屏环幕技术回顾第35页:ATI的惊人设计 RV870最多支持六屏输出第36页:灵活多变的三屏六屏输出方案一览第37页:三屏/六屏输出玩游戏震撼效果展示第38页:编辑实战HD5870三屏玩游戏实拍图第39页:HD5870三屏/六屏实际应用视频展示第40页:HD5870显卡赏析:AMD官方高清晰美图第41页:HD5870显卡实物:外观赏析第42页:HD5870显卡实物:最轻的高端卡第43页:HD5870显卡拆解:40nm核心与GDDR5显存第44页:HD5870显卡供电:数字式4+1+2相第45页:测试平台:Core i7 975 + X58最强配置第46页:DX9C理论性能测试:3DMark06第47页:DX10理论性能测试:3DMark Vantage第48页:DX10渲染性能测试:填充率和贴图第49页:DX10游戏:《孤岛危机:弹头》第50页:DX10游戏:《冲突世界:苏联进攻》第51页:DX10游戏:《生化危机5》第52页:DX10.1游戏:《汤姆克兰西之鹰击长空》第53页:DX10.1游戏:《潜行者:晴空》第54页:DX10.1游戏:《孤岛惊魂2》第55页:DX9C游戏:《街头霸王4》第56页:DX9C游戏:《极品飞车13:变速》第57页:DX9C物理游戏:《镜之边缘》第58页:OpenGL游戏:《敌占区:雷神战争》第59页:功耗测试:HD5870耗电最少性能最强第60页:测试成绩汇总:HD5870 PK GTX285第61页:测试成绩汇总:HD5870 PK HD4870X2第62页:测试成绩汇总:HD5870 PK GTX295第63页:双卡战四核:HD5870 CF对决GTX295 SLI第64页:编辑测试手记:相当完美的高端卡第65页:全文总结与展望:敢为人先勇于创新的ATI

关注我们

泡泡网

手机扫码关注