800SP怒吼!RV770核心HD4850全面评测
第二章/第三节 从R600到RV670,核心架构基本没有变化
ATI和NVIDIA的上代显卡中,RV670和G92核心都是非常成功的,而且都衍生出了一大批产品,都将产品型号向前推进了一代。但非常遗憾的是,RV670/G92与第一代DX10显卡R600/G80在核心架构上面几乎没有什么改进,这就让人给人一种换汤不换药的感觉。
● R600和RV670核心架构图:
● R600/RV670的架构可以拆分为以下几个模块:
Command Processor(指令处理器):负责从PCI-E总线收发指令,协调CPU与GPU的工作
Setup Engine(装配引擎):负责给流处理器将要执行的指令准备数据
Ultra-Threaded Dispatch Processor(超线程分配处理器):负责将各种组合形式的指令分类打包,然后交给流处理器处理
Stream Processing Units(流处理器):像素、顶点、几何运算中心
Texture Units(纹理单元及缓存)
Cache & Buffer(缓存及缓冲区)
Shader Export & Render Back-Ends(像素输出部分)
Memory Control(显存控制器)
● R600/RV670核心规格分析:
4组SIMD阵列,每组SIMD包括16个Shader,每个Shader包括5个流处理器R600/RV670总流处理器数量就是:4×16×5=320个
R600/RV670拥有4个这样的纹理单元
R600/RV670拥有4个纹理单元阵列(4×4结构),每个纹理单元内部包含了8个纹理寻址单元(黄色,共32个),20个32位浮点纹理采样单元(橘黄色,共80个),和4个纹理过滤单元(深红色,共16个),因此通常我们说R600/RV670拥有16个纹理单元。
R600/RV670拥有4个Shader Export & Render Back-Ends
AMD的Render Back-Ends就相当于NVIDIA的ROPs,都是负责像素输出及抗锯齿等后期处理任务,也是4×4架构,因此通常认为R600/RV670和G92一样包括16个ROPs。R600/RV670的每个ROPs可以在一个时钟周期内采样8个Z/模版,而且深度/模版是分开处理的,执行效率更高,这样总共就是32个Z/模板缓冲。