泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

全面超越!蓝宝新HD6950 尘埃3版测试

  合理的目标与顺利的执行是一款优秀的产品的必要条件。在Cayman Radeon HD 6900系列身上,AMD寄予厚望:高效的图形与计算架构、强大的几何性能、新的画质技术、新的能效与功耗管理是该核心的设计期望。

    为了实现高效的图形与计算架构,AMD该用了重新定义的VLIW4架构,同时还引入了双图形引擎、更多SIMD引擎与纹理单元、升级的渲染后端、更高的显存带宽、新的GPU计算技术。

  VLIW全称为Very Long Instruction Word,意思是超常指令字架构,是一种非常长的指令组合,通过把许多条指令连在一起来增加运算的速度。从第一代DX10 R600内核开始,AMD就一直使用VLIW5方式,又称5D式,也就是五个流处理器编为一组,但并非所有流处理器都是相同的,其中四个较小、较简单,另一个较大、较复杂做为特殊单元。这种架构设计在硬件方面看有着很高的效率和很深的潜力,但是结构比较复杂,对应的软件编程就很困难,始终难以真正发挥全部实力。

HD6950

HD5870所采用的VLIW5结构图

HD6950

6950的VLIW4结构图

  如今AMD终于在内核层面翻新为VLIW4方式(4D式),每个编组由四个流处理器、一个分支单元、一个通用目的寄存器组成,其中四个流处理器的整数、浮点执行功能完全相同(不再有T-Unit),可以执行四路并行发射,但是特殊功能占据四个发射位中的三个。

  AMD宣称,VLIW4架构有着更好的利用率,能将性能与核心面积比提高10%,简化调度与寄存器管理,逻辑核心也可以很好地重复使用。注意HD6800甚至HD7000的中低端产品依然延续VLIW5架构,AMD没有必要为了宣传高端产品而损害真正决定出货量和毛利率的中低端市场利益,所以这个数据可信度较高。

HD6950

  渲染器后端也进行了升级,支持写入操作合并,16位整数操作提速两倍,32位浮点操作也快了两到四倍。

  GPU并行计算方面,新内核最大的亮点就是增加了一个全局异步寄存器,从而支持异步分配,可以同时执行多个计算内核,每个内核都有自己的命令队列与受保护虚拟寻址域。此外还有两个双向DMA引擎(更快的系统内存读写速度)、着色器读取操作合并、LDS(本地数据存储)直接预取、流控制改进、更快双精度操作(单精度的1/5提高到1/4)。

0人已赞

关注我们

泡泡网

手机扫码关注