泡泡网显卡频道 PCPOP首页      /      显卡     /      新闻    /    正文

长达492页!AMD已公布HD6900 PDF文档

    泡泡网显卡频道2月11日 AMD目前发布了一份长达492页PDF文档,这份文档详尽解释了Radeon HD 6900在指令集架构的各种特性,其中包括核心内部的编程管理与状态、控制编码、ALC子句、纹理缓存子句、内存读取子句、数据共享操作、微代码格式等各种细节,这份文档可以称得上是给技术开发人员的一份大礼。

长达492页!AMD已公布HD6900 PDF文档

HD6900完全评测

    从HD6900的线程处理器结构图,我们可以看到结构中红色的流处理器部分从之前的5个变成了4个,这就是这里所说的VLIW4,即4D架构。虽然每个线程处理器内仅仅是少了一个流处理器,但这对于沿用多年5D架构来说,已经是重大的升级了。因此此次AMD发布PDF文档的目的就是能够使开发者更加深入利用新架构的特性。

● 下载地址:HD6900官方PDF文档

    自从DX10时代以来,ATI在架构上就一直没有太大的变化,即使到了DX11时代的HD5000/HD6000系列产品上,其核心架构仍然延续了当年R600的设计。当然,虽然整体架构没有太大变化,但每一代产品都对细节进行了改进,以满足游戏对显卡性能越来越苛刻的需求。

HD6900完全评测

HD6970/HD6950核心架构图

    这一次发布的HD6900系列从整体架构上来说也没有什么变化,和之前的几代产品都差不多。不过在一些细节的改进上,采用Cayman核心的HD6900可以说是改进最多的一款产品,最大的改进之一就是抛弃了沿用数年的VLIW5架构(俗称5D),而采用了VLIW4架构。

    其实之前就有传闻HD6800系列就会采用VLIW4架构,但等到产品发布之后我们并没有看到有这样的改变。反而,HD6800系列产品在核心整体的规格方面还相对HD5000系列有一定程度的降低,所以HD6800系列产品也被称为“半代升级”产品,虽然架构上有很多细节的改进,但在部分传统游戏中的性能相反还不如HD5000系列的高端产品,最大的提升仅仅是DX11中的 Tesselation 执行效率。

HD6900完全评测

    我们始终没有想到AMD会将大量的改进应用到HD6900系列产品上来,因为按照AMD的风格,一旦产品有较大的改进,必然会对产品的总型号数字提升一个等级,比如HD4000到HD5000,HD5000到HD6000。然而,这次发布的HD6900虽然从型号上来说看起来像是HD6800系列的升级版,但在架构上的改进以及性能方面的提升都是巨大的,甚至可以说是空前的。

    之前产品所采用的VLIW5架构线程处理器中,5个超标量ALU每个都拥有不同的功能。而在HD6900系列产品上,所有的ALU都拥有同样的功能、同样的能力和同样的执行效率。它们在单位时钟内的处理能力分别如下图所示:

HD6900完全评测

    那么,很多人可能会问,之前执行超越指令的那个稍“胖”的ALU没有了,怎么办呢?很简单,由于改进的VLIW4架构中的每一个ALU都不再有具体的功能分别,所以它们可以以类似于通用计算的方式分配到所有的ALU。

● VLIW4架构线程处理器的好处

    AMD官方对这个架构的改变是这样解释的:虽然在许多情况下VLIW5达到良好的利用,但是平均来说,我们不能让所有5个单元都处于忙碌状态。 3至4个单元处理忙碌状态较为典型。现在把单元数量从5降低到4,实际上提升了每渲染管线性能,同时它将我们的ALU/BW比值降低一点,因此它实际上比较接近典型应用的要求。

长达492页!AMD已公布HD6900 PDF文档

    而事实上,4D架构还有更多的优势,比如非对称特性的VLIW5更难编译,借助VLIW4对称特色,编译器有一个更简单的工作方法,可以转化为更优的性能。还有可以提升每平方毫米核心面积的性能,或者降低核心面积。另外调度和寄存器管理还可以实现优化等等。■<

0人已赞

关注我们

泡泡网

手机扫码关注