HD7970脱胎换骨全测试!5年架构大革命
第二章/第十五节 Tihiti其他方面的改进:AMD真是个激进派
最核心的流处理器和缓存部分介绍完毕,剩下的功能模块就简单了:
AMD头一次使用384bit显存控制器
我们先来回顾一下显存控制器的发展史:
NVIDIA:G80(384bit)-G92(256bit)-GT200(512bit)-GF100(384bit)
AMD:R600(512bit)-RV670(256bit)-RV770(256bit)-Cypress(256bit)-Cayman(256bit)
NVIDIA使用过两次384bit显存控制器,而AMD自R600 512bit兵败之后一直坚守256bit的设计,这次Tahiti是头一次使用384bit这种折衷的位宽。
AMD作为GDDR5显存标准的制定者之一,对于显存特性吃得比较透,因此同样的显存颗粒,A卡的显存频率一直都远高于N卡。此次AMD在位宽上追平NVIDIA,再加上更高的频率,显存带宽达到了264GB/s,基本上不会有什么瓶颈了。
光栅单元数量不变
Tahiti配备了32个ROPs,数量与Cayman,每个周期能完成32个色彩处理和128个Z/Stencil 处理,不过得益于有更高的显存带宽,在实际游戏中的性能要比理论值一样的Cayman快50%,比如抗锯齿方面。
● 率先支持DX11.1 API
AMD一直都是激进派,凭借与微软的深度合作,自DX10以后AMD总是能够第一时间发布支持最新API的显卡,DX10.1/DX11还有现在的DX11都是如此。关于DX11.1的改进细节,下文有专门章节陈述。
● PCI-E 3.0总线解析
PCI-E 3.0规范将数据传输率提升到8GHz|8GT/s(最初也预想过10GHz),并保持了对PCI-E 2.x/1.x的向下兼容,继续支持2.5GHz、5GHz信号机制。基于此,PCI-E 3.0架构单信道(x1)单向带宽即可接近1GB/s,十六信道(x16)双向带宽更是可达32GB/s。
PCI-E 3.0同时还特别增加了128b/130b解码机制,可以确保几乎100%的传输效率,相比此前版本的8b/10b机制提升了25%,从而促成了传输带宽的翻番,延续了PCI-E规范的一贯传统。
新规范在信号和软件层的其他增强之处还有数据复用指示、原子操作、动态电源调整机制、延迟容许报告、宽松传输排序、基地址寄存器(BAR)大小调整、I/O页面错误等等,从而全方位提升平台效率、软件模型弹性、架构伸缩性。
至于PCI-E 3.0总线的意义,现在看来有些超前。目前只有Intel的X79+i7-3960X平台才会提供PCI-E3.0支持。根据经验和测试,PCI-E 3.0翻倍的带宽并不会给显卡带来性能提升,其主要意义还是进一步对于多卡的支持。试想,如果PCI-E 3.0 X4都可以满足HD7970的需求的话,那么现有的Z68(搭配IvyBridge处理器)就不会限制多路交火的性能表现,而X79插8块(如果主板有这么多插槽的话)HD7970做并行计算也不会因为接口带宽而产生性能瓶颈。