低噪音缔造者!HIS 7870冰酷显卡测试
分享
南方群岛除了工艺从40nm更新到28nm以外,最重大的改变就是采用了全新的GCN架构了。关于GCN架构想必大家在HD7970首发评测中已经有所了解,所以本文只做简单介绍。
AMD历代GPU的瓶颈除了曲面细分以外,其实最重要的是5D/4D VLIW架构的效率问题。这一痼疾在南方群岛身上终于得以根除,它的流处理器结构已经面目全非了。
通过Pitcairn的整体架构图我们看到,传统的SIMD流处理器阵列消失了,取而代之的是GCN阵列,Pitcairn总计拥有1280个流处理器,现在来看看GCN阵列的微观结构。
GCN阵列微观结构
GCN阵列里有4组SIMD单元,每组SIMD单元里面包括16个流处理器、或者说是标量运算器。GCN架构已经完全抛弃了此前5D/4D流处理器VLIW超长指令架构的限制,不存在5D/4D指令打包-派发-解包的问题,所有流处理器以16个为一组SIMD阵列完成指令调度。简单来说,以往是指令集并行,而现在是线程级并行。
GF100的SM(流处理器簇)微观结构
可以这么理解,一个GCN阵列与GF100当中的一组SM相当,GF100的一组SM当中有4组共计32个流处理器,而Tahiti的一组GCN当中有4组共计64个流处理器。
● 更多的线程调度
从线程级别来看,GCN与SM是不可分割的最小单元,GCN一次可以执行64个线程,而SM是48个(其实就是流处理器的数量)。
从多线程执行上来看,GCN可以同时执行4个硬件线程,而SM是双线程调度器的设计(参见架构图)。如此来看,GCN架构的多线程性能会更好一些。
0人已赞