显卡至尊!双芯旗舰HD7990首发全测试
分享
众所周知,相比HD5000/6000系列,南方群岛除了工艺从40nm更新到28nm以外,最重大的改变就是采用了全新的GCN架构了。关于GCN架构想必大家在HD7970首发评测中已经有所了解,所以本文只做简单介绍。
AMD历代GPU的瓶颈除了曲面细分以外,其实最重要的是5D/4D VLIW架构的效率问题。这一痼疾在南方群岛身上终于得以根除,它的流处理器结构已经面目全非了。
通过Pitcairn的整体架构图我们看到,传统的SIMD流处理器阵列消失了,取而代之的是GCN阵列,Pitcairn总计拥有1280个流处理器,现在来看看GCN阵列的微观结构。
GCN阵列微观结构
GCN阵列里有4组SIMD单元,每组SIMD单元里面包括16个流处理器、或者说是标量运算器。GCN架构已经完全抛弃了此前5D/4D流处理器VLIW超长指令架构的限制,不存在5D/4D指令打包-派发-解包的问题,所有流处理器以16个为一组SIMD阵列完成指令调度。简单来说,以往是指令集并行,而现在是线程级并行。
GF100的SM(流处理器簇)微观结构
可以这么理解,一个GCN阵列与GF100当中的一组SM相当,GF100的一组SM当中有4组共计32个流处理器,而Tahiti的一组GCN当中有4组共计64个流处理器。
更多的线程调度
从线程级别来看,GCN与SM是不可分割的最小单元,GCN一次可以执行64个线程,而SM是48个(其实就是流处理器的数量)。
从多线程执行上来看,GCN可以同时执行4个硬件线程,而SM是双线程调度器的设计(参见架构图)。如此来看,GCN架构的多线程性能会更好一些。
2人已赞
第1页:誓夺王位!AMD发布双芯显卡HD7990第2页:GCN架构的精髓:更强大的多线程性能第3页:GCN架构的实际意义:GPU计算效能大增第4页:HD7990定位、规格和特性全解析第5页:公版HD7990显卡曝光第6页:测试平台介绍第7页:DX11理论测试:《3DMark11》第8页:最新3D性能基准:《3DMARK》第9页:DX11游戏:《孤岛危机3》第10页:DX11游戏:《古墓丽影9》第11页:DX11游戏:《战地3》第12页:DX11游戏:《地铁 2033》第13页:DX11测试:《石巨人》第14页:DX11游戏:《异形大战铁血战士》第15页:DX11游戏:《光荣使命》第16页:DX11游戏:《狙击精英2》第17页:DX11游戏:《失落星球2》第18页:BTC为何物?揭开虚拟货币神秘的面纱第19页:注册矿池账号!旗舰显卡挖矿速度大PK第20页:HD7990功耗温度噪音测试第21页:总结:86亿晶体管的奢侈品