显卡至尊!双芯旗舰HD7990首发全测试
分享
最后,再来强调一下AMD抛弃5D/4D VLIW改用全新GCN架构的意义
理想状态下毫不相干的四组线程执行情况
在VLIW的理想情况下,4个线程分别各自独立且毫不相关,可以看到新架构和VLIW的执行情况和类似,理论上效率都是100%。
非理想状态下,条件相关线程延迟执行
但对于VLIW架构来说,不理想的情况就是遇到相关的指令流,比如两个绿色线程,前三个线程可在一个周期内执行,最下方的蓝色只能独立执行。而对于新架构来说,则不存在这样的问题。也就是说,采用硬件调度之后,GCN和SIMD可以允许选择不同的线程乱序执行,这些线程可以来自同一任务,也可以是不同任务。当然,这种“乱序”也不是绝对的,基本的流程还是要遵守的,比如各个线程之间的指令必须按顺序执行,不能打乱也不能分割。
以往的VLIW架构在并行任务处理方面处于劣势,并且很依赖编译器和API的支持,扩展到OpenCL也受到很大限制。经过硬件架构的调整,新的GCN架构在并行计算方面有了很大提高。编译压力减轻,硬件调度的加入使编译器摆脱了调度任务;其次是程序优化和支持语言扩充更见容易;最后是不用在生成VLIW指令和相关调度信息,新架构最底层的ISA也更加简单。
2人已赞
第1页:誓夺王位!AMD发布双芯显卡HD7990第2页:GCN架构的精髓:更强大的多线程性能第3页:GCN架构的实际意义:GPU计算效能大增第4页:HD7990定位、规格和特性全解析第5页:公版HD7990显卡曝光第6页:测试平台介绍第7页:DX11理论测试:《3DMark11》第8页:最新3D性能基准:《3DMARK》第9页:DX11游戏:《孤岛危机3》第10页:DX11游戏:《古墓丽影9》第11页:DX11游戏:《战地3》第12页:DX11游戏:《地铁 2033》第13页:DX11测试:《石巨人》第14页:DX11游戏:《异形大战铁血战士》第15页:DX11游戏:《光荣使命》第16页:DX11游戏:《狙击精英2》第17页:DX11游戏:《失落星球2》第18页:BTC为何物?揭开虚拟货币神秘的面纱第19页:注册矿池账号!旗舰显卡挖矿速度大PK第20页:HD7990功耗温度噪音测试第21页:总结:86亿晶体管的奢侈品