性能与效率的飞跃:HD6970/50完全评测-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

性能与效率的飞跃:HD6970/50完全评测

2010年12月16日 00:02作者：邱大川编辑：邱大川文章出处：泡泡网原创

除了线程处理器架构从使用了多年的5D架构改成了4D架构之外，HD6900为了提升通用计算性能，还采用了异步分配。

AMD以往产品命令队列流程图

在AMD过去的产品中，虽然已经可以实现同一时间内运行多个内核，并且将任务分配到核心当中，但执行的时候必须由仲裁器和定序器来决定任务执行的先后顺序，比如高优先级的指令可以直接插队立即执行，而低优先级的指令可以被暂时存放在高速缓存之中，等待空闲时机再进行处理。

但在HD6900系列中，AMD对这个架构进行了改进，采用了异步分配的方式。也就是说可以将多个命令流在同一时间提交给核心，让它们立即执行。每一个内核都拥有独立的还行缓冲区和FIFO，所有的命令队列是独立的，异步的，具有不同的优先级。这允许多个应用程序乱序提交工作规程，并获得返回结果。另外，AMD还为每个提交的内核配置有独立的虚拟内存，包括完整的页表，因此，所有这些命令队列可以进入用户空间，并且都是通过完整的内存子系统和高速缓存获得保护。

除了异步分配之外，AMD还建造了2个新的DMA，它们可以双向地让PCIe带宽充分饱和。可以大幅度的提高GPU的来回吞吐量和系统内存读取速度，和上一代产品相比，带宽有效地翻倍。核心还采用多种方式进行改进，如直接读取本地数据缓存而完全绕过ALU，改进了提取操作的性能。另外整合着色器读取和优化整合产出的写入将提高着色器的I/O。

最后，HD6900还提升了双精度运算的执行效率，此前的产品中，双精度性能位单精度性能的1/5，而HD6900的双精度性能为单精度性能的1/4，已经超过了600GFlops。可以看出，AMD在HD6900 系列产品的通用计算性能方面也花了很大的功夫来进行改进。

渲染器后端升级

HD6900的后端渲染方面主要有三大改进，分别是“整合写入操作”、16位整数(unorm/snorm)操作速度提升2倍、32位浮点(单/双精度)操作速度提升2-4倍。显卡抗锯齿性能将得到进一步的提升。

0人已赞

第1页：AMD连续发力：Cayman核心HD6900发布第2页：HD6970/6950详细规格全面揭秘第3页：打破常规：HD6970/HD6950大幅升级第4页：全新4D架构的VLIW4线程处理器第5页：4D线程处理器工作原理与优势第6页：异步任务分配提升GPU计算性能第7页：DX11时代，曲面细分性能非常重要第8页：两个图形引擎，预渲染模块全部翻倍第9页：几何性能翻倍，曲面细分性能最高三倍第10页：全新抗锯齿技术：增强质量抗锯齿第11页：全新的功耗控制技术：AMD PowerTuner 第12页：自定义最大功耗：OverDrive驱动控制第13页：HD6970显卡官方美图赏析第14页：HD6970显卡内部细节介绍第15页：HD6950显卡官方美图赏析第16页：HD6950显卡内部细节介绍第17页：首批出货品牌：XFX讯景第18页：首批出货品牌：迪兰恒进第19页：首批出货品牌：镭风第20页：首批发布品牌产品一览第21页：测试环境：i7 965+6GB内存顶级平台第22页：DX11理论：《3DMark11》第23页：DX10理论：《3DMark Vantage》第24页：DX9C理论：《3DMark06》第25页：DX11理论：《Heaven Benchmark 2.1》第26页：DX11游戏：《尘埃2》第27页：DX11游戏：《异型大战铁血战士》第28页：DX11游戏：《战地:叛逆联队2》第29页：DX11游戏：《地铁2033》第30页：DX11游戏：《失落的星球2》第31页：DX10游戏：《孤岛危机:弹头》第32页：DX10游戏：《冲突世界:苏联进攻》第33页：DX10游戏：《孤岛惊魂2》第34页：DX9C游戏：《街头霸王4》第35页：DX9C游戏：《黑手党2》第36页：满载/待机温度、功耗测试第37页：全文总结：性能与效率的再次飞跃

性能与效率的飞跃:HD6970/50完全评测

关注我们