泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

性能与效率的飞跃:HD6970/50完全评测

    除了线程处理器架构从使用了多年的5D架构改成了4D架构之外,HD6900为了提升通用计算性能,还采用了异步分配。

AMD以往产品命令队列流程图

    在AMD过去的产品中,虽然已经可以实现同一时间内运行多个内核,并且将任务分配到核心当中,但执行的时候必须由仲裁器和定序器来决定任务执行的先后顺序,比如高优先级的指令可以直接插队立即执行,而低优先级的指令可以被暂时存放在高速缓存之中,等待空闲时机再进行处理。

HD6900完全评测

    但在HD6900系列中,AMD对这个架构进行了改进,采用了异步分配的方式。也就是说可以将多个命令流在同一时间提交给核心,让它们立即执行。每一个内核都拥有独立的还行缓冲区和FIFO,所有的命令队列是独立的,异步的,具有不同的优先级。这允许多个应用程序乱序提交工作规程,并获得返回结果。另外,AMD还为每个提交的内核配置有独立的虚拟内存,包括完整的页表,因此,所有这些命令队列可以进入用户空间,并且都是通过完整的内存子系统和高速缓存获得保护。

    除了异步分配之外,AMD还建造了2个新的DMA,它们可以双向地让PCIe带宽充分饱和。可以大幅度的提高GPU的来回吞吐量和系统内存读取速度,和上一代产品相比,带宽有效地翻倍。核心还采用多种方式进行改进,如直接读取本地数据缓存而完全绕过ALU,改进了提取操作的性能。另外整合着色器读取和优化整合产出的写入将提高着色器的I/O。

    最后,HD6900还提升了双精度运算的执行效率,此前的产品中,双精度性能位单精度性能的1/5,而HD6900的双精度性能为单精度性能的1/4,已经超过了600GFlops。可以看出,AMD在HD6900 系列产品的通用计算性能方面也花了很大的功夫来进行改进。

渲染器后端升级

HD6900完全评测

    HD6900的后端渲染方面主要有三大改进,分别是“整合写入操作”、16位整数(unorm/snorm)操作速度提升2倍、32位浮点(单/双精度)操作速度提升2-4倍。显卡抗锯齿性能将得到进一步的提升。

0人已赞
第1页:AMD连续发力:Cayman核心HD6900发布第2页:HD6970/6950详细规格全面揭秘第3页:打破常规:HD6970/HD6950大幅升级第4页:全新4D架构的VLIW4线程处理器第5页:4D线程处理器工作原理与优势第6页:异步任务分配提升GPU计算性能第7页:DX11时代,曲面细分性能非常重要第8页:两个图形引擎,预渲染模块全部翻倍第9页:几何性能翻倍,曲面细分性能最高三倍第10页:全新抗锯齿技术:增强质量抗锯齿第11页:全新的功耗控制技术:AMD PowerTuner第12页:自定义最大功耗:OverDrive驱动控制第13页:HD6970显卡官方美图赏析第14页:HD6970显卡内部细节介绍第15页:HD6950显卡官方美图赏析第16页:HD6950显卡内部细节介绍第17页:首批出货品牌:XFX讯景第18页:首批出货品牌:迪兰恒进第19页:首批出货品牌:镭风第20页:首批发布品牌产品一览第21页:测试环境:i7 965+6GB内存顶级平台第22页:DX11理论:《3DMark11》第23页:DX10理论:《3DMark Vantage》第24页:DX9C理论:《3DMark06》第25页:DX11理论:《Heaven Benchmark 2.1》第26页:DX11游戏:《尘埃2》第27页:DX11游戏:《异型大战铁血战士》第28页:DX11游戏:《战地:叛逆联队2》第29页:DX11游戏:《地铁2033》第30页:DX11游戏:《失落的星球2》第31页:DX10游戏:《孤岛危机:弹头》第32页:DX10游戏:《冲突世界:苏联进攻》第33页:DX10游戏:《孤岛惊魂2》第34页:DX9C游戏:《街头霸王4》第35页:DX9C游戏:《黑手党2》第36页:满载/待机温度、功耗测试第37页:全文总结:性能与效率的再次飞跃

关注我们

泡泡网

手机扫码关注