AMD桌面级APU发布!Llano A8深度评测
第五章 APU加速处理器应用体验
在上一章,我们通过全方位的测试,以数据的方式向大家展示了APU加速处理器在CPU、GPU以及异构计算方面的实际性能。但是理论运算能力再强,也都需要软件的支持才能发挥出威力。本章将向大家展示AMD近年来在异构计算方面的努力,这一切都是为APU做准备的。
第五章/第一节 APU粒子模拟加速
首先我们来看一个可以将APU异构计算加速能力发挥到最大的演示程序,这是AMD官方设计的一个Demo,采用了OpenCL并行计算技术,充分调动了APU内部的CPU和GPU运算单元,通过智能分配任务的方式将GPU和CPU的运算能力都发挥到最大。
之所以说AMD的APU并不是把CPU和GPU简单的组合在一起这么简单,就是因为AMD的CPU和GPU可以通过OpenCL或DirectCompute并行计算技术协同工作。而Intel的SandyBridge则不行,Intel只有CPU部分支持OpenCL,GPU部分无法支持,不能起到加速效果。
AMD这个演示Demo当中大约有3.2万个移动的小粒子、400个固定的大粒子。如果小、小粒子碰撞,就交给GPU去利用OpenCL检测;计算如果是大、小粒子或者大、大粒子碰撞,则交给CPU负责,这样的任务分配充分发挥了CPU和GPU的计算能力优势,APU的负载始终处在接近TDP的水平,运算分布均匀。
除了运算量合理分配之外,由于APU内部的CPU和GPU共享系统内存,这样CPU和GPU之间就实现了零拷贝,无需通过前端总线去进行数据交换,执行效率大大提高,同时减少了内存带宽资源的争抢,减少了内存带宽压力。
这款演示Demo还有一些特殊的设计,还应用到了DX11当中的HDAO、Alpha混合透明、软阴影等,GPU做并行计算时用不到的图形渲染模块也被用于增强演示Demo的画质,也就是说APU一手包办了CPU和GPU异构计算以及DX11图形渲染的所有任务,令人叹为观止!
可惜这款Demo仅供内部开发人员以及技术演示,暂时不提供下载。