AMD的融合伟业!Llano APU笔记本首测
第五章 APU加速处理器应用体验
在上一章,我们通过全方位的测试,以数据的方式向大家展示了APU加速处理器在CPU、GPU以及异构计算方面的实际性能。但是理论运算能力再强,也都需要软件的支持才能发挥出威力。本章将向大家展示AMD近年来在异构计算方面的努力,这一切都是为APU做准备的。
第五章/第一节 APU在异构计算加速方面得天独厚的优势
提起异构计算与GPU加速,很多人最先想到的应该是NVIDIA的CUDA技术,CUDA在近几年搞得有声有色,诞生了一大批基于CUDA技术的GPU加速应用。NVIDIA的CUDA技术虽然不错,但也有个致命缺陷——大家应该会发现基于CUDA技术的应用大都对GPU要求很高,但是CPU却几乎处于空闲状态,这是为什么呢?
CUDA与Stream之争
原因很简单,NVIDIA只有GPU而没有CPU,拿不到X86关键指令集授权,这样NVIDIA在发展CPU+GPU异构计算应用时就受到了很大的制约,不管OpenCL还是DirectCompute还是NVIDIA自己的CUDA开发平台,其各种函数和指令都能完全调用NVIDIA的GPU资源,但却无法调用X86处理器的运算资源。这样CUDA类应用只能让CPU进行一些周边的、简单的、打包工作,CPU负载很低,而且CPU运行效率很低。(参考CUDA视频转码、PhysX CPU软加速)
CUDA视频转码时:GPU满载,CPU空闲
所谓异构计算就是要让CPU和GPU协同工作,互相帮助、消除计算时所存在的瓶颈,并且让CPU和GPU各自去运行自己最擅长的工作。不管CPU还是GPU,单方面满负荷运行并不能将系统性能发挥到最大,这是CUDA技术最大的瓶颈所在。(这也是NVIDIA购买ARM处理器授权的根本原因)
越来越多的应用软件开始支持AMD Stream及APU加速
而AMD则拥有得天独厚的优势,AMD同时拥有高性能的X86处理器和DX11显卡,将两者融合起来进行异构计算,不会有任何制约因素来限制其性能发挥。现在AMD将X86核心与DX11 GPU融合在了一颗芯片之上,APU拉近了两大处理器核心的距离,减少了运算资源浪费、降低了数据传输延迟,就可以将异构计算的优势发挥的淋漓尽致!