加速计算的前世今生
APU (加速处理器) 是一种全新的处理器,兼有中央处理器和图形处理器的双重优势,它是世界上迄今为止第一款性能卓越、能效显著、均衡的加速处理平台,为实现手势与人脸识别、搜索与索引以及动态视频增强等过去只能想一想的全新应用铺平了道路。
今天,唯有AMD身兼中央处理器和图形处理器技术上的双重领先优势,能够将这种颠覆性的新型处理器带入现实。
融合的趋势
过去35年来,我们看到处理器性能一再提升,克服了旧的局限,实现了PC计算新水平和前所未有的软件创新。但如何持续突破技术的局限,避免性能投资回报率的不断降低,这是不同时代面临的共同困扰,并催生新的时代。不解决这个问题,就没有办法把实用、价格低、高性能的解决方案推向市场。
多核CPU开发中一直存在着功耗和扩展性方面的局限,让越来越多半导体、软件和系统工程师们转向图形处理器,用矢量处理功能寻求提高性能的方法。高级图形处理器中使用的矢量处理单元拥有成千上万个计算核,又称着色器,它们同时运行。这使得图形处理器成为处理大量数据包或者繁重数字计算等任务的理想选择。
但是矢量计算并不能包打天下。例如,处理小数据阵列时,矢量设置消耗的时间会轻易地把节约的时间抵消掉。那就是为什么中央处理器采用的标量方法仍然是处理一些问题和算法的非常好的选择。这也是为什么兼有中央处理器和图形处理器两方面优点的异构运算,对于推进设计更快、功能更强大的处理器,带来更新更好的用户体验,均至关重要。
顾名思义,异构运算指的是系统使用多种处理器构成多核系统,不但通过增加处理器核数来提升性能,还增加了专用处理能力来对具体任务进行加速。比如一个APU就是一个异构系统,兼有 DirectX 11独立显卡功能,用于处理图形和针对大型数据包的繁重运算,从而实现3D渲染和其他一些特定功能;同时,APU继续沿用CPU的方法来运行电脑操作系统和大部分传统商业应用。
在今天,两种趋势正走向融合从而推动APU发展,并充分利用APU所提供的能力开发相关软件应用。一是在IT行业内部,重大的技术进展已经出现,包括应用程序编程接口越来越多,以及把GPU和专用处理器整合成单一、连贯的设计更加容易等等。二是从市场需求来看,最终用户对可视化内容资源更加感兴趣、要求延长小巧便携计算机的电池续航、还有对更为直观的用户界面的渴望等等,都清楚表明了我们需要比过去任何时间的图形支持水平都高得多的处理器。
APU应运而生
用户对更小尺寸电脑、更长电池时间、更简单操作界面的持续需求正在催生进一步的整合和微型化,高度节省空间和功耗的APU很好地迎合了这种需求。不止于此,APU还以异构运算加速特定的应用,给各种新应用带来巨大的潜力,以真正革命性的姿态为人们带来新的更好的体验。然而迄今为止,处理器的设计者和生产商在实践异构运算上面临挑战。他们需要做到的是硬件跑得足够快足够好,从而支持大批量高级应用,然而适合开发这些应用的硬件架构和软件界面却常常匮乏。
在硬件层面,凭借长时间形成的CPU与GPU双重领域的领导优势,AMD不再使用PCIe作为CPU与GPU之间的主界面,转而采用融GPU和CPU功能于一体的解决方案,这就是我们今天看到的APU,从而以全新的硬件架构带来了新的可能性。
APU将通用运算x86架构CPU核心和可编程矢量处理引擎相融合,把CPU擅长的精密标量运算与传统上只有GPU才具备的大规模并行矢量运算结合起来。AMD APU设计综合了CPU和GPU的优势,为软件开发者带来前所未有的灵活性,能够任意采用最适合的方式开发新的应用。AMD APU通过一个高性能总线,在单个硅片上把一个可编程x86 CPU和一个GPU的矢量处理架构连为一体,双方都能直接读取高速内存。AMD APU中还包含其他一些系统成分,比如内存控制器、I/O控制器、专用视频解码器、显示输出和总线接口等。
AMD APU的魅力在于它们内含由标量和矢量硬件构成的全部处理能力。没有其它公司曾经尝试过用真正可编程的GPU,更不必说采用通过OpenGL、DirectCompute和DirectX 11等行业标准工具进行编程的GPU,实现与CPU的融合。这就是我们说到的另外一个挑战:当APU实现CPU和GPU融合时,软件开发者们如何对GPU进行编程以实现通用计算。
现在有两款跨GPU编程的主要开发工具,分别为OpenCL和微软DirectCompute,目前AMD对这两种工具都提供了良好的支持。AMD还有一款OpenGL开放式三维图形软件包编译器,同时支持Radeon HD4000、5000和6000系列的图形处理器,以及多核x86处理器系列。开发者们使用带有这些图形处理器的AMD平台开发的软件,就可以在AMD新型APU上运行相关应用。
APU带来的新体验
AMD目前推出的第一代AMD Fusion APU包括C系列和E系列。E系列产品包含APU E-350和APU E-240,CPU主频分别为1.6GHz和1.5GHz,均融合了AMD Radeon HD 6310显卡,支持DirectX 11和最新的UVD3高清硬解码技术,显卡频率500MHz,TDP 为18W。C系列APU包含C-50和C-30两款产品,CPU主频分别为1.0GHz和1.2GHz,其融合的AMD Radeon HD 6250显卡支持DirectX 11和最新的UVD3高清硬解码技术,显卡频率为280MHz,热设计功耗仅为9W。
经过成本与功耗优化,E和C系列APU实现了CPU与GPU性能的精确平衡,从而在外观小巧、价格适中的台式机和笔记本上又能实现锐利清晰的高清在线体验,又能做到运算过程中散热少、噪音低。基于E系列APU生产的台式机能让用户以炫目的高清品质欣赏视频、图片和网站,视频和图片精度可以达到10亿色和完全1080p高解像度,并且图片和视频的搜索、观看、编剧和传输上也更快更容易。主流和超薄笔记本以及高清小本等小型电脑也可以采用C系列和E系列APU来实现这些功能。
即将推出AMD高性能APU代号Llano,即AMD A系列APU,计划2011年上半年投入量产。AMD A系列APU带来了更高性能、更多CPU核心以及相比AMD C系列和E系列性能强得多的GPU。 此外,AMD A系列APU内含AMD动态超频技术,它可以调整CPU和GPU性能以满足各应用的具体要求;AMD的功率门控则根据应用负荷,打开或关闭CPU和GPU资源以提高能效。
AMD A系列APU将成为2011年AMD新的主流台式机和笔记本平台的基础,为终端用户带来高性能和极致视觉体验。从这些平台开发出的软件应用可以用AMD A系列APU提高所有素材的视频质量,让高清更加清晰,让在线视频走向高清。其他一些应用还可以让视频拍摄、编辑和存储更加简化,图片的搜索和标注更为便捷。
随着创新周期大步迈向能够加速特定应用的异计算时代,APU正在成为我们的不二选择。一身兼备CPU和GPU的双重优势,APU带来了前所未有的体验。
我们可以期待APU将带来种种令人称奇的可能性,并伴随着功耗越来越小、外形越来越小,实现越来越长的电池续航。根据AMD性能实验室的测试结果,2011 AMD C-50双核APU在待机状态下实现735分钟即12.15小时的“全天”电池续航,运行3DMark ''06时电池续航达到378分钟或6.18小时。所有测试采用62.2瓦6芯锂电池。配置C-50 1.0Ghz 9W APU加速处理器; 2GB (1x2GB) DDR3-1066 内存;AMD Radeon HD 6250 显卡,使用1024x600像素 10.1 寸显示器;62.2瓦6芯锂电池一块;LED背光屏,64位Windows 7高级家用版操作系统。
同时,APU将会让小型化系统机出现爆发性增长,以AMD APU为核心的超薄笔记本、便携小本、平板电脑和微型超薄平板电脑将以各种形态纷纷亮相。
加速的未来
“速度”这个词形容视觉运算技术正在怎样地推动AMD的创新步伐。每一年,AMD都在创新GPU架构,以两倍于竞争对手的速度引入重大新技术发展。这一过程中产生的新型独立显卡将每年提供新的技术并纳入APU中,它意味着AMD有能力按照类似GPU那样的总体设计节奏引入新的APU,用新的GPU技术实现APU的不断创新。
从CPU和GPU的革命性融合开始,AMD Fusion APU架构在异构运算时代将会不断进化, 从处理器的物理整合,到平台优化,再到架构和操作系统的完全融合(如图)。 硬件在同步改变,从嵌入式内存演化到内存和进度安排完全一体化,软件则经历从实现开放式软件生态系统到完全并行的任务运行整合。这些进行中的创新将持续以运算和性能上的提升推动以异构计算为特征的加速时代的普及。