CPU和GPU真融合 APU异构系统架构解析
由于目前还没有支持HSA的处理器产品问世,所以所有的技术介绍及数据都来自于AMD内部。AMD大中华区游戏,软件及异构计算合作与技术总监楚含进向大家分享了HSA架构的应用实例——人脸识别技术:
人脸识别技术看似简单,实则是通过暴力计算的方式来实现,处理器需要在一张图片中画出无数个搜索框,从中寻找人脸的关键特征,一张1080p像素的全高清图片需要分析200万次……
一张图片中可能会有无数个人脸,处理器一开始并不知道人脸有多大,所以需要不断地对图片进行缩放从而寻找合适大小的脸。
最终,人脸识别的过程被细分为22个阶段,每一个搜索框都需要重复这22个阶段,如果是静态图像还好,动态视频的话30FPS就需要每秒1.4万亿次的计算能力……而且这个速度仅能识别正面人脸。
经过测试,这22个阶段中,并不是所有阶段都是GPU处理速度更快,也有CPU占据明显优势的,也有性能速度差不多的,毕竟两者计算架构完全不同,适应不同的运算。
22个阶段CPU和GPU各有所长,最终根据效率高低,第0阶段让CPU独立计算,第9-22阶段让GPU独立计算,而1-8阶段让CPU和GPU协同计算会更快一些。
最终经过测试获得的数据显示,HSA为CPU和GPU智能分配任务后,人脸识别速度提高了2.5倍之多!
这个案例意味着什么呢?我们再来回顾一下本文第一页提到的内容:用户越来越希望能够借助手势、眼睛、身体,用自然表达的方式和机器交互——没错,体感!然后呢?游戏机——索尼PS4和微软Xbox One——它们都用的是AMD下一代的APU,都是基于HSA架构而设计的,而且是低功耗的CPU架构搭配为计算优化的GCN GPU架构!
只有HSA架构才能彻底的将GPU强大的运算能力释放出来,从而降低对CPU的依赖,大幅提升性能功耗比,降低应用开发难度,这就是索尼和微软不约而同的选用AMD APU的根本原因,否则传统PC架构优异CPU搭配独立显卡不是更好么?游戏机硬件一旦确立,未来5年内甚至更长时间都不会再改变,因此必须选用前瞻性的架构,索尼的微软为次世代游戏主机选择了HSA和APU,PC同样是大势所趋,让我们一同期待AMD下一代桌面级APU的表现吧!■<