HD7970脱胎换骨全测试!5年架构大革命
第三章/第四节 南方群岛应用篇:AMD APP 加速并行技术
CUDA是NVIDIA显卡的一大卖点,它能够将GPU庞大的运算能力释放出来,对非3D游戏应用软件进行加速,实现比纯CPU运算更快的效能。CUDA目前虽然有很多种类的软件,但最主要的应用还是集中在视频编辑和转码方面。
Radeon HD 7900系列上的APP加速技术包括三个方面:独立的硬件高清视频加速引擎、增强的计算硬件和软件、基于AMD APP SDK开发包的应用生态系统。
AMD此番带来了新的高清编码技术“视频编码引擎”(VCE),其核心功能是一个多流硬件H.264高清编码器,编码速度甚至超过1080p@60FPS的播放速度,而且支持完全固定、混合计算两种编码模式。
质量方面支持4:2:0色彩取样,针对游戏和视频场景变化做出优化,并且可以自行控制压缩质量。此外还支持音频视频复合,显存输入用于转码、视频会议,GPU显示引擎输入用于无线显示。
TotalMedia Theatre 5.2(简称TMT 5.2),特别针对AMD技术优化,支持MVC编码硬件加速(蓝光3D节目)、MPEG-4 ASP UVD硬件加速解码、基于AMD APP SDK重新编写的OpenCL SimHD高清差值插件。
TMT 5.2还进行了新概念的重新设计,包括Alpha混合用户界面、本地与在线媒体管理、电影元数据搜索、DVD电影和视频片段智能菜单、2D-3D实时转换插件Sim3D等等。
WinZip 16.5,通过Corel、AMD的合作,针对A卡优化,现在可以利用OpenCL进行Deflate压缩、Inflate解压、AES加密的加速,并且能够同时利用处理器、集成/独立显卡的资源。官方宣称,APU使用集显或独显的测试证明,WinZip 16.5 AES加密的速度提升了两三倍。
AMD APP生态系统:浏览器与插件、消费级视频编辑、办公与地图、流行媒体播放器。
还有新的媒体处理指令SAD(绝对差值和),这是多项关键视频与图像处理算法的关键操作,包括动态监测、姿态识别、食品与图像搜索、深度提取、计算机视觉等等。
Radeon HD 7900系列支持4×1 SAD、4×4 QSAD,每个时钟周期可处理最多64个像素,其中Radeon HD 7970每秒钟能处理18多万亿个像素。此外还有MQSAD,可以忽略背景像素、加速移动物体的隔离。
Steady Video技术也将进化为2.0版本,不过这里AMD只是介绍了基本原理,没有公开新特性,据说支持QSAD硬件加速、隔行模式视频、左右对比模式。