未来属于Fusion?APU一年融聚路回顾
泡泡网笔记本频道12月21日 Fusion APU平台是今年AMD在消费级笔记本市场用以对抗英特尔的主力产品,于年初CES展会上正式发布,同时也宣告融聚时代的正式到来。
和竞争对手类似,APU同样使用了CPU与GPU融合的设计理念,成功将两者设计在同一晶圆上,但不同的是它更加注重此二者的协同运算能力,可充分发挥两种处理器的优势,并借此消除计算瓶颈,也就是我们常说的“异构计算加速”,因此APU处理器也被称为“加速处理器”。
作为主力级产品,AMD将APU分为Brazos以及Llano两大阵营,前者主要出现在入门笔记本以及小尺寸超便携笔记本身上,具备低功耗或超低功耗的特性,包括E、C两大系列,并分别提供单核、双核型号;而后者则针对主流高性能机型研发,双核或四核心,整合了更为强劲的Radeon图形单元,并支持与外部独立显卡混合交火,兼具物理层面的节能技术。
接下来笔者就诚邀大家一起,回顾下AMD Fusion APU平台的点点滴滴,也希望通过此篇文章,大家能对APU有一个更好的认识。
去年,英特尔与英伟达两家公司口水战不断,CPU与GPU到底谁将取代谁也成为广大网友热议的话题,而随后同时掌握这两项技术的AMD提出了两者融合的发展趋势。
PC领域的困境:CPU与GPU各司其职
随着CPU核心的增加,电脑在一般计算任务处理,普通程序应用与串行数据计算上都取得了长足的进步,而GPU则凭靠工艺和技术革新也在物理显示、视频加速、视觉应用及并行计算上崭露头角。这时,将两者融合在一起就能进一步增强电脑串并行计算(异构计算)能力,大幅提升每瓦性能。
在这种形势下,AMD早在2006年成功收购了ATI之后就开始研发Fusion处理器,而随着研发进程的进行,越来越多的新特性显现出来。
APU可以简单的被理解为CPU与GPU的集合体,此外,它还囊括了北桥、内存控制器等等,并具备这些设备的所有特性。
而将这种种组件整合到一起,我们发现其无论是体积,还是功耗都有着质的突破。
此外,从四核Llano晶圆示意图上不难看出,APU加速处理器十分重视图形核心,其所占面积几乎达到了整个晶圆的一半!
看点一:超低功耗、节能
对笔记本而言,平台功耗越低,机器可获得的续航时间就越长,发热也越小,同时也越利于减小笔记本体积重量,增强便携性。当前E系列APU处理器功耗仅为18W,而面向超便携笔记本推出的C系列功耗更是低至9W,这些都比主流35W的笔记本处理器低出了不少,也使得笔记本全天候续航成为常态。
此外,不仅仅是低功耗的Brazos系列,定位较高的Llano系列APU处理器在功耗控制方面也有着独到之处,采用目前非常先进的核心门供电方案,可对没有负载的模块彻底断电,并可随时唤醒恢复,杜绝了空闲电路的电流消耗;除此之外,它还引入了精简化时钟网格技术,在不工作的时候可高效地关闭数字电路的一部分,减少能源消耗,并降低发热。
全速运行状态,APU所有模块都正常工作;
没有视频类应用时,UVD模块被关闭;
没有图形和游戏应用时(或使用独显时),整个集显模块都可以被关闭。
看点二:异构计算
所谓异构计算就是要让CPU和GPU协同工作,互相帮助、消除计算时所存在的瓶颈,并且让CPU和GPU各自去运行自己最擅长的工作。在这方面I+N组合显然要逊色一些,一方面它要求GPU部分足够强,另一方面其仅仅是使用GPU担任传统的CPU工作,而无法调用CPU资源,加速更是无从谈起。
对此,同时拥有X86处理器以及高性能GPU研发能力的AMD显然具备得天独厚的优势,同时将这两者设计到同一晶圆之上,拉近两大处理核心距离,减少运算资源浪费、降低数据传输延迟,将异构计算的优势发挥的淋漓尽致!
此外,异构计算加速也要通过软件厂商的配合来实现,在开启和关闭状态下这些软件的运行表现有着天壤之别。
看点三:DirectX 11、OpenCL 1.1等特性
今年是DirectX 11全面普及之年,DirectX 11可更有效地发挥新硬件的能力、提高物理效果和游戏AI、增强画面细节复杂度,并针对多核心处理器进行全面优化。而所有APU处理器均完整支持这一特性,融聚Radeon HD 6000系列显示核心,提供Tessellation曲面细分,ShaderModel 5.0,OpenGL 4.1全面支持;高品质抗锯齿和各项异性过滤支持,最高支持24xMSAA、SSAA、MLAA;以及OpenCL 1.1,DirectCompute 11,AMD APP异构计算加速技术。较之对手的DX10.1图形产品有着巨大优势。
看点四:Llano混合交火
Llano APU当中已经整合了规格和性能都相当不错的显卡,那如果搭配独立显卡,强大的集显如果被禁用的话岂不可惜?针对有更高3D性能需求的用户,AMD想到了这一点,并且开发了混合交火技术,让集显也能发挥余热,为独显提供不错的性能加成。
A8与A6系列APU处理器由于集显规格较强,可以和大部分HD6000M系列独显组成混合交火。而A4系列集显规格删减较多,AMD限制它只能与入门级HD6400M独显组建混合交火。据AMD官方数据显示,混合交火与独立显卡相比,最多可以获得75%的性能提升。
看点五:Turbo Core动态超频技术
AMD在设计Llano APU时,在硬件层面引入了数字APM模块来精确测量核心的耗电量及运行温度,这样就可以根据处理器的功耗和温度变化,来决定下一步是超频还是节能。比如,某项应用多核CPU无效,只有一颗核心满载运行,那么就单独对这一颗CPU进行大幅超频,让它在最短的时间内完成工作;
再比如某游戏对CPU要求不高,而对显卡要求很高,那就让CPU处于低频率状态运行,让GPU超频运行,总之总功耗不要超过TDP就行了,这样让功耗动态的游走于各处理单元之间,可以将APU的性能发挥到最大。
● 处理器信息
AMD C-50是APU处理器中的超低功耗型号,代号Ontario,双核,热设计功耗仅为9W,主频1.0GHz,集成AMD Radeon HD 6250图形核心,具备80个流处理器,频率280MHz,图形规格已经相当于入门级Radeon HD 5450。虽然没有专用显存,但对付超便携笔记本、上网本绰绰有余。
处理器信息
AMD C-50处理器为原生双核心,采用40纳米工艺制造,同时支持64位运算,处理器主频1GHz。
● 图形信息
显示核心信息 GPU-Z截图
APU C-50集成显示核心为AMD Radeon HD 6250,支持DirectX 11、SM5.0等等,定位入门级别。此外,由于我们测试过的C-50笔记本仅配备了单根2GB单通道内存,因此难免对集成显卡性能发挥造成限制。
● 整体性能
Windows7 体验得分
从Windows7体验得分上看,最低分出现在处理器项2.8分,内存、图形、游戏图形、主硬盘四项较为均衡,都在4.1分以上。处理器之所以会成为瓶颈,一个是因为其主频较低,仅为1GHz;另一个重要原因是APU平台注重的是CPU与GPU的协同运算能力,在Windows体验中会有这样低的表现,也不难理解。
● GPU加速功能
FishIE Tank测试是IE9浏览器在加入GPU加速功能之后提供的加速性能检测工具,在未开启APU加速功能时,250条鱼下的测试成绩仅为2帧。而开启GPU加速之后,直接提升至33帧,可以说,加速处理器的名号还是比较贴切的。
关闭IE9的GPU加速(250条鱼:2FPS)
开启IE9的GPU加速(250条鱼33FPS)
可以看出来,在未开启GPU加速功能时,250条鱼下的测试成绩仅为2帧。而开启GPU加速之后,直接提升至33帧,可以说,加速处理器的名号还是比较贴切的。
● 高清视频解码
AMD Fusion APU采用了全新视频解码器UVD 3.0,它可以支持的高清格式非常广,比如VC-1、MPEG-2、H.264、蓝光、HD DVD等等。另外,由于GPU参与到运算当中,所以CPU可以得到相应的缓解。
测试使用大家常用的暴风影音2011播放器,在开启硬件高清加速的情况下,分别用四段不同编码格式720P和1080P分辨率的高清视频对AMD C-50 APU进行测试,测试结果如下,最高仅55%处理器负载率对于9W处理器来讲还是非常出色的:
高清测试结果
《魔戒》播放画面截图 CPU使用率55%
720P视频播放占用率 33%
● 游戏测试
《冰封王座》游戏中,我们把所有的特效都已经打开,画质高,游戏帧数基本在30至40帧之间浮动,可以说还是可以很好的运行的。
《鬼泣4》测试下,D级评分,游戏帧数在25帧左右徘徊,在敌人较少场景中可上30帧,基本可玩。而这是APU竞争对手的同类笔记本所做不到的。
性能方面,主打超低功耗入门级别的APU C-50处理器虽然在处理器表现上欠佳,但由于支持GPU加速功能,在诸如IE9、暴风影音2011等应用中表现非常不错。此外,它打破了传统小尺寸笔记本不能游戏的定律,工作闲暇之余,玩玩诸如魔兽、植物大战僵尸,还是非常惬意的。
● AMD E-350详细信息
AMD E-350处理器是首批发售的低功耗版本之一,代号Zacate,双核,拥有1.6GHz主频,1MB二级缓存,融合AMD Radeon HD 6310图形核心。
处理器信息
显示核心信息
从规格上看,E-350除了CPU部分有所改善,GPU部分规格基本和C系列持平。同样,测试样机仅配备单通道2GB内存,图形性能同样受到了一定限制。
● 整体性能
同样处理器分数最低,但与C系列双核APU相比还是有着很大改善的,不过这个图形性能明显没有什么提升。
● 游戏表现
E-350 APU处理器在《生化危机5》游戏默认画质下帧数仅为14.9,看来与大型3D游戏无缘。不过根据C-50的表现,我们有理由相信其在《冰封王座》之类老游戏面前还是能轻松应对的。
各项测试结果均表明,E-350处理器在CPU单元、内存控制等方面确实有所改善,但并没有达到质的飞跃。与此同时,融聚的HD 6310在规格方面也没有比HD 6250强,因此整体表现只能算平平。看来要想在主流尺寸机型中展示出APU的魅力,还得看更为高端的Llano。
● CPU、GPU信息
AMD A6-3400M是最常见的Llano APU处理器,四核,拥有4MB二级缓存,每核心各1MB,主频1.4GHz,智能超频频率2.3GHz,并融聚了AMD Radeon HD 6520G图形核心,具备高达320条流处理管线。
处理器详细信息
融聚的显示核心详细信息
从规格上看,A6内置的6520G在规格上已经非常不错了,几乎达到了中端主流水准。与此同时,作为Llano杀手锏招数,其还支持与独立显卡的交火,如我们最常见的Radeon HD 6650M。
与之交火的HD 6650M详细信息
此外,我们曾经测试过的这款Llano A6笔记本标配2×2GB双通道DDR3内存,硬盘为5400rpm机械,系统Windows 7,对整个平台性能发挥基本没有限制。
● 各项测试数据汇总
测试结果表明,A6四核处理器CPU部分性能已经比较接近i3,同时交火后的图形性能明显要好很多,7028的3DMark 06成绩相信是任何核显都追赶不上的。不过良心话,在主流应用方面,其跟I+N组合相比确实还存有差距,至于消费者是否买账,也只能看两者价格差距了。
● A6四核Llano笔记本集成显卡/交火状态游戏测试成绩对比
通过对比我们发现,A6集显平台已经可以较流畅运行绝大多数游戏,甚至包括《孤岛危机2》在内,同时交火性能有提升,最大可达73.8%!游戏普遍40帧左右的成绩笔者已经十分满意了。而这样的表现,即使是换做同价位的I+N平台,恐怕也较难做到!
高端的Llano A8-3500M四核处理器具备1.5GHz主频、2.4GHz智能超频能力,4MB二级缓存,并内置HD 6620G图形核心,拥有多达400条流处理单元。此外,我们拿到的测试样机还带有HD 6630M独立显卡以进行交火使用。
在对比测试环节,三台笔记本除了处理器以及芯片组、独立显卡有所不同,其余环节均相同,并均采用最新版本驱动程序。
● PCMark 7
PCMark11对显示性能要求不高,所以不管NVIDIA还是AMD的独显对综合性能影响都不大。尤其是SandyBridge平台,由于加入了独立的媒体处理单元,在部分测试中成绩尤为突出,导致分数比NVIDIA独显都高,确实有点不太公平。
● HC Benchmark
HC Benchmark是中国计量科学院开发的全球先进款真正的异构计算基准测试工具,能够同时调用CPU和GPU的运算资源。
A8-3500M系统拥有独显和集显两块显卡,而且都支持OpenCL计算,因此可以获得不少的性能增益,最终性能超过了Phenom II X4 P960独显系统。
而Intel平台,SandyBridge自身的集显并不支持OpenCL计算加速,配套的NVIDIA显卡也无法与CPU一起进行异构计算,只能是要么GPU算要么CPU算。最终SandyBridge平台的测试完全由CPU独立完成,与AMD平台CPU+GPU或者APU+GPU的运算能力相差很大!
● Wprime
wPrime是一款质数计算软件,与Super Pi只能支持单线程不同的是,wPrime可以支持多线程,可以测试多核心处理器性能的计算能力,可以看做是一款多核版的SuperPi,而且全新的算法效率更高。
虽然wPrime运算性能测试环节A8输给了i5,但23.74秒的成绩比i3动辄32秒的表现还是要强出不少。
● 3DMark Vantage
从测试结果来看,Llano A8的DX10理论性能比i5、i7核芯显卡都要好,但与I+N组合相比还是有一定差距。
● 3DMark 11
在纯DX11基准性能测试环节,交火后的Llano A8完胜I+N组合
● 游戏测试
在DX11游戏面前,Llano A8处理器明显极为从容,对I+N组合毫不放在眼里,领先幅度十分明显。
可以看到,在当前主流应用下,Llano A8四核平台并没有太大优势,尤其是纯CPU计算性能测试部分。但如果提起异构计算以及DX11游戏,Llano A8确实又如发飙一般狂暴,看来这才是Llano真正优势所在!
相信看过四款APU笔记本的测试数据,您已经对它们的性能有所了解,剩下的就是如何选择的问题了。
先说以C-50为首的9W双核APU超低功耗平台,由于功耗超低,性能也比Atom要好上一些,因此更多的出现在10英寸、11英寸以及个别12英寸机型上,便携性很好,续航也很长。如华硕的EeePC、宏碁的Aspire One高清小本等等,此类机器价格多集中在2000元左右,很便宜,适合差旅随行李携带,上网、炒股、收发邮件、看看电影,甚至玩玩游戏,都是比较不错的。
Acer Aspire One 522高清小本,10.1英寸,价格不到两千
华硕EeePC 1015B,配置相同,同样不到两千
而E系列APU处理器在CPU部分性能稍有加强,但仍没有摆脱低端定位。如我们最熟悉的E-350双核,它经常出现在11到15英寸之间的任意尺寸机型上,当然,这背后也意味着制造成本的增加,售价大部分维持在2500到3500元之间,性价比很一般,且不利于移动使用。因此笔者更推荐这里面价格较低的小尺寸型号。
联想G475,14英寸,E-450双核,带独显,售价3399元
最后我们来说说Llano,其分为A4、A6以及A8三种版本,双核/四核/四核设计,定位依次升高。
A4处理器整合了HD 6480G显示核心,拥有240个流处理单元,2MB二级缓存,支持智能超频技术,频率范围1.9~2.5GHz(A4-3310MX的频率范围为2.1~2.5GHz),定位和对手的移动版奔腾一致,但图形部分明显比奔腾里面阉割AVX指令集之后的核芯显卡强出不少。此外,它还支持与HD 6400系列独显混合交火,性能增益明显,结合普遍不足4000元的售价还是具有一定吸引力的,但价格优势不大。
戴尔灵越15R,A4双核处理器、HD6470M独显,售价3899元
Llano A6以及A8处理器具备四核设计,融合的显示核心也更为强大,并支持范围更广泛的交火。其直接竞争对手就是i3以及i5平台,包括I+N组合。通过游戏、理论性能测试,其在DX11下,交火后可完全与I+N抗衡,但CPU处理性能偏弱,DX9以及DX10下表现较平庸,因此在主流应用面前依旧表现不是特别完美。
Acer 4560G,A6,HD6650M交火,4300元
上面这款就是Llano A6的典型交火机型,普遍40帧左右的游戏流畅度丝毫不输同价位I+N组合,甚至部分DX11游戏下还有领先趋势,适合游戏玩家朋友选择。
AMD在CPU领域和Intel相比性能差距较大,而GPU方面正好相反。在GPU越来越被重视的今天,AMD通过将处于劣势的CPU与处于强势的GPU相结合,很好的错开了Sandy Bridge的锐利刀锋,对“融合”、“加速”、“异构”等词汇做出了最准确诠释,在主流以及低端笔记本市场完美重现“田忌赛马”的经典故事,也为竞争对手指明了方向。
核芯显卡仅占Sandy Bridge的一小部分
GPU占用了APU大部分晶圆
明年,Intel将推出全新Ivy Bridge平台,22nm制程,并将核芯显卡的EP单元由12增加至16个,引入DX11、OpenCL等特性,以此提供类似的加速效果,这一举动无疑会缩短其与AMD在融合道路上的差距,但从物理规格提升幅度来看,GPU依旧不会成为IVB平台的重点,APU仍有机会。
Ivy Bridge部分特性(图片来自网络)
至于超便携移动设备领域,APU完胜Atom已成事实,但由于Windows 8操作系统引入了对ARM的支持,在这一领域最为强势的NVIDIA Tegra也必将杀入,并与Intel一起形成三足鼎立之势。至于其是否会对APU造成威胁还不得而知。
全文总结:
本文总结了AMD Fusion APU上市背景、主要特性、主要型号性能表现以及当前对应笔记本产品市场价格、适应人群以及对明年的简单预测。在融合道路上,AMD的眼光确实比较独特,第一时间抓住GPU在软件应用方面的重要作用并加以发挥,抢占低端及部分主流市场,获得成功。当然,这也和AMD是目前唯一同时掌握CPU与GPU核心技术的因素息息相关。
从现在掌握的信息看来,未来IVB依旧会留给APU一定市场份额,而Tegra要想抢夺市场也需等待Windows 8系统的发布。因此笔者相信短时间内APU是完全可以扛住这两大阵营带来的压力的。最后,愿APU在明年依旧大放异彩!■<