集显竟比独显快三倍!SNB转码深度测试
泡泡网显卡频道1月14日 近年来高分辨率、大屏幕是智能手机、平板电脑的发展方向。以苹果iPhone4/iPad为代表的高配置掌上娱乐设备,受到了全球用户的疯狂追捧。而它们最受欢迎的一大应用就是看视频:在公交车/地铁上别人都是百无聊奈,你却能观看最新的电影大片,那是何等的惬意。
但用高分辨率显示屏看低分辨率的视频那无疑是一种折磨,另外在格式方面,苹果仅支持H.264编码MP4封装的视频,很多掌上设备对流媒体的播放支持也不是很好,所以想要使用手持设备看视频的用户,必须将手头的影片经过重新编码封装之后,才能完美播放。
纯粹用CPU转码效率很低,目前而言,主流的视频编辑/转码应用软件,比如Badaboom、AVIVO、MediaShow等均使用了NVIDIA的CUDA和AMD的Stream技术来加速转码,俗称硬件转码。
新年伊始,Intel全新架构的处理器产品---SNB酷睿i系列处理器高调发布,而新的SandyBridge酷睿居然也号称可以硬转码(上一代的酷睿只能解码不能编码),并且性能上比传统的CPU+GPU联合转码更快!
Intel的突然介入让已经安定多年的二元世界变成了天下三分,引起了各界强烈的关注。下面小编就向大家详细介绍一下这位来自Intel的不速之客是什么来头,看看它在转码方面有没有资格和NV、AMD叫板。
Intel依然遵循着Tick & Tock的产品更新规律:Tock为核心架构更新,Tick为制造工艺更新。而SandyBridge核心的全新酷睿处理器属于核心架构更新的一代产品。
SandyBridge在Tick & Tock中处于Tock位置
SandyBridge酷睿在微架构上的改变是巨大的。新的三级缓存和内存控制器、分支预测、AVX高级矢量扩展指令、新增物理寄存文件、环形总线,这些都让SandyBridge较之上一代酷睿有了明显的进步,但总的来说SandyBridge最显著的改变则是革命性的整合GPU改进。
Intel以往的集显都给人一种鸡肋的感觉,高不成低不就,3D性能非常可怜,2D视频部分的功能也残缺不全,与NVIDIA和AMD的整合产品相比,差距非常大。
即便是上代的酷睿i系列核心,虽然将CPU和GPU封装在了一起,但实际物理架构和Core 2 + G45时代的模式并没有不同,只是通过45nm工艺、更多的着色单元和更高频率提升了些许性能,并没有实质意义上的创新。
而SandyBridge微架构当中GPU和CPU计算单元首次实现了无缝融合,SandyBridge GPU有自己的电源岛和时钟域,也支持Turbo Boost技术,可以独立加速或降频,整个芯片都使用了目前非常先进的32nm工艺制造并共享三级缓存。
显卡驱动可以控制和访问CPU三级缓存,这样图形数据就不用绕道去遥远而“缓慢”的内存了,这从根本上解决了总线带宽、接口带宽造成的瓶颈,将无谓的等待时间缩减到了最短。
所有这些改进加起来,SNB里每个EU的指令吞吐量都比现在的GMA HD显卡增加了一倍。 Intel将新一代的整合显卡命名为HD Graphics 3000和2000系列,其中3000拥有12个EU、2000拥有6个EU。
得益于每个EU吞吐量翻番、运行频率更高、共享三级缓存等特点,即使低端的HD Graphics 2000,都要比上代12个EU的GMA HD显卡强悍。而大家从首发测试中可以看到,甚至入门独显也不是HD Graphics 3000的对手!
从架构和规格来看SandyBridge的3D性能确实不容小觑,但大家知道转码性能受软件和指令的影响,和3D性能并没有必然的联系。下面通过1080i和720P的转码,我们可以看看相对于时下流行的CUDA和Stream转码,新酷睿集显的转码表现如何。
Cyberlink(讯连科技)旗下大名鼎鼎PowerDVD、MediaShow相信大家都非常熟悉,作为一家专注视频与多媒体的软件开发商,Cyberlink不久前推出了一款专业的快速视频转换软件——MediaEspresso,功能非常实用。
MediaEspresso 是一款同时支持CUDA、Stream加速,并且第一时间提供了对SandyBridge GPU支持的视频转换软件,它还对Intel Core i7处理器的超线程及SSE4指令集做了优化,因此无论纯CPU转码还是GPU加速,其速度比一般的传统软件快。
界面简洁明了,功能和操作方法一目了然,这就是MediaEspresso的最大特色,它主要针对手持设备或娱乐设备转换视频。其视频输出格式更多,没有局限于MP4这一种,在自定义分辨率和码率方面也非常灵活。
每种设备提供的分辨率、码率可调,软件能自动识别显卡是否支持CUDA或Stream,默认为开启。这种内置输出模式的设定对于初级用户来说非常方便,用户无需关心视频的画质及分辨率,软件缺省的模式是优化过的方案。
对于进阶玩家来说,点击下图新建按钮自定义转码更是非常给力,设置一次以后,下次再转码就可以直接用上次保存的配置了,而且脚本数量不限,方便多种手持设备。
▲ 清新简洁到极致的转码界面
MediaEspresso 6.5官方网站下载:
★ 测试视频的选择:两部具有代表性的视频
为了更加贴近广大用户日常操作时的应用,笔者选择了两段视频进行转码测试,考虑到一整部电影的转码时间太长不方便测试,因此我们选择用影片片段。
第一部为1280X720(720P)转iPhone 3GS(480X320),这个设定非常贴近喜欢给手机MP4等手持移动设备转视频的用户需要。转换后为H.264编码MP4封装。
第二部为1080i转720p,适合iphone4、ipad等高阶用户,或者想把高清视频压缩保存至DVD刻盘的那部分“光盘党”。1080p H.264编码M2TS封装,将其转换为720p H.264编码MP4封装。
★ CPU高端、主流各选一款
SSE最新指令集以及HT超线程技术的优化,让它如虎添翼,SNB酷睿4核8线程的Core i7可以说是当前压片的神器。
四核四线程的i5 2500K也是实力雄厚。
驱动中全部默认设置
★ NVIDIA、AMD入门独显齐上阵
显卡两大阵营的游戏性能PK屡见不鲜,而正儿八经的转码PK却是并不常见,此次对比的是Intel集显,所以选择了两款入门级独显作比较:公版的HD5550 GDDR3和GT430 GDDR3。
主板我们选择了微星的H67,因为都是LGA1155接口,所以一块主板就够了,加上2G X2 DDR3 1600组成双通道,避免出现瓶颈。
★ 720P(1280X720)转iPhone 3GS(480×320 H.264)MP4
成绩分为三个梯队。
第一梯队:i7 2600K+HDGraphics 3000、i5 2500K+HDGraphics 3000。SandyBridge 两款CPU以绝对的优势领先,400多M的720P仅仅用了17秒就完成了转码,仅仅是使用CUDA完美硬转码的GT430所用时间的一半左右。
第二梯队:GT430。因为可以用GPU编码、解码,所以三分多钟的视频用了不到40秒就搞定了,NVIDIA显卡转码速度也不错。
第三梯队:AMD HD5550和CPU软解。事实上MediaEspresso只能支持用Stream解码,而不能用它编码,所以对转码的速度提升非常有限,仅仅比CPU软解快了两秒。
得益于新酷睿强大的浮点运算能力,即使软解速度也不算太慢。测试过程中我们还发现,这款软件并不能榨干i7 2600K的潜力:事实上即使软解过程中,CPU占用率也不高。而且我们还发现这款软件目前只能用到4个(虚拟)核心,为此我们还特意关闭了超线程技术另行测试,但i7的成绩也没有明显提升。
★ H.264编码1080i转720p
Intel SandyBridge依然凭借架构的优势全面领先,而数据量庞大的1080i压720p的测试中,硬件解码的重要性陡增,AMD 和 NV的差距变小了。同时i7和i5也开始出现了性能差距。
在经过多个版本的进化之后,MediaEspresso显然已经比较成熟了,虽然还是难以榨干高端硬件的潜力,但是也没有出现明显的BUG,功能、易用性和转码速度相比以前版本也提高了不少,推荐更新。