泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

集显竟比独显快三倍!SNB转码深度测试

    泡泡网显卡频道1月14日 近年来高分辨率、大屏幕是智能手机、平板电脑的发展方向。以苹果iPhone4/iPad为代表的高配置掌上娱乐设备,受到了全球用户的疯狂追捧。而它们最受欢迎的一大应用就是看视频:在公交车/地铁上别人都是百无聊奈,你却能观看最新的电影大片,那是何等的惬意。

    但用高分辨率显示屏看低分辨率的视频那无疑是一种折磨,另外在格式方面,苹果仅支持H.264编码MP4封装的视频,很多掌上设备对流媒体的播放支持也不是很好,所以想要使用手持设备看视频的用户,必须将手头的影片经过重新编码封装之后,才能完美播放。

让CUDA/Stream汗颜!SNB转码深度测试

视频转码

    纯粹用CPU转码效率很低,目前而言,主流的视频编辑/转码应用软件,比如Badaboom、AVIVO、MediaShow等均使用了NVIDIA的CUDA和AMD的Stream技术来加速转码,俗称硬件转码。

让CUDA/Stream汗颜!SNB转码深度测试

    新年伊始,Intel全新架构的处理器产品---SNB酷睿i系列处理器高调发布,而新的SandyBridge酷睿居然也号称可以硬转码(上一代的酷睿只能解码不能编码),并且性能上比传统的CPU+GPU联合转码更快!

    Intel的突然介入让已经安定多年的二元世界变成了天下三分,引起了各界强烈的关注。下面小编就向大家详细介绍一下这位来自Intel的不速之客是什么来头,看看它在转码方面有没有资格和NV、AMD叫板。

    Intel依然遵循着Tick & Tock的产品更新规律:Tock为核心架构更新,Tick为制造工艺更新。而SandyBridge核心的全新酷睿处理器属于核心架构更新的一代产品。

Intel VS NVIDIA VS AMD SandyBridge转码测试

    SandyBridge在Tick & Tock中处于Tock位置

    SandyBridge酷睿在微架构上的改变是巨大的。新的三级缓存和内存控制器、分支预测、AVX高级矢量扩展指令、新增物理寄存文件、环形总线,这些都让SandyBridge较之上一代酷睿有了明显的进步,但总的来说SandyBridge最显著的改变则是革命性的整合GPU改进。

    Intel以往的集显都给人一种鸡肋的感觉,高不成低不就,3D性能非常可怜,2D视频部分的功能也残缺不全,与NVIDIA和AMD的整合产品相比,差距非常大。

    即便是上代的酷睿i系列核心,虽然将CPU和GPU封装在了一起,但实际物理架构和Core 2 + G45时代的模式并没有不同,只是通过45nm工艺、更多的着色单元和更高频率提升了些许性能,并没有实质意义上的创新。

SandyBridge

    而SandyBridge微架构当中GPU和CPU计算单元首次实现了无缝融合,SandyBridge GPU有自己的电源岛和时钟域,也支持Turbo Boost技术,可以独立加速或降频,整个芯片都使用了目前非常先进的32nm工艺制造并共享三级缓存。

    显卡驱动可以控制和访问CPU三级缓存,这样图形数据就不用绕道去遥远而“缓慢”的内存了,这从根本上解决了总线带宽、接口带宽造成的瓶颈,将无谓的等待时间缩减到了最短。

SandyBridge

SandyBridge

    所有这些改进加起来,SNB里每个EU的指令吞吐量都比现在的GMA HD显卡增加了一倍。 Intel将新一代的整合显卡命名为HD Graphics 3000和2000系列,其中3000拥有12个EU、2000拥有6个EU。

    得益于每个EU吞吐量翻番、运行频率更高、共享三级缓存等特点,即使低端的HD Graphics 2000,都要比上代12个EU的GMA HD显卡强悍。而大家从首发测试中可以看到,甚至入门独显也不是HD Graphics 3000的对手!

   从架构和规格来看SandyBridge的3D性能确实不容小觑,但大家知道转码性能受软件和指令的影响,和3D性能并没有必然的联系。下面通过1080i和720P的转码,我们可以看看相对于时下流行的CUDA和Stream转码,新酷睿集显的转码表现如何。

    Cyberlink(讯连科技)旗下大名鼎鼎PowerDVD、MediaShow相信大家都非常熟悉,作为一家专注视频与多媒体的软件开发商,Cyberlink不久前推出了一款专业的快速视频转换软件——MediaEspresso,功能非常实用。

    MediaEspresso 是一款同时支持CUDA、Stream加速,并且第一时间提供了对SandyBridge GPU支持的视频转换软件,它还对Intel Core i7处理器的超线程及SSE4指令集做了优化,因此无论纯CPU转码还是GPU加速,其速度比一般的传统软件快。

    界面简洁明了,功能和操作方法一目了然,这就是MediaEspresso的最大特色,它主要针对手持设备或娱乐设备转换视频。其视频输出格式更多,没有局限于MP4这一种,在自定义分辨率和码率方面也非常灵活。

再一次颠覆一切!SandyBridge转码测试

    每种设备提供的分辨率、码率可调,软件能自动识别显卡是否支持CUDA或Stream,默认为开启。这种内置输出模式的设定对于初级用户来说非常方便,用户无需关心视频的画质及分辨率,软件缺省的模式是优化过的方案。

    对于进阶玩家来说,点击下图新建按钮自定义转码更是非常给力,设置一次以后,下次再转码就可以直接用上次保存的配置了,而且脚本数量不限,方便多种手持设备。

再一次颠覆一切!SandyBridge转码测试

▲  清新简洁到极致的转码界面

MediaEspresso 6.5点击下载:

MediaEspresso 6.5官方网站下载:

★ 测试视频的选择:两部具有代表性的视频

    为了更加贴近广大用户日常操作时的应用,笔者选择了两段视频进行转码测试,考虑到一整部电影的转码时间太长不方便测试,因此我们选择用影片片段。

    第一部为1280X720(720P)转iPhone 3GS(480X320),这个设定非常贴近喜欢给手机MP4等手持移动设备转视频的用户需要。转换后为H.264编码MP4封装。

    第二部为1080i转720p,适合iphone4、ipad等高阶用户,或者想把高清视频压缩保存至DVD刻盘的那部分“光盘党”。1080p H.264编码M2TS封装,将其转换为720p H.264编码MP4封装。

 

CPU高端、主流各选一款

再一次颠覆一切!SandyBridge转码测试

    SSE最新指令集以及HT超线程技术的优化,让它如虎添翼,SNB酷睿4核8线程的Core i7可以说是当前压片的神器。

再一次颠覆一切!SandyBridge转码测试

四核四线程的i5 2500K也是实力雄厚。

再一次颠覆一切!SandyBridge转码测试

驱动中全部默认设置

 NVIDIA、AMD入门独显齐上阵

    显卡两大阵营的游戏性能PK屡见不鲜,而正儿八经的转码PK却是并不常见,此次对比的是Intel集显,所以选择了两款入门级独显作比较:公版的HD5550 GDDR3和GT430 GDDR3。

    主板我们选择了微星的H67,因为都是LGA1155接口,所以一块主板就够了,加上2G X2 DDR3 1600组成双通道,避免出现瓶颈。

★ 720P(1280X720)转iPhone 3GS(480×320 H.264)MP4

再一次颠覆一切!SandyBridge转码测试

    成绩分为三个梯队。

    第一梯队:i7 2600K+HDGraphics 3000、i5 2500K+HDGraphics 3000。SandyBridge 两款CPU以绝对的优势领先,400多M的720P仅仅用了17秒就完成了转码,仅仅是使用CUDA完美硬转码的GT430所用时间的一半左右。

    第二梯队:GT430。因为可以用GPU编码、解码,所以三分多钟的视频用了不到40秒就搞定了,NVIDIA显卡转码速度也不错。

    第三梯队:AMD HD5550和CPU软解。事实上MediaEspresso只能支持用Stream解码,而不能用它编码,所以对转码的速度提升非常有限,仅仅比CPU软解快了两秒。

    得益于新酷睿强大的浮点运算能力,即使软解速度也不算太慢。测试过程中我们还发现,这款软件并不能榨干i7 2600K的潜力:事实上即使软解过程中,CPU占用率也不高。而且我们还发现这款软件目前只能用到4个(虚拟)核心,为此我们还特意关闭了超线程技术另行测试,但i7的成绩也没有明显提升。

★ H.264编码1080i转720p

再一次颠覆一切!SandyBridge转码测试

   Intel SandyBridge依然凭借架构的优势全面领先,而数据量庞大的1080i压720p的测试中,硬件解码的重要性陡增,AMD 和 NV的差距变小了。同时i7和i5也开始出现了性能差距。

    在经过多个版本的进化之后,MediaEspresso显然已经比较成熟了,虽然还是难以榨干高端硬件的潜力,但是也没有出现明显的BUG,功能、易用性和转码速度相比以前版本也提高了不少,推荐更新。

<

    从上面的测试中我们可以看出,虽然Intel虽然初涉视频硬件转码,但是以绝对的优势胜出,在转码领域耕耘多年的NV和AMD难道真是如此不济么?这里面是否存在猫腻?

    Intel的显卡目前还仅仅在集显上试水,从某种程度上说,还是刚刚起步,自然不会有成熟的通用计算方案,那SandyBridge为何能自如硬件转码,甚至在和NV、AMD产品对比测试中脱颖而出呢?

    这就是SandyBridge的神奇之处,原来在HD Graphics当中集成了一个独立的媒体处理器,专门负责视频解码、编码的媒体处理器单元。

SandyBridge

    Intel的媒体处理器是一个固定的功能单元,既能解码又能编码,这个小模块囊括了与视频处理相关的一切功能,因此尽管SandyBridge 酷睿转码性能优异,但工作过程中 GPU着色单元处于闲置状态,CPU部分的负载也不高。

SandyBridge

    SandyBridge的解码器接管了MPEG-2、VC-1、H.264三大高清视频的所有解码步骤,将CPU和GPU的负载降至最低。这样SandyBridge虽然没有通用计算技术,却可以轻松实现硬件视频解码。

SandyBridge

    当然,SandyBridge GPU内部的EU就相当于是可编程的流处理器,配合相应的软件,也可以实现类似于NVIDIA CUDA和AMD Stream的流处理器加速技术,从而进行视频编码加速。

    经过本次测试,我们发现强大的SNB到来,的确让转码应用领域重新洗牌,多领域的竞争,让NV和AMD的时间越来越少,总的来说未来有下面几个发展趋势。

● Intel强势介入,转码多极化发展

    目前Intel已经和多家知名的软件开发商合作,发布了支持Intel集显加速的视频播放软件和视频转码软件,其中包括大名鼎鼎的CyberLink PowerDVD和MediaShow Espresso、ArcSoft的MediaConverter还有CoreDVD。

SandyBridge

    SandyBridge发布后,Intel的目光瞄准了传统GPU通用计算在桌面的应用领域。虽然实现的方法有所不同,但在视频编码方面,目前Intel的确已经超越了AMD的Stream,至少在部分软件中有绝对的优势。当然,新酷睿支持的软件数量和转码片源兼容性和CUDA相比,还是有很大差距。

● 转码方式不同,建议各取所需

再一次颠覆一切!SandyBridge转码测试

    对比转码得到的影片,笔者并没有看出明显的质量差别,但个别同事认为软解得到的影片质量最高,其次是通用计算,再次是SandyBridge GPU硬转码得到的影片,当然这种说法暂时还无法科学验证。

    如果是为手持设备转码压片,则完全不用考虑影片质量问题,因为在屏幕较小的手持设备上根本看不出来区别,而一些追求完美的玩家就另当别论了。

● SNB强大但CUDA和Stream前途依然光明

    总得来说,显示芯片的性质类似 stream processor,适合一次进行大量相同的工作,CPU 则比较有弹性,能有效完成少量但是复杂的工作。

   采用Stream和CUDA的入门独显在本次测试中完全不敌拥有全新专业编码单元的sandyBridge,在两项测试项目中均告惨败。原因只有一个——SNB太强大了!超高的转码速度和超低的CPU、GPU占用率(意味着低功耗),对经常需要压片转码的玩家来说,新酷睿简直就是为他们量身打造的优品神器!

只有CPU与GPU强强联手,才能让电脑性能腾飞起来

    但是通用计算的前景依然光明。事实上目前GPGPU已经在科学研究和超级计算领域取得突破性进展,随着数百万支持CUDA的GPU已经遍布全球计算机,软件开发人员、科学人士和研究人员正在利用CUDA探测到更多更广的领域中:包括图像和视频编辑、计算生物学和计算化学、流体力学模拟、CT图像重组、地震分析、光线追踪以及其它更多。

    在桌面领域,视频转码速度受制于硬件带宽和软件支持,显卡英雄无用武之地。但将来等总线带宽提升,指令优化以后,GPU强大的并行处理优势必然可以更好的体现,这可以让转码速度有质的飞跃,届时一个多媒体编码单元显然无法与之相提并论。■<

0人已赞

关注我们

泡泡网

手机扫码关注