泡泡网主板频道 PCPOP首页      /      主板     /      评测    /    正文

GF9300秒杀E7400! 整合主板也玩CUDA

    [泡泡网主板频道8月25日] 整合芯片组也支持CUDA技术?E5300+GF9300的组合竟然完胜E7400?在看过数量众多的显卡CUDA的文章后,你有没有想过其实主板也能玩CUDA?


    780G芯片组的推出可以说是整合芯片组的一次大革命,整合的显示核心终于不再是性能低下的代表,而硬解高清视频等功能的实现也满足了大部分用户对显示核心的要求。板载显存后也可以在中低画质下玩转流行游戏。不过硬件发展速度非常快,听着使用独立显卡的用户讨论什么CUDA、并行计算,还用着整合主板的用户不免有些不平衡,其实大可不必如此,因为,整合主板也可以支持CUDA技术。

    在看过很多介绍CUDA的文章后,很多用户应该都会有这个问题,整合芯片组是否支持这项技术,如果支持其性能表现又如何?笔者这次就对整合主板的CUDA性能进行了一次测试。测试之前,先来一起了解一下什么是CUDA技术。

    最初的GPU只是在进行3D渲染时才会起作用,大部分时间我们其实都浪费了这部分性能资源。尽管很早就有人想到利用显卡这强大的硬件规模实现其他方面的计算,但是一直没有大规模的实现。而现在NVIDIA开发了CUDA编程环境,任何用户都可以通过CUDA开发包,开发出利用显卡来计算的程序。

{imageTitle}

    简单的说,CUDA就是显卡处理通用计算的一个接口,曾经只能执行图形渲染的GPU终于可以处理其他方面的计算。并且,显卡进行通用计算还有一个最大的优势,那就是并行计算。我们先来看看什么是串行计算,什么又是并行计算:

    串行计算是指在单个中央处理器单元上对数据进行处理,并行计算是相对于串行计算来说的,其在时间和空间上都比串行计算效率更高,时间上的并行就是指流水线技术,而空间上的并行则是指用多个处理器并发的执行计算。

开创视觉计算帝国GTX280/260权威评测

    CPU就是串行计算的代表,当然我们也看到其向并行计算发展的趋势,比如目前的双核、四核CPU。但是,CPU永远也无法跟上显卡的发展速度,比如NVIDIA前一段时间发布的9800GTX Plus拥有128个流处理器,也就是相当于128核同时并发性的计算,可以想象其计算能力有多强大。

    当然,并不是说CPU就完全没用,今后的PC主要还是CPU与GPU搭配使用,CPU+GPU的计算就是我们所谓的异构计算。

又一代高清专用卡:NVIDIA 9400GT简测

CUDA的应用涉及到各行各业

    实际上,NVIDIA PhysX也是NVIDIA CUDA的一次应用,利用CUDA,NVIDIA将本来只能在CPU或者是专门的PPU上才能计算的物理加速移植到了GPU上来计算,让计算性能有了大幅度的提升。很显然,CUDA是GPU历史上一次伟大的变革。

开创视觉计算帝国GTX280/260权威评测

    2007年6月20日,NVIDIA发布了专为科学计算而生的Tesla,用GPU展现了个人超级计算的新纪元,实际上这同样是CUDA的功劳。NVIDIA将强大的GPU应用于地球科学、分子生物学和医学诊断领域的高性能计算为实现重大的发现提供了可能,这些发现可能会改变数十亿人的生活。

   

    Tesla只是NVIDIA的触角伸出传统GPU应用领域的开始,NVIDIA的野心是要打造一个以GPU为中心的运算平台——CUDA!这是Compute Unified Device Architecture的简称,也是NVIDIA树立的一个新的行业标准和未来趋势。

开创视觉计算帝国GTX280/260权威评测

    实际上,早在两年前发布G80系列显卡时,NVIDIA就已经预告了CUDA的到来。CUDA是世界上第一个针对GPU的C语言开发环境,可以充分应用GPU上众多流处理单元强大的浮点运算能力,解决复杂的科学运算问题。该环境目前仅支持NVIDIA GeForce 8/9系列显卡以及相应的Quadro专业显卡。根据NVIDIA的测试,GeForce 8800显卡在CUDA架构中的峰值运算能力可达520GFlops,因此如果构建SLI双卡系统,可以达到1TFlops,即每秒运算1万亿次的强大运算能力。

开创视觉计算帝国GTX280/260权威评测

    CUDA要承担的任务是让显卡可以用于图像计算以外的目的,它是一个完整的GPGPU解决方案,采用C语言作为编程语言来使用GPU强大的硬件资源。C语言目前是大学的必修课程,已经国际上普及程度最高的计算机编程语言,所以CUDA大大降低了GPU应用的门槛,大家都可以用C语言写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结构。

    使用GPU而不使用CPU从事科学计算的原因除了GPU在性能表现上更有优势外,还不能忽略GPU相对CPU低廉的价格。和高端的CPU售价比起来,GPU简直太便宜了,目前9600GT只要八百元,更高的8800GT也才一千元出头,而一颗入门的四核CPU就要上千元。

开创视觉计算帝国GTX280/260权威评测

    目前GPU已经是足够强大的可编程处理器,非常适合大运算量的科学应用,诸如地质勘探,生物学,流体力学,金融建模等等。通过CUDA技术,所有开发人员都能够使用标准的C语言,挖掘NVIDIA GPU中多个处理单元强大的并行计算能力。

    说了这么多,好像CUDA只适合科学计算等领域,和普通用户似乎没什么太大关系。事实当然不是这样,CUDA在民用领域也已经有了很广泛的应用。其中最受关注的就是视频编码应用,由于GPU目前强大的运算能力,比CPU性能提升最高可达18倍。

    如今手持数码设备已经非常普及,手机、PSP等普遍支持视频播放,但是视频却需要从电脑上进行重新编码以便让视频的分辨率和码率达到手机或移动播放设备的要求。高端用户也面临类似的问题,许多高清视频也需要经过压制成为DVDrip或则Rmvb以适合不同需要的人群。

开创视觉计算帝国GTX280/260权威评测

    传统的视频编码软件完全依赖CPU的计算能力,即便换上相当不错的高端CPU,一部高清视频重新编码所需要的时间往往数倍于视频本身的播放时间,这让用户苦不堪言。现在基于CUDA开发出的GPU视频编码工具却能将“压片”效率提升接近20倍!

开创视觉计算帝国GTX280/260权威评测

    使用主频1.6GHz的双核CPU压制一部两小时长的高清视频需要10小时22分,如果换用主频高达3GHz四核CPU可以将时间缩短到5小时33分。而有了基于CUDA开发的GPU编码程序,1.6GHz的双核CPU配合9600GT显卡只需要49分钟即可完成编码,搭配上高端的GTX280则仅需要35分钟。

{imageTitle}

    NVIDIA联合Elemetal制作了名为BadaBOOM Media Converter的视频转换工具,可以将众多的视频格式转换成直接能在PSP、iPhone等流行手持数码设备上播放的视频格式。软件基于CUDA开发,最大限度的利用GPU加速。稍后我们的测试也会涉及到这款软件。

    而在Badaboom之后,免费的Mediacoder也应用了CUDA技术,而且Mediacoder有着完全支持中文,支持文件格式丰富等Badaboom没有的优势。在我们对独立显卡的CUDA测试中,这两款软件已经是常客了。不过今天,它们的任务是验证芯片组集成显示核心的CUDA性能。

泡泡网MB.PCPOP.COM评测室

硬件系统配置

处理器

Intel E5300 (45nm 2.6GHz/2MB/LGA775)

Intel E7400 (45nm 2.8GHz/3MB/LGA775)

主板

昂达 N7AS(MCP7A芯片组)

硬盘

希捷 7200.7   80GB

内存

三星 DDR2-800  1GBx2

电源

ENERMAX ELT620AWT-ECO

显卡

集成(Geforce 9300)

显示器

AOC 177Si

软件系统配置

操作系统

Windows 7 RTM 7600 32BIT

    集成GPU设置:由于CUDA要求至少256MB显存,笔者在BIOS里设置共享显存为最大的512MB,以减少可能出现的瓶颈。

    测试软件:视频转码是目前CUDA在民用领域最为热门的应用,笔者这次也是基于此来测试整合芯片组的CUDA性能。所用的软件为Badaboom和Mediacoder,两者均是从网上下载的最新版本。

    测试方法:Mediacoder支持CPU单独转码和CPU+GPU联合转码,而Badaboom则是纯GPU转码。测试时用Mediacoder分别测试E7400软解、E5300软解和E5300+GF9300联合转码的性能。Badaboom则只进行了CPU占有率的测试。

    测试视频:两段视频,一部为MPEG格式,分辨率704 X 480,另一部为720P的MKV封闭视频,分辨率1280 X 720。两部视频均转换为iPod和iPhone支持的MP4 X.264编码文件,分辨率为480 X 272,码率1500Kbps。

    主板采用了NVIDIA的MCP7A芯片组设计,内置GF9300显示核心,支持LGA 775接口45nm双核/四核处理器,支持800/1066/1333MHz前端总线,支持DX10特效并且支持NVIDIA的CUDA技术。

   

    供电系统方面,主板CPU供电部分采用了4相供电设计,搭配固态电容和全封闭式电感,能够有效地保障处理器的稳定供电。内存插槽方面,主板提供了4条DDR2内存插槽,支持双通道DDR2 667/800内存。最大支持8GB容量。

   

    扩展插槽方面,主板提供了1个PCI-E x16插槽,支持Hybrid Power和Hybrid SLI功能,还提供了1个PCI-E x1插槽和2个PCI插槽。硬盘接口方面,主板配备了6个SATA II接口和1个IDE接口。

    背板接口的设计,主板提供了齐全的显示接口设计,包括HDMI、VGA和DVI接口。同时主板还提供了光纤接口和同轴接口,用户可以链接更丰富的多媒体设备。此外还提供了PS/2鼠标键盘接口,4个USB接口和1个RJ45接口。

    了解了这次测试的主角,PK正式开始!

    现在诸如iPhone、iPod这类手持设备非常流行,在地铁上也经常能看到用此类设备看视频的用户,所以这次笔者也选择将视频转换成流行的iPod格式。

    转码速度对比:下面就来看看三种测试方法下的速度对比。首先是视频一的成绩。依次是E7400软解,E5300软解,E5300+GF9300转码。

转码所用时间:139秒

转码所用时间:156秒

转码所用时间:90秒

    可以看到,CUDA技术展现出强大的实力,本来单纯以CPU能力转换,E5300比E7400慢17秒,而在加入GF9300的帮助后,时间骤减到90秒,比E7400快了49秒,将近一分钟。要知道这仅仅是一个长度不到5分钟的视频,对于那些经常需要转换长视频的用户来说,CUDA又能帮助节省多少时间?

    再来看看720P转iPhone视频的表现,这部分笔者只进行了E7400软解和E5300+GF9300转换的对比。

E7400转换时间:260秒

E5300+GF9300转换时间:127秒

    127秒对比260秒,GF9300的加入使得整个平台提升了一倍性能,直接秒杀了E7400。CUDA技术让GPU的强大性能可以利用在日常应用中,让资源不再闲置。

    看来整合芯片组集成的显示核心也可以支持CUDA技术,并且有效地提高转换速度。我们再来看看转换视频时CPU的占有率,这次测试加入Badaboom。

Mediacoder只使用CPU转码:CPU占有率基本为100%

Mediacoder使用CPU+GPU转码:CPU占有率在80%左右

Badaboom使用GPU转码:CPU占有率在10%以下

    根据我们的测试,Badaboom在视频转换的速度上要比Mediacoder慢,这主要是因为两者在转换时走的是不同路线。Badaboom几乎是纯利用GPU转码,CPU闲置,这么做的优势在于可以一边转换一边做其它工作。而Mediacoder则会把能利用到的资源都利用上,CPU+GPU都处于很高的负载下,以达到最快的转换速度。

    尽管GF9300显示核心的流处理器只有16个,但这次测试表明,借助CUDA,即使是整合主板也能发挥出强大的威力。而使用NV整合主板的用户也不用再羡慕那些拿着独立显卡的用户,他们能玩的CUDA整合主板也能玩。

    随着CUDA技术的成熟和支持软件的增多,CUDA技术的应用必定不会仅仅局限在视频转码方面,像视频解码,视频处理等以往需要高性能CPU才能运行流畅的应用也开始支持CUDA,带来的好处就是我们不必再使用昂贵的CPU同时忍受着缓慢的速度,CUDA可以用更低的成本带来更好的体验。

又一代高清专用卡:NVIDIA 9400GT简测

支持CUDA的软件越来越丰富

这块支持CUDA的集成主板报价只有599元

    随着支持CUDA软件的增多,未来我们可以在各个领域享受到CUDA带来的好处。而所有这些,并不需要你付出太多成本,以本次测试为例,400多元的E5300加一块599元的主板就完全可以体验到这一先进技术,同时速度的提升也是非常明显的。

开创视觉计算帝国GTX280/260权威评测

    可以想像在不远的将来,CPU和GPU可以更好地协同工作,各自在擅长的领域发挥最大效能。而据消息透露,NVIDIA还会继续推出Intel和AMD平台的芯片组,这也意味着用户仍可以使用整合主板来体验这一先进技术。■<

0人已赞

关注我们

泡泡网

手机扫码关注