泡泡网显卡频道 PCPOP首页      /      显卡     /      新闻    /    正文

成绩不是唯一!浅谈选择N卡的四大理由

    在各大显卡论坛里,总是会存在着两个群体的人,一个群体会一直鼓吹NVIDIA的显卡有多好,而另一个群体会鼓吹AMD的显卡有多优秀。这样的两个群体也被我们称之为N饭与A饭。但是,到底是N卡好还是A卡好呢,这一点可能没有一个真正意义上的准确答案,套用一句广告语:大家好才是真的好!

{imageTitle}

   不过整体来看,A卡在画质、高清这方面确实是强项,游戏性能方面两家可以说是各有千秋,而N卡更多的是多功能以及通用计算这方面,还有就是一些人性化的应用。想必有部分朋友已经看到了,NVIDIA最近在推广他们所谓的“[Geforce内功],威力四射”主题,不过目前还没有媒体对这几大主题进行比较详细的解说。今天笔者借此机会,顺便给大家讲讲。

{imageTitle}

    “[Geforce内功],威力四射”主题是NVIDIA第三季度制定的一套全球性的推广方案,方案的英文名称为NVIDIA Geforce,The Force Within,推广方案主要包括四个大方面,分别为NVIDIA Physx、CUDA、3D立体眼镜以及SLI多显卡系统。同时,各种语言版本的官方推广也面也正是上线,中文地址为http://www.nvidia.cn/content/forcewithin/cn/index.html,如果大家对英语感兴趣的话,也可以点击http://www.nvidia.com/content/forcewithin/us/index.html进行了解!

{imageTitle}

    值得注意的是,在“[Geforce内功],威力四射”官方推广页面上线的同时,还提供了GeForce Power Pack的下载服务,里面有不少好东西可以下载,包括:

1、最新版本的NVIDIA显卡驱动程序;

2、用GPU进行编码的Badaboom视频转换工具;

3、研究蛋白质折叠的分布式计算客户端Folding@homg

4、基于NVIDIA PhysX流体力学技术展示;

5、NVIDIA PhysX模拟技术展示;

6、Unreal Tournament 3游戏的PhysX补丁包;

7、Warmonger完整版游戏(支持物理加速);

8、Sneak Peak: Metal Knight Zero游戏Demo(支持物理加速);

9、Sneak Peak: Nurien游戏Demo(支持物理加速)。

    可以说,这个网页基本上就集合了当今NVIDIA的最新技术。从提供的这些下载项目来看,NVIDIA已经把CUDA应用和PhysX当作了推广的重中之重,SLI以及3D眼睛虽然也很重要,但没有什么具体可Demo或者下载的档案。

    说起PhysX,实际上这并不是NVIDIA自己开发的技术,不过是CUDA开发环境的一次最好的应用。为什么这么说呢,我们先来看看NVIDIA PhysX的前世今生你就会明白:

前言:AGEIA’s PhysX PPU

    游戏物理效果,这个在很多年前就被提及的东西,由于技术和价格等因素,一直未能实际的展现在大家眼前,也许没看过超逼真的物理效果的你并不会相信物理效果有多好,甚至认为这只是夸夸其谈,但不久的将来全世界都会认识到,不仅仅是AMDIntelNVIDIA这些巨头,数以千计的游戏开发商对物理效果的追求都将会证实,这不仅仅是未来的趋势,而是一种必然。

物理加速卡修成正果!NVIDIA收购AGEIA   物理加速卡修成正果!NVIDIA收购AGEIA
Ageia PhysX PPU

    AGEIA是全球先进家为游戏提供物理加速卡的公司,自2006以来,物理加速正在飞速发展,虽然与AGEIA最初的目标不同,现在的物理效果不仅仅表现在黑烟和爆炸上,更多的是为游戏提供更完美和逼真的图像效果。

物理加速历史

    从AGEIA的物理PPU出现以来,整个世界都在想如何利用PPU。直到2006年,整个世界对PhysX的认识都还不够,因此对物理加速的应用更是少之又少,但AGEIA公司并没有放弃,他们依然在幕后为扩大物理加速平台而努力。到了2006年初,PhysX SDK正式被引入到PlayStATIon 3的开发,06年晚些时候还和AGEIA公司签署了数十款游戏的开发协议,包括了著名的游戏----BioWare。而07年,PhysX超强效果终于被人们所广泛认知,PPU也迎来了一次新的春天,因而Unreal Tournament 3、Cell Factor: Revolution和Warmonger这些游戏都免费向玩家开放物理加速功能。

    在我们看来,当年Intel为了收购Havok而花了1.1亿对AGEIA来说真是太讽刺了,即便是Intel这种大公司,这次也是一笔大买卖。而Intel的这次收购也让AGEIA成为唯一一家物理技术公司,但当时AGEIA的物理加速并没有在业界有多大影响,而且作为Intel合作伙伴,AIT和NVIDIA不得不放弃AGEIA的PhysX加速,转而向Havok入手。

物理加速卡修成正果!NVIDIA收购AGEIA

    但似乎业界老大并不给面子,对于拿不到Havok FX授权的AMDNVIDIA来说,与其为了得到Havok FX而去用自己的热脸贴Intel的冷屁股,还不如考虑一下收购AGEIA,正是出于这样的考虑,先下手为强的NVIDIA突然宣布收购AGEIA,这样,在今年2月份的时候,新的全线GeForce平台GPU引入了AGEIA PhysX,“The Way It’s Meant To Be Played”计划使得7000多万块GPU将独占鳌头,无奈的AMD只能继续向Intel卑躬屈膝了。

拥有PhysX的GeForce

物理加速卡修成正果!NVIDIA收购AGEIA

    当得到ageia的physX技术之后,NVIDIA立刻开始了移植工作,旨在将之前需要PPU才能计算的编程GPU也能够计算,因为本来都是处理器,理论山是可以计算任何程序的,所以NVIDIA利用了自身CUDA的通用编程语言,仅仅一个月就将ageia的PhysX移植到了Geforce GPU显卡上面,并且为用户免费提供此服务,从此需要为GPU物理加速付费的时代结束了。凭借着GPU强劲的计算能力,NVIDIA PhysX很快就在关注度上超越了Intel的Havok,所以不得不说NVIDIA PhysX是一次非常巧妙的成功。

    显然,NVIDIA并购ageia这一次是完美的,不仅在自己物理加速方面巩固了地位,同时也向世人证明了CUDA的魔力,并且也让自家GPU有了更多的功能,可谓是一举多得。那么,PhysX到底有哪些应用呢?综合起来一句话——游戏!

{imageTitle}

    显卡发展的速度之所以达到了两倍于摩尔定律的速度,这完全是因为用户对游戏的体验一次一次的提高。而在过去的多年里,虽然游戏和显卡都有了很大的发展,一些游戏大作更是在画质方面都接近真实世界肉眼所看到的画面,但是在一些模拟真实物体运动的场景中还是表现的很假,根本不符合物理学上的物体运动轨迹,比如说物体的碰撞、爆炸产生的烟雾、火焰的燃烧、风吹草动的情景。虽然有一些游戏通过CPU来模拟了真实世界物体运动的效果,但是CPU的计算效能低下,即使最强劲的CPU也难以带来满意的效果,一直未能得到大规模的应用。

比最强CPU快七倍!GPU物理加速全解析

    NVIDIA PhysX的出现改变了这一切,让物理加速不再依靠CPU和GPU,而是靠计算能力非常强劲的GPU。GPU是完完全全基于多线程的并行计算处理器,相当于每一个Shader就是一个核心,再加上GPU的复杂程度远远超过CPU,所以即使是一款低端的GPU产品,在物理加速处理方面都完全可以和最优异的CPU媲美。

{imageTitle}

    目前利用NVIDIA GPU模拟物理计算的游戏还不能算特别的多(虽说不多目前也有150多个游戏支持了),当然这并不是NVIDIA PhysX支持面小,而是很大一部分游戏厂商还没有来得及开发使用GPU物理加速的游戏。大家知道游戏的开发是一项非常艰巨的过程,如果游戏本身的引擎扩展性较差,要想使游戏支持物理加速,可能需要完全重新编写代码。

    所谓的物理计算,就是完全模拟真实世界的物体运动计算,而物理加速则是能尽可能的在速度上和真实世界的物体运动场景一致,那么到底物理加速能给我们带来什么样的效果,什么样的显卡物理加速性能更好呢?

比Crysis还BT!3DMark Vantage初测试

    3DMark Vantage通过特技飞行的拉烟飞机碰撞气囊来模拟物理效果,这些拖着长长尾巴的飞机会撞到大型充气囊上面,尾气的互相干涉、飞机撞坏的过程。虽然此程序本来是基于CPU物理计算进行开发,但目前NVIDIA的GPU也完全可以参与计算。

比最强CPU快七倍!GPU物理加速全解析

    根据我们之前的测试,如果使用QX9770 CPU搭配当今千元级的主流显卡9800GTX+,在3DMark Vantage中的物理加速测试中,相对于单颗QX9770性能提高了七倍之多。

迈进55nm新纪元!9800GTXPlus权威测试
UT3中豪华的物理加速场景(冰雹的运动轨迹是看点)

    Unreal Tournament 3(虚幻竞技场3)是率先支持GPU物理加速的游戏之一,这款游戏赖以成名的不是游戏本身,而是大名鼎鼎的《虚幻3》引擎,它可以说是优异DX9C游戏引擎,也能支持一些DX10特效,由于华丽的效果、出色的硬件兼容性、及超高的执行效率,为很多游戏公司所青睐,目前基于虚幻3引擎的各类游戏已经超过了100款!

比最强CPU快七倍!GPU物理加速全解析

    同样,在我们的测试中,9800GTX+显卡开启物理加速之后比不开启物理加速的帧率提高了22帧,性能提升幅度高达40%。

    我们再来看看国外媒体的测试:

{imageTitle}

{imageTitle}

    可以看出,GPU的物理加速计算在效能上确实要远远领先CPU,而这方面NVIDIA又走在了前面,AMD虽然和Havok合作,但在短期内也不会推出基于GPU物理加速的方案。这一切都一切都是NVIDIA PhysX的功劳,并且全部均免费提供给用户使用,大家只需要购买NVIDIA的显卡即可得到这一切。我们应该感谢这样一个伟大的公司!

●豪华的NVIDIA PhysX效果赏析

NV+物理卡非常好的![幽灵行动2]全面评测

{imageTitle}

超越3D的性能!PhysX加速游戏全面测试

超越3D的性能!PhysX加速游戏全面测试

超越3D的性能!PhysX加速游戏全面测试

    经过多年成倍式增长,GPU的性能已经达到了可观的高度,但是显卡却总在玩游戏的时候才被大家想起,难道这么强大的计算能力仅仅是为了满足游戏玩家?显然,GPU已经不满足应用领域的狭隘,利用自身强大的计算能力向传统电脑的核心CPU提出了挑战!

● CUDA显威力 并行计算时代来临

    大家都知道,显卡的硬件规模远远要比CPU更加复杂,早在多年前就有人构想利用显卡强大的硬件规模实现其他方面的计算,但是一直没有大规模的实现。而现在NVIDIA开发了CUDA编程环境,任何用户都可以通过CUDA开发包,开发出利用显卡来计算的程序。

{imageTitle}

    简单的说,CUDA就是显卡处理通用计算的一个接口,曾经只能执行图形渲染的GPU终于可以处理其他方面的计算。并且,显卡进行通用计算还有一个最大的优势,那就是并行计算。我们先来看看什么是串行计算,什么又是并行计算:

    串行计算是指在单个中央处理器单元上对数据进行处理,并行计算是相对于串行计算来说的,其在时间和空间上都比串行计算效率更高,时间上的并行就是指流水线技术,而空间上的并行则是指用多个处理器并发的执行计算。

开创视觉计算帝国GTX280/260权威评测

    CPU就是串行计算的代表,当然我们也看到其向并行计算发展的趋势,比如目前的双核、四核CPU。但是,CPU永远也无法跟上显卡的发展速度,比如NVIDIA前一段时间发布的9800GTX Plus拥有128个流处理器,也就是相当于128核同时并发性的计算,可以想象其计算能力有多强大。

    当然,并不是说CPU就完全没用,今后的PC主要还是CPU与GPU搭配使用,CPU+GPU的计算就是我们所谓的异构计算。

又一代高清专用卡:NVIDIA 9400GT简测
CUDA的应用涉及到各行各业

    实际上,我们前面讲到的NVIDIA PhysX也是NVIDIA CUDA的一次应用,利用CUDA,NVIDIA将本来只能在CPU或者是专门的PPU上才能计算的物理加速移植到了GPU上来计算,让计算性能有了大幅度的提升。很显然,CUDA是GPU历史上一次伟大的变革。

开创视觉计算帝国GTX280/260权威评测

    2007年6月20日,NVIDIA发布了专为科学计算而生的Tesla,用GPU展现了个人超级计算的新纪元,实际上这同样是CUDA的功劳。NVIDIA将强大的GPU应用于地球科学、分子生物学和医学诊断领域的高性能计算为实现重大的发现提供了可能,这些发现可能会改变数十亿人的生活。

CUDA:一个以GPU为中心的运算平台

    Tesla只是NVIDIA的触角伸出传统GPU应用领域的开始,NVIDIA的野心是要打造一个以GPU为中心的运算平台——CUDA!这是Compute Unified Device Architecture的简称,也是NVIDIA树立的一个新的行业标准和未来趋势。

开创视觉计算帝国GTX280/260权威评测

    实际上,早在两年前发布G80系列显卡时,NVIDIA就已经预告了CUDA的到来。CUDA是世界上第一个针对GPU的C语言开发环境,可以充分应用GPU上众多流处理单元强大的浮点运算能力,解决复杂的科学运算问题。该环境目前仅支持NVIDIA GeForce 8/9系列显卡以及相应的Quadro专业显卡。根据NVIDIA的测试,GeForce 8800显卡在CUDA架构中的峰值运算能力可达520GFlops,因此如果构建SLI双卡系统,可以达到1TFlops,即每秒运算1万亿次的强大运算能力。

开创视觉计算帝国GTX280/260权威评测

    CUDA要承担的任务是让显卡可以用于图像计算以外的目的,它是一个完整的GPGPU解决方案,采用C语言作为编程语言来使用GPU强大的硬件资源。C语言目前是大学的必修课程,已经国际上普及程度最高的计算机编程语言,所以CUDA大大降低了GPU应用的门槛,大家都可以用C语言写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结构。

    使用GPU而不使用CPU从事科学计算的原因除了GPU在性能表现上更有优势外,还不能忽略GPU相对CPU低廉的价格。和高端的CPU售价比起来,GPU简直太便宜了,目前9600GT只要八百元,更高的8800GT也才一千元出头,而一颗入门的四核CPU就要上千元。

开创视觉计算帝国GTX280/260权威评测

    目前GPU已经是足够强大的可编程处理器,非常适合大运算量的科学应用,诸如地质勘探,生物学,流体力学,金融建模等等。通过CUDA技术,所有开发人员都能够使用标准的C语言,挖掘NVIDIA GPU中多个处理单元强大的并行计算能力。

● 使用GPU进行视频转码 比CPU快18倍

    如今大家的手机普遍支持视频播放,但是视频却需要从电脑上进行重新编码以便让视频的分辨率和码率达到手机或则移动播放设备所支持的要求。高端用户也面临类似的问题,许多高清视频也需要经过压制成为DVDrip或则Rmvb以适合不同需要的人群。

开创视觉计算帝国GTX280/260权威评测

    传统的视频编码软件完全依赖CPU的计算能力,即便换上相当不错的高端CPU,一部高清视频重新编码所需要的时间往往数倍与视频本身的播放时间,这让用户苦不堪言。现在基于CUDA开发出的GPU视频编码工具却能将“压片”效率提升接近20倍!

开创视觉计算帝国GTX280/260权威评测

    使用主频1.6GHz的双核CPU配合集成显卡压制一部两小时长的高清视频需要10小时22分,如果换用主频高达3GHz四核CPU可以将市价缩短到5小时33分。有了基于CUDA开发的GPU编码程序,1.6GHz的双核CPU配合9600GT显卡只需要49分钟即可完成编码,搭配上旗舰显卡GTX280则仅需要35分钟。

{imageTitle}

    NVIDIA联合Elemetal制作了名为BadaBOOM Media Converter的视频转换工具,可以将众多的视频格式转换成直接能在PSP、iPhone等流行手持数码设备上播放的视频格式。软件基于CUDA开发,最大限度的利用GPU加速。

    NVIDIA表示,BadaBoom使用GPU进行视频转换,其效率可以达到CPU的数倍甚至数十倍以上。前几天我们在GTX 280的首发测试中,对其进行了测试,将NV利用Autodesk MAYA软件制作的首部动画《The Plush Life》转换成能成iPhone标准的视频,使用GTX 280进行编码,整个过程仅仅用了22秒,而使用当今最优异的四核心CPU进行软件编码,整个过程用了110秒。当然,除了GTX280这样的怪兽级显卡之外,CUDA同样可以应用在低端显卡上,即使是前一段NVIDIA发布的9400GT,视频编码速度都完全超越了CPU编码的速度。

    癌症无疑是当今世界上最恐怖的疾病,面对这样的疾病,人类几乎是毫无办法。但是你是否知道,很多癌症病毒都是因为人体内蛋白质的错误折叠所造成,比如阿尔茨海默氏病、囊肿性纤维化等。所以研究蛋白质的折叠就成了医学界一大重要的任务。

{imageTitle}

    最好的研究方法莫过于使用模拟研究,但是对蛋白质这样复杂的生物学,想要模拟起来谈何容易,即使是世界上优异的电脑,也难以满足模拟蛋白质折叠的性能需求,所以唯一的办法就是采用分布式计算。

迈进55nm新纪元!9800GTXPlus权威测试

    简单的说,分布式计算就是将一个计算项目通过互联网分配给每一个在线的计算机,利用计算机数量多这样一个优势,来进行超大数据的处理计算。Folding@home就是这样的一个项目,专门用计算机来模拟蛋白质的折叠运算。最早Folding@home只能支持用户使用CPU进行计算,在2006年推出了GPU的客户端,不过只能支持ATI的显卡,如今通过CUDA,NVIDIA也加入到了Folding@home阵营。

开创视觉计算帝国GTX280/260权威评测

    凭借着Geforce GPU强劲的计算能力,GTX280显卡可以在一天内模拟超过650纳秒的蛋白质折叠,而HD3870只能达到大约170纳秒,PS3仅仅100纳秒,四核心处理器更是不过4纳秒。这就是说,GTX280在这方面的性能是四核处理器的160多倍。Folding@home小组领导、斯坦福大学助理教授Vijay Pande称,即使全球NVIDIA CUDA显卡用户中只有1%参与到这一项目中来,也能让Folding@home迅速成为全球最强大的高性能计算系统,处理能力可达60-80PFLops。

● 医疗行业应用:CT立体化且提速20倍

    CT是一种功能齐全的病情探测仪器,它根据人体不同组织对X线的吸收与透过率的不同,应用灵敏度极高的仪器对人体进行测量,然后将测量所获取的数据输入电子计算机,电子计算机对数据进行处理后,就可摄下人体被检查部位的断面或立体的图像,发现体内任何部位的细小病变。

开创视觉计算帝国GTX280/260权威评测

    使用CUDA开发的软件,让GPU代替CPU去处理数据,可以得到和以往的2D成像不一样体验的3D图片。GPU的超强计算能力使得处理器数量无需太多,可以让计算机的体积大大减小,原先大量的CPU才能完成的计算量,四颗GPU就足矣,且速度还要快上20倍。

● 地理信息系统应用:速度提升可达50倍

    地理信息系统(Geographic InformATIon System,GIS)是在计算机硬、软件系统支持下,对整个或部分空间中的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。

开创视觉计算帝国GTX280/260权威评测

    使用基于CUDA开发的软件配合CPU使用效果远胜传统的CPU运算,速度可以提升10-50倍,科学家可以更为快捷及时的掌握环境数据,无论是资源管理还是灾害预防都会更为快速有效。

● 期货风险控制系统:性价比提升9倍

开创视觉计算帝国GTX280/260权威评测

    通过大型计算机系统控制期货交易中的实时风险,有人工控制和事后控制所不具备的优势。Hanweck联手Volera对在实时应用中的整个美国期货买卖风险进行评估,分别使用GPU和CPU搭建计算能力相同服务器系统,最终GPU使用了12颗,而CPU使用了600颗。使用600颗CPU服务器占用了使用12颗GPU服务器的九倍空间!整套装置花费成本达到了GPU服务器的六倍!而维护和使用CPU服务器一年的开销高达同计算能力GPU服务器的九倍!

● 生命科学研究:等待时间缩短12倍

开创视觉计算帝国GTX280/260权威评测

    美国国家癌症研究所的测试表明,使用CUDA编写的程序配合GPU运算,使他们以前的等待计算机得出结果的时间由原来的2小时缩短熬了10分钟,效率提升达12倍。科学家们表示,更快的计算速度有助于他们加快新药物的开发,诸如治疗癌症、阿尔茨海默氏症,艾滋病毒感染、疟疾等。

● CAD设计:实时服装物理效果

    传统的CAD设计虽然能画出漂亮的时装,但如果不生产出样品通过真人试穿就无法了解到整体效果。这就需要繁琐的工序,以及相应人力物力的投入。

开创视觉计算帝国GTX280/260权威评测

    现在可以通过CUDA编写的CAD程序让计算能力强大的GPU去模拟整个试衣过程,衣物的材质和光泽都可以完全拟真,并且实时演算出衣服在各种人体动作后的物理效果,包括光线变化、褶皱、形变等。这让以往的设计软件望尘莫及,使CAD设计者更有效率。当然,一切的关键还是靠CUDA开发出的软件配合GPU。

● MATLAB仿真:加速17倍

    在国内也被称作《矩阵实验室》的Matlab以其强大的矩阵计算以及仿真能力成为科研人员的必备工具。目前已经有CUDA开发出来的Matlab插件可以调动GPU对软件进行加速。

开创视觉计算帝国GTX280/260权威评测

    在用其进行基于伪谱方法的均匀各向同性湍流直接数值模拟测试中,分别使用Core2 Duo 2.4GHz和8800GTX去进行数值分析,从同一时间成像截图上可以明显看出GPU的优势,CPU成像速度比CPU快了17倍。

    随着人们对虚拟世界视觉要求的进一步提高,单纯的依靠提升画面质量已经遇到了瓶颈,因为在2维的世界里,总是无法给人们带来真正意义上的立体感。于是,NVIDIA开始在3维画面开始研究,终于在前一段时间举办的NVISION08大会上,发布了一款3D Stereo眼睛,用户带上个特殊的眼镜后,就可以体验到立体效果的震撼。

NVIDIA 3D立体显示技术进入实用阶段
眼镜看起来非常酷

{imageTitle}

    我们的记者在NVISION 08大会现场体验了这款3D立体眼镜,表示在一些表面起伏较大的游戏,效果更好。比如说帝国时代3表现就非常逼真,而虚幻3则稍微差一些。

{imageTitle}

{imageTitle}

    与这种3D Stereo配套的还有一个红外线发射器,在发射器上用户可以控制显示器的景深以及开启或者关闭立体效果,这一切都通过红外线与立体眼镜同步。

    需要注意的是,这项技术还需要支持3D Ready的显示器或者是刷新率120MHz的显示器,虽然目前还没有透露该眼镜的零售价格,但是相信不会太贵。同时,该项技术需要占用一定的GPU资源。<

    虽然显卡的性能越来越强劲,但是仍然有一些骨灰级的玩家,连最优异的显卡都无法满足他们的需求,于是显卡PCI-E接口开始普及的时候,NVIDIA就引入了SLI双卡互联技术,当时显卡还普遍在Geforce 6时代。

{imageTitle}

    随着显卡的发展,关于SLI的技术也有了一次又一次的升级。不仅是双路SLI,三路甚至四路的SLI系统都出现在了人们的面前。

{imageTitle}

    虽然说SLI不可能给一款显卡带来成倍的性能提升,但是如果游戏和驱动程序都支持的比较好的话,性能提升90%也非常正常。

{imageTitle}

    目前在NVIDIA高端显卡上,最具有竞争力的可以算的上是三路SLI系统了。在性能提升幅度上,三路SLI系统表现的也非常好,完全不会像AMD的CrossFireX一样,GPU越多,提升的幅度就越小。


读者投票:

NVIDIA四大GPU内功中,你最看好哪一种?
NVIDIA PhysX物理加速
CUDA GPU通用编程接口
3D Stereo立体眼镜
SLI多卡互联技术
 
<
0人已赞

关注我们

泡泡网

手机扫码关注