称霸千元以下!主流级GTS450权威评测
泡泡网显卡频道9月13日 2010年3月27日NVIDIA正式发布了首批基于GF100核心并支持DX11的旗舰级产品——GTX480/GTX470。这两款产品并不是像竞争对手那样对上一代的构架进行小修小补,而是从设计之初就专门针对DX11图形API进行了大量优化。因此GTX480/GTX470凭借全新“真DX11构架”,在整体性能以及执行效率方面大幅领先于竞争对手的产品,使NVIDIA再次夺回了单核心性能王者的宝座。
尽管夺取了DX11的王者宝座,但由于GTX480/GTX470的核心实在过于庞大,使得发热量及功耗有所偏高,导致了在玩家中口碑不佳。NVIDIA只能通过大打价格战的方式扰乱高端市场,最终收效甚微。
高端市场的失利令NVIDIA迫切的需要打开千元左右的主流市场,在1个月后NVIDIA总算拿出了一款令玩家们为之惊叹的产品——GTX460。这款产品采用了全新的GF104核心,核心内部结构相比之前的GF100做了进一步优化,大大提升了晶体管的执行效率。在保证性能的同时大幅精简晶体管数量,令发热量及功耗大为下降,同时使产品的整体成本也得到了很好的控制,因此GTX460成为千元级市场的首选。
在取得了千元级市场的初步胜利之后,今天NVIDIA又发布了面向于主流级市场的产品——GTS450,那么这款产品的出现将能否延续之前GTX460的成功呢?废话不多说,下面就让我们全方位的了解一下这款产品!
GTS450采用了GF106核心,这款核心是继GF100和GF104之后NVIDIA的第三颗DX11 GPU。那么这款核心在构架方面究竟有何特点?核心规格又将如何呢?为了能够让大家更加深入的了解这款核心,小编还是从NVIDIA第一款DX11产品——GF100开始讲起!
从G80到GF100核心,转眼间NVIDIA采用通用渲染构架的显卡已经发展到了第四代。此前在DX10时代,NVIDIA对于GPU图形架构的改进十分有限,G92/GT200相对于G80也只是强化了并行计算架构,虽然对流处理器的排列组合做了一些微调,但整体架构没有本质变化。而到了DX11时代,NVIDIA认为旧的架构已经不适合新技术和新游戏的需要,有必要对GPU架构进行大幅度的改进、甚至是重新设计。
为GT200架构添加DX11和Tessellation支持是很容易的
实际上G80和GT200的架构也是非常优秀的,ATI即便有DX10.1的辅助,同时代产品都没能占得任何便宜。ATI沿用R600的架构推出了DX11产品,按理说NVIDIA为GT200添加DX11支持也不是什么难事,性能也不会差,那为什么NVIDIA不这样做呢?
因为NVIDIA发现了GPU新的瓶颈:从NV30到GT200核心,GPU的渲染能力提升了150倍,但几何性能的增长居然连3倍都不到!这个问题此前未能得到重视,因为游戏中的几何图形转换大多交给CPU来计算,而到了DX11时代,新增的Tessellation技术对GPU几何图形处理能力提出了新的要求,此时如果继续沿用上代架构显然会制约DX11性能,成为新的瓶颈!
GTX480的几何性能达到GTX285的8倍之多!
于是GF100架构应运而生了,NVIDIA没有像对手那样以新瓶装旧酒的方式加入DX11支持,而是将整个GPU架构推倒重来,完全针对DX11的特性而优化设计。GF100核心被划分为模块化设计,整颗核心拥有4个Raster Engine(光栅化引擎)和16个PolyMorph Engine(多形体引擎),从而保证了新一代的架构拥有十几倍于上代产品的几何性能和曲面细分能力,确保新一代产品拥有最强的DX11性能。
有了高端产品撑腰之后,中低端产品的设计思路就非常简单了,架构已经定型,无需再做什么修改,基本上就是把规格砍为1/2、1/4这样一级级减下去,一系列产品都诞生了。
按理说,NVIDIA也应该会把GF100核心的主要规格全部减半,从而制造出一颗拥有256SP 256bit的主流核心。事实上之前国内外的媒体都是这样猜测的,因为GF100模块化四核心的设计,很容易将其“拆分为”规模大小不一的中低端核心。
乍一看,GF104就是GF100被一刀切成两半的规模,但请大家仔细看看到底有何不同?这里提醒大家一下:完整的GF100核心拥有512个CUDA核心,完整的GF104核心拥有384个CUDA核心,显然GF104核心并非是GF100一半的规格,NVIDIA在微观架构方面做了不小的改动。
大家可以注意看GF100芯片透视图,其中间位置有1/3的面积,这些是GF100一体式的二级缓存。NVIDIA为了提升GPU并行计算的效率,像CPU那样不惜成本的设计了大容量L2。L2对于性能的贡献主要集中在密集型计算任务当中,而对于普通的图形渲染来说,贡献就非常小了。那么如果将这些L2的容量进一步压缩,把节约出来的晶体管都变成CUDA核心的话,那么图形渲染性能将会得到显著提升。
GF104的SM要比GF100“胖”一些,CUDA核心横向扩张
于是,拥有较小L2、较多CUDA核心的GF104就诞生了,新核心每组SM中包含CUDA核心的数量从32个增至48个,增加了50%,流处理器总数达到了384个。NVIDIA在晶体管数一定的情况下,通过优化核心与缓存的配比,制造出了一颗实力超乎预期的核心。
纹理单元数量加倍
当然,NVIDIA也没有单纯增加CUDA核心的数量,针对GF100核心的不足之处也做了较大的改进——纹理单元数量加倍!
GF100核心的每组SM当中拥有32个CUDA核心,还包括了4个纹理单元,这样GF100总共就拥有64个纹理单元(GTX480屏蔽了一组是60个),远少于Cypress的80个纹理单元。较少的纹理单元使得GTX400系列在大量使用了纹理贴图的游戏中表现不佳,最有代表性的游戏就是《孤岛危机》。
GF104核心只有8组SM,如果还是保持GF100的设计不变,那么纹理单元将只有32个,还没有HD5770多(40个)。所以NVIDIA对纹理单元部分也做了改良,每组SM中的数量直接加倍,最终GF104拥有64个纹理单元,与GF100相等!
由上面我们对NVIDIA两款DX11核心的介绍不难看出,GF100核心的综合能力较为平均,不仅拥有非常强劲的游戏性能并且在通用计算领域也拥有不俗的表现。而随后推出的面向于千元级价位GF104核心,尽管在核心规模上有所缩减,但核心内部针对游戏进行了专门优化,在晶体管下降的同时保证了游戏性能。
前面我们已经讲过GF100及GF104模块化的设计,很容易将其“拆分为”规模大小不一的中低端核心。而今天所发布GF106核心就可以看作是单核版的GF104核心。
通过架构图来看,GF106核心无论流处理器簇、纹理单元还是显存控制器部分都只有GF104的一半,也就是说流处理器、纹理单元、一二级缓存、显存控制器全部减半。而GF104很像是由两颗GF106组合而成的核心。
今天所发布的GTS450就是首款基于GF106核心的产品,拥有192个流处理器、32个纹理单元,显存位宽为128bit 1GB GDDR5,和竞争对手的HD5770相同。由于定位于主流级,因此显卡仅支持双路SLI。频率方面最终定为核心875MHz、流处理器1750MHz。
尽管NVIDIA的官方文档表示GTS450的核心采用了完整版的GF106核心,但小编综合之前泄露的Forceware驱动、PCB的显存空焊位以及核心上的编号,三方面因素推断出GTS450并非使用完整版的GF106核心,而完整版的GF106将采用192bit的显存规格。
在上月泄露的一款Forceware驱动当中,我们发现了五款新显卡,从型号数字上来看,他们的定位都要低于GTX460,售价自然在千元以内。而通过有限的资料小编了解到GTS450之上还有一款型号为GTS455的显卡,这款显卡很有可能将是GTS450的完整版,但也并不排除GTS455是GF104阉割版的可能。
通过观察显卡PCB上的显存空焊位不难发现,GTS450正反两面共有4颗GDDR5空焊位。由显卡本身8颗GDDR5显存对应着128bit的规格可以推断出,如果将显存全部焊满GTS450就具有192bit的显存带宽(如果核心显存控制器未受限制的话)。
GTX460 768M的核心编号与显存的对应关系
从核心编号上推断,GTS450的核心编号为GF106-250-KA-A1,A1代表第一代40nm工艺;250数字大小代表核心流处理器数量的多寡;其中KA则代表了阉割哪一组显存控制器,因此从这一方面也可以判断出GTS450确实阉割了一组显存控制器。
一直以来每当NVIDIA发布新品时都会顺便发布与之对应的新版本驱动,而在新驱动中都会或多或少的加入一些新的元素。随着今天GTS450新品的发布,NVIDIA也拿出与之对应的260系列新驱动,那么这个系列驱动究竟有什么新特性呢?下面让我们一睹为快!
260系列驱动在安装界面部分做了很大的改进,用户可以自行选择快速安装或者自定义安装。在安装过程中,安装程序会自动检测是否存在老版本驱动,并对其进行卸载。
在3D Vision Surround设置界面中引入了更加人性化的UI交互界面,使用户操作起来更加得心应手。
在高清播放输出部分,260系列驱动完善了音频回放功能,首次使GF10x核心支持次时代音频源码输出。同时开放了对3D蓝光输出设备的授权,用户可以将任何规格的3DTV通过HDMI 1.4线缆连接至显卡,即可实现3D蓝光的支持。
在3D Vision方面,260系列驱动包中将集成3D Vision驱动,免去了用户单独下载的烦恼。同时还针对《黑手党2》、《星际2》以及《三位一体》进行了特别优化。另外,新驱动还加入了对Sony 3D移动全景照片格式的支持。
介绍完GF106核心架构和新驱动的技术特点之后,下面我们就来看看基于GF106核心首款显卡GeForce GTS 450的庐山真面目!
公版GTS450从外观上看采用了和之前公版GTX460相同的设计风格,不过显卡上的贴纸更为美观。由于GF106核心发热较小,没必要非得使用侧吹风道式结构将所有热量排出机箱外,使用散热效率更高的直吹式结构更有利于控制风扇转速和噪音。
取下散热器之后我们可以发现,散热片部分为太阳花式结构,其中一半热风可以被排出机箱外,另一半将残留至机箱内。直吹式结构还有个好处就是风扇可以辅助显存、供电和PCB散热。
输出接口部分,GTS450与之前的公版产品完全相同,都是两个Dual-Link DVI搭配一个Mini HDMI接口。由于PCI挡板空间实在没有位置,所以才勉为其难的设计了一个小HDMI。现在GTS450已经可以支持通过HDMI输出未经压缩的次世代音轨,在功能上与HD5000系列没有区别。
公版GTS450由于定位于主流级市场,因此PCB并未采用象征着高端的黑色PCB,而是采用了常见的绿色。显卡做工整体看上去较为中规中矩,显存部分的空焊点似乎在为以后是否存在高规格版本埋下了伏笔。
GF106核心是NVIDIA DX11核心中第一款不带“铁盖”的核心,同时核心也回归普通的正方形,可以兼容更多的散热器产品。
显存为常见的三星GDDR5颗粒,0.5ns的规格理论频率为4000MHz,一般情况下可以超至4000MHz,但想要冲击更高频率就难了。目前NVIDIA的GDDR5显存控制器还是没有AMD做得好,冲击高频率难度较大。
供电部分与GTX460接近,采用了3相核心以及1相显存供电设计。供电MOS管则采用了日系厂商瑞萨LFPAK产品,LFPAK封装MOS管具有体积更小、效率高、性能更强等优点,其次LFPAK的散热效率非常高(近于零的超低热阻),还能从封装的顶部分散热量,为加装散热片辅助散热奠定了基础。
翔升GTS450金刚版从外观上看,依然延续了金刚系列的“重金属”风格,增强了产品本身的卖点。这款产品完全采用了非公版设计方案。在用料部分全部采用了日化固态电容以及铁素体全封闭电感。
华硕GTS450显卡采用黑色的非公版PCB。该款显卡在出厂前已经将核心频率超频到925MHz,流处理器的频率也相应的提升到了1850MHz,显存频率为4000MHz,相对公版产品有所提高。
七彩虹在本次一共送测了两款GTS450产品,这两款产品全部基于公版设计,不过其中一款散热器搭配了豪华的AURAS四热管散热器,并且采用了两个ENERMAX风扇,为极限超频奠定了基础。
耕昇作为全球最大的显卡生产商之一同德旗下的自有品牌,绝大部分产品都出自同德之手。这款GTS450也不例外,采用同德提供的非公版PCB方案,红黑的搭配色彩搭配使得这款显卡卖相非常不错。
影驰GTS450在外观上借鉴了超酷的银河战舰设计风格,使产品本身颇具卖点。这款产品完全采用了非公版设计方案。在用料部分全部采用了日化固态电容以及铁素体全封闭电感。
技嘉GTS450这款产品采用了技嘉独立研发的海蓝色PCB,此外在散热方面也有所加强,采用了特别订制的双热管双风扇散热器,令散热效果大大加强。
映众送测了两款GTS450产品,这两款产品同样采用了公版的设计方案,但在散热方面都有不同程度的加强,其中冰龙版GTS450采用了AC四热管双风扇的散热器,理论上可以进一步加强超频能力。
微星GTS450同样采用了公版PCB设计,不过在散热方面用所加强,采用了微星称之为“Cyclone”的散热设计,该设计方案与公版GTX460散热器内部结构有些相似,都采用了铜底座+双热管设计,不过这款产品散热器尺寸有所增大。
昂达GTS450完全采用了与公版相同的设计,PCB采用了象征高端的黑色PCB,在用料方面相比公版产品变化不大。
旌宇GTS450依然采用了公版设计方案,同样在散热部分有所增强,采用了AC三热管双风扇散热器。另外PCB也采用了黑色PCB,使产品本身颇具卖相。
索泰GTS450完全采用了公版的设计风格,在供电部分的用料有所加强,电感采用了R30超薄贴片式电感,供电MOS管则仍然采用了日系厂商瑞萨LFPAK产品。
铭瑄GTS450黑武士采用非公版设计,散热搭配方面采用了和传统风扇安装在散热片上不同,安装在上盖的风扇倒挂在散热片上,与散热片分离,能够大大减少风扇震动带来的噪音,而且使风扇转子远离高温工作环境,延长风扇寿命。
<
对于主流级的显卡,这次测试并没有使用最优异的平台,而是选择了中高端主流的Core i7 + P55平台,性能并不输给三通道X58平台,价格便宜不少而且功耗发热很低,搭配千元价位的显卡非常合适。 GTS450的官方指导价为999元,但从NVIDIA官方得知这款产品主要是为了替代目前的GTS250,成为HD5750的新一代对手。因此在测试中我们加入了GTS250与HD5750的成绩进行参考。另外为了使测试更加客观公正,我们还加入了相同价位的HD5770。 ● 测试平台主板介绍 微星的P55-GD65主板采用Intel P55单芯片芯片组设计,支持采用LGA 1156接口设计的Intel Core i7/i5处理器。标准ATX大板型设计,供电部分采用豪华热管散热。供电部分,采用了8相供电设计,搭配高品质全固态电容以及全封闭电感,可以保证处理器供电的稳定,供电部分采用豪华的热管散热。主板内存插槽部分,提供了4条DIMM内存插槽,支持双通道DDR3 1333/1066内存规格,最大扩展容量达16GB。
游戏介绍:Unigine Engine率先发布了首款DX11测试/演示程序——Heaven Benchmark,其中大量运用了DX11新增的技术和指令,看来在新版3DMark面世之前,Heaven将会是DX11性能测试的非常好的选择。 画面设置:2.0版本进一步强化了Tessellation技术的应用,细分精度更高,画面更上一层楼,测试时所有特效全开最高,包括Extreme级别的Tessellation。 测试方法:自带Benchmark,由于该Benchmark测试条件非常严酷,开启8xAA后几款显卡都性能暴跌没有可观赏性,因此只测试4AA16AF模式下的性能。 ● 分辨率1680x1050,抗锯齿4x,各项异性过滤16x Heaven 2.0的测试过程比较漫长,总共有多达26个场景(视角),因此实时FPS波动曲线比较密集。从三款显卡的波形图上可以看到Tessellation性能偏弱的HD5770和HD5750在复杂场景中性能下滑相当明显。 ● 分辨率1680x1050,抗锯齿4x,各项异性过滤16x 最终的测试结果可想而知,两款ATI显卡不仅平均帧数明显落后于GTS450,最低帧数也仅为GTS450的一半左右。这个测试项目充分暴露出了ATI显卡Tessellation性能偏弱的软肋。 游戏介绍:《科林麦克雷》系列游戏是为纪念去世的英国拉力赛车手科林·麦克雷(Colin McRae)而制作的,因此在游戏过程中不难见到许多麦克雷过往的身影。与一年一款的优品系列赛车游戏不同,DiRT2距离前作已经两年之久,目前《科林麦克雷:尘埃2》主机版早已上市,几乎登陆所有的主机和掌机平台、好评如潮,而PC版由于支持DX11的缘故,所以被延期数月。 画面设置:DIRT2堪称DX11游戏代表作,DX11的五大关键特性在这款游戏中都有体现,但却没有得到大范围的应用,都是点到为止。比如Tessellation主要体现在水洼和旗帜上,而赛车过程中也就那么几处采用了该技术,因此这款DX11的要求并不高,特效全开的话中端显卡都能跑动。 测试方法:游戏自带Benchmark程序,会自动跑完一个固定的赛道,非常接近于真正玩游戏的模式,最后得出平均FPS和最小FPS。 ● 1680x1050分辨率,抗锯齿4x 《尘埃2》是首个支持DX11的游戏,不过所运用到的DX11特效并不是很全面,因此对于显卡的性能要求并不是很高。三款显卡大部分时间的帧数都在35-45帧左右波动,但在画面中出现大量游戏单位时,A卡帧数波动较大。 ● 1680x1050分辨率,抗锯齿4x ● 1440x900分辨率,抗锯齿4x 《尘埃2》作为AMD官方赞助并力挺的DX11游戏大作,A卡自然具备一些先天优势。由测试成绩可以看到GTS450的平均帧数与HD5750相当,略低于HD5770。但最低帧数却远远高于两款显卡,由此不难看出GTS450可以在保证游戏流畅的前提下,使游戏运行得更加稳定。 游戏介绍:《Aliens vs. Predator》同时登陆PC、X360和PS3,其中PC版因为支持DX11里的细分曲面(Tessellation)、高清环境光遮蔽(HDAO)、计算着色器后期处理、真实阴影等技术而备受关注,是AMD大力推行的游戏之一,但是这样的主题难免让本作有很多不和谐的地方,暴力血腥场面必然不会少!发行商世嘉在2009年11月就曾明志,表示不会为了通过审查而放弃电子娱乐产品发行商的责任,因为游戏要维持“异形大战铁血战士”这一中心主题,无论画面、玩法还是故事线都不能偏离。 画面设置:AVP原始版本并不支持AA,但升级至1.1版本之后,MSAA选项出现在了DX11增强特效当中,当然还支持Tessellation、HDAO、DirectCompute等招牌。该游戏要求不算太高,所以笔者直接将特效调至最高进行测试。 测试方法:游戏自带Benchmark ● 1680x1050分辨率,抗锯齿4X 《Aliens vs. Predator》是首批支持DX11的游戏之一,但相比前面的《尘埃2》加入了更多DX11特效,对显卡性能有一定的要求。因此当测试画面中出现了N个异型以后,三款显卡都有些吃不消。 ● 1680x1050分辨率,抗锯齿4X ● 1440x900分辨率,抗锯齿4X 这又是一款AMD力推的DX11游戏大作,但A卡在这个测试项目中已经没有任何优势。GTS450明显领先于HD5750,并与HD5770持平。 游戏介绍:《战地:叛逆连队2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。开发商EA已经于本月2日正式同步发售了Xbox 360、PS3、PC版。该游戏是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连队》的直接续作,在继承前作特性的基础上,强化了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。 画面设置:《叛逆联队2》虽然是款DX11游戏,霜寒引擎也是备受期待的DX11引擎,曾被ATI用来做Tessellation的技术展示。不过最新版本的对DX11的支持非常有限,仅仅是采用新指令集渲染HBAO特效而已,游戏会自动侦测显卡的DX级别来选择渲染模式。 测试方法:游戏不带Benchmark,笔者选取了单人任务模式下的一段无需手动干涉的过场动画进行测试,其中包括大量激烈的轰炸爆破激战场面,完全可以反映真实的游戏性能。 ● 1680x1050分辨率,抗锯齿4x,各项异性过滤16x 由于《叛逆联队2》的霜寒引擎对DX11的支持非常有限,因此对显卡的要求并不是很高。可以看到在此项测试中A卡的曲线波动依然较大。 ● 1680x1050分辨率,抗锯齿4x,各项异性过滤16x ● 1440x900分辨率,抗锯齿4x,各项异性过滤16x 从前面的测试中小编似乎看到了一些规律,只要是对DX11支持不是很多的游戏,A卡均能保持一个较好的帧数。这款游戏也不例外,GTS450的平均帧数略低于HD5770,但最低帧数依然远远高于HD5770。也就是说GTS450可以保证这款游戏稳定运行,但HD5770则会偶尔出现卡的情况。 游戏介绍:2010年5月18日,XBOX 360上又首发了《失落星球》的续作《失落星球2》。根据介绍,《失落星球2》的游戏舞台是前作故事发生后十几年之后经过温暖化改变的EDN-3rd,这里将新增丛林等新场景,主人公也并非前作那样为一人,而是以“雪贼”们不同的视点展开故事。 画面设置:与前作相同,《失落星球2》采用CAPCOM公司原创引擎MT Framework的最新版VER.2.0进行开发,游戏世界的表现将更加细致和美丽。而不仅仅是画面上的进化,本作将会在前作玩家要求基础上追加大量全新要素,新场景、新角色、新武器等自不必说,角色的动作也比前作更加丰富多彩。 测试方法:游戏自带Benchmark ● 1680x1050分辨率,抗锯齿4x 《失落星球2》是NVIDIA主推的一款游戏,因此N卡在此次测试中充分发挥了主场优势。从曲线图上可以看到,GTS450的发挥比较稳定,明显优于ATI的两款显卡。 ● 1680x1050分辨率,抗锯齿4x ● 1440x900分辨率,抗锯齿4x 《失落星球2》采用的MT Framework引擎充分运用到了各种DX11特效,因此对显卡有着较高的要求,从最终结果可以看到DX11性能偏弱的A卡再次惨败。 游戏介绍:《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作,也是DX11游戏的新成员。该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。 画面设置:《地铁2033》虽然支持PhysX,但对CPU软件加速支持的也很好,因此使用A卡玩游戏时并不会因PhysX效果而拖累性能。该游戏由于加入了太多的尖端技术导致要求非常BT。 测试方法:游戏不带Benchmark,笔者选取了单人任务模式下的一段片头动画进行测试,这段画面虽然不是战斗场景并不激烈,但已经让高端显卡不堪重负了。 ● 1680x1050分辨率,抗锯齿4x ● 1680x1050分辨率,抗锯齿4x ● 1440x900分辨率,抗锯齿4x
当今最强的GTX480和HD5970在特效全开的情况下运行地铁2033都比较勉强,那么GTS450自然是无法流畅运行的。所以这里的测试成绩只能反映其性能水平,对于实际玩游戏却没有代表价值。 游戏介绍:游戏引擎开发商bitSquid与游戏开发商Fatshark近日联合公布了一个展示DX11强大技术的DEMO。这个名为《StoneGiant》(石巨人)的DEMO,可以让玩家来测试自己PC显卡的DX11性能。bitSquid Tech即将提供PC平台的引擎,并且大概在今年第三季度将提供PS3和Xbox 360等其他平台的引擎。 画面设置:StoneGiant是一款技术演示Demo,画面做的非常精美,进入之后可以选择开启关闭Tessellation以及DOF(DX11级别景深)进行测试,这两项技术都十分消耗资源,尤其是同时打开时。其中Tessellation技术对画质的改善最为明显,而DOF如果不细看则不容易察觉,因此测试时默认开启Tessellation、分别打开和关闭DOF进行两次测试。 测试方法:游戏自带Benchmark。 ● 1920x1200分辨率,不开景深 看得出来,A卡的“压力”确实很大,DX11特效使用的越多,其表现就越差,这就是架构问题,因为HD5000依然沿用了第一代DX10显卡HD2000的架构,已经满足不了纯DX11游戏的需要了。 ● 1920x1200分辨率,不开景深 由测试成绩可以看到即使面对严酷的DX11渲染GTS450依然能够得心应手,平均帧数达到27帧,远远高于ATI的两款显卡。 游戏介绍:自《孤岛惊魂》系列的版权被UBI购买之后,该公司蒙特利尔分部就已经开始着手开发新作,本作不但开发工作从Crytek转交给UBI,而且游戏的故事背景也与前作毫无关系,游戏的图形和物理引擎由UBI方面完全重新制作。 画面设置:借助于蒙特利尔工作室开发的全新引擎,游戏中将表现出即时的天气与空气效果,所有物体也都因为全新的物理引擎,而显得更加真实。你甚至可以在游戏中看到一处火焰逐渐蔓延,从而将整个草场烧光!而且首次对DX10.1提供支持,虽然我们很难看到。 测试方法:游戏自带Benchmark工具。 ● 分辨率1680x1050,抗锯齿4x 《孤岛惊魂2》的测试时间比较短暂仅仅不到1分钟,因此我们波形图中的采样点比较稀疏。从图中可以看到GTS450的帧数明显领先于其他两款显卡,并且帧数波动比较平缓。 ● 分辨率1680x1050,抗锯齿4x ● 分辨率1920x1080,抗锯齿4x GTS450在FarCry2中的表现相当令人满意,帧数远远高于两款A卡,并且最低帧数已经超过HD5750并接近于HD5770。 游戏介绍:《鹰击长空》由Ubisoft旗下的Bucharest Studio工作室所研发制作而成,以汤姆克兰西最擅长的近现代国际冲突为背景,加上现代化的军事武器,和五角大厦不愿证实的开发中的先进武器,交织出最激烈的高科技攻防战。而《鹰击长空》也脱离前面几项作品的框架,将战争从地面拉拔到空中,享受广大无界限的战斗空间。 画面设置:《鹰击长空》直接内置了对DX10和DX10.1的支持,它会自动检测显卡最高能支持的级别。通过此前的测试来看DX10.1并不会让画质变得更高,但的确能够让游戏跑得更快。我们使用1920分辨率,4AA和8AA两种模式进行测试。 测试方法:游戏自带Benchmark,AN双方都开启DX10.1模式。 ● 分辨率1680x1050,抗锯齿4x 《鹰击长空》同样也是ATI曾经主推的一款游戏,不过由测试结果可以看到A卡在主场已经发挥失利,被GTS450完全超越。 ● 分辨率1680x1050,抗锯齿4x ● 分辨率1920x1080,抗锯齿4x A卡再次落后于N卡,不过落后幅度没有FarCry2那么夸张,其中GTS450领先HD5750已经超过10帧。 游戏介绍:3DMark Vantage所使用的全新引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨,号称“显卡危机”的Crysis也不得不甘拜下风。 画面设置:3DMark Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级),只有在这四种模式下才能跑出总分,如果自定义模式就只能得到子项目分数了。 测试方法:N卡支持PhysX,在CPU测试子项中成绩会翻几倍,最终总成绩会提高一些,但并不会影响GPU测试子项的成绩,因此在测试中保持默认驱动设置,PhysX是开启的。 由于GTS450支持Physx,因此GTS450在3Dmark Vantage总分中遥遥领先。但从GPU子项目得分中,GTS450的优势就不那么明显了,分数与HD5770持平。 游戏介绍:Crysis(孤岛危机)无疑是DX11出现之前对电脑配置要求最高的PC游戏大作。Crysis的游戏画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。Crysis还有个资料片Warhead,使用了相同的引擎,只是多了一个关卡,因此我们还是使用原版做测试。 画面设置:Crysis只有在最高的VeryHigh模式下才是DX10效果,但此前所有高端显卡都只能在低分辨率下才敢开启DX10模式,如今的DX11显卡终于有能力单卡特效全开流畅运行。 测试方法:Crysis内置了CPU和GPU两个测试程序,我们使用GPU测试程序,这个程序会自动切换地图内的全岛风景,得到稳定的平均FPS值。 ● 1680x1050分辨率,抗锯齿4x ● 1920x1080分辨率,抗锯齿4x 由于Crysis自带的Benchmark并没有按时间轴进行测试,获得的实时FPS波动曲线没有可比性,因此这款游戏并没有提供FPS曲线供大家参考。 游戏介绍:《冲突世界》将带领玩家返回著名的冷战时期,玩家每一个决定均影响游戏中人物和情节。可于游戏中感受不一样的团队精神,与队友于阴森恐怖的战场上一同作战。《苏联进攻》是其最新的资料片,收录全新角色、扮演苏联军队、10套新影片和全新多人联机地图等等。 画面设置:《冲突世界》是首批DX10游戏之一,采用了自行研发的MassTech引擎,支持多种当前的主流显示特效,如容积云,景深效果,软阴影等,光照系统也表现出色,尤其是半透明的容积云特效营造出了十分逼真的户外场景,物理加速结合体积光照渲染出了最逼真的爆炸效果。 测试方法:内置Benchmark是一段非常华丽的过场动画作为测试程序,最终得出最大、最小和平均FPS,测试结果非常精确。 ● 1680x1050分辨率,抗锯齿4x,各项异性过滤16x 通过实时FPS波动曲线可以看出,两款A卡在前期非常激烈的战斗和爆炸场景,FPS下降非常严重,这就直接导致了它们的整体性能不如N卡。 ● 1680x1050分辨率,抗锯齿4x,各项异性过滤16x ● 1920x1080分辨率,抗锯齿4x,各项异性过滤16x 《冲突世界》是一款RTS类游戏,在画面中出现的物体单位较多,因此对显卡的要求较高。由测试成绩可以看到三款在激烈的战斗场景中,最低帧数均下滑至10帧左右。
软件介绍:3DMark06作为DX9C权威的理论测试工具,包括了两个SM2.0测试和两个SM3.0测试场景,基本上达到了DX9C的画面最高境界。虽然当今显卡已全面进入了DX11时代,但考虑到至今仍有不少新游戏依然采用DX9C引擎,加入3DMark06的测试结果对于很多主流游戏都有参考价值的。 画面设置:如今3DMark06已经难不倒高端显卡了,高端显卡在3DMark06中难分高下,所以我们只能最大程度的提高它对系统的要求,比如说提高分辨率开启抗锯齿等。所以我们选定了在1680x1050主流分辨率开启4AA16AF测试其总成绩。
最终的测试成绩与前面有些相近,GTS450的整体性能和HD5770基本持平,并明显领先于HD5750。那么接下来在热门DX9C游戏中,我们看看性能表现是否与3DMark06一致?
游戏介绍:CAPCOM公司于1987年推出的大型电玩机台格斗游戏《街头霸王》,堪称目前格斗类游戏的始祖。经过了20多年的不断演化之后,如今的PC版《街头霸王4》不仅在画面上走向了全新方向,而且加入了各种新系统,试图让传统2D格斗游戏得到重生。
画面设置:街霸4 PC版和游戏机版相比,除了支持高分辨率输出之外,还为玩家提供了画面渲染风格选择的功能,除与家用机版一样的“普通”模式外,还有“水彩”、“海报”和“烟灰墨”这三种追加的渲染风格,带给完全全新的视觉体验。
测试方法:测试时使用游戏自带Benchmark。
这款游戏已经完全难不倒主流的中高端显卡了,整个测试过程变成了飙分比赛。在测试中GTS450一枝独秀,平均接近于100帧。
游戏介绍:万众期待的暴雪神作《星际争霸》,在10年之后终于迎来的3D版本,目前暴雪已经正式开放了《星际争霸2:自由之翼》的Beta测试。虽然该游戏并不支持时下流行的DX10、10.1甚至DX11,但暴雪凭借成熟的DX9C技术,也将画面做的非常完美,大量HDR及SSAO特效的应用导致要求也比较高。
画面设置:所有特效全开最高,分辨率使用常见的1920x1200。值得一提的是,星际2 Beta版目前还不支持抗锯齿,如果驱动强开的话也没有任何效果。因此测试时只使用内置的优异画质模式。
测试方法:使用星际大脚破解星际2支持单机运行,和电脑对战之后保存一局replay,然后播放录像中一段激烈的战斗场面,通过Fraps记录平均FPS和最小FPS。
《星际争霸2:自由之翼》是一款相当经典的RTS类游戏,由于游戏中战斗单位较多,因此对显卡有一定要求。从测试成绩中可以看到两款N卡相对于A卡的优势相当明显。
游戏介绍:《蝙蝠侠:阿卡姆疯人院》是根据Grant Morrison同名漫画改编,堪称蝙蝠侠历代最黑暗的一作。疯人院里关的都是蝙蝠侠亲手逮捕的罪犯。某天,以小丑为首的病人们声称觉得“无聊”,所以劫持了医护人员,要求蝙蝠侠前去陪他们“游戏”。这场疯狂的迷藏中,占尽优势的是反派们,蝙蝠侠不仅要提防杀气腾腾的各个患者,同时他自己的精神状态也处于失常的边缘。
与此同时,疯人院的一段历史被揭开:原来其创办者阿卡姆最后也沦为自己医院里的精神病。这座哥特式的阴森建筑仿佛带着数代的诅咒,成为蝙蝠侠和病人们无法摆脱的宿命。病人们满足于自己的疯狂,并不想逃离疯人院;蝙蝠侠承认自己厌恶那里是因为去那里“就像回家一样”。
画面设置:《蝙蝠侠:阿卡姆疯人院》使用的是大名鼎鼎的虚幻3引擎,PC版在画面方面进一步提升,不仅解决了HDR+AA问题,还加了DX10中新的光影特效,而且还完美支持NVIDIA的PhysX引擎及3D幻镜技术。以高效率著称的虚幻3引擎本身对显卡要求不高,但大量PhysX效果的引入使得只有高端N卡才能跑动。
测试方法:游戏自带Benchmark。
● 1920x1080分辨率,抗锯齿4x,各项异性过滤16x
● 1680x1050分辨率,抗锯齿4x,各项异性过滤16x
打开PhysX后,A卡全靠CPU处理物理效果,所有A卡在所有分辨率下都受制于低下的物理算法被限制在了14帧。总的来说,由于不支持PhysX,A卡在这款游戏中没有任何优势。
从以上的测试中不难看出在默认频率下GTS450相对于竞争对手的HD5750优势非常明显,并且基本与定位更高的HD5770打成平手。那么这款显卡在超频后性能又将如何呢?下面我们就来测试一下!(为了保证测试数据准确有效,小编将基准测试成绩进行了重新测试,因此基准测试成绩和前面所测成绩会有轻微差异)
● DX9C理论:《3DMark06》
3DMark06默认成绩
3DMark06超频成绩
从测试成绩中可以看到,超频后的GTS450对3DMark06成绩的提升幅度并不是很大。这主要是因为3DMark06基于DX9图形API,对于GTS450的瓶颈效应已经不是很明显。
● DX10理论:《3DMark Vantage》
3DMark Vantage默认成绩
3DMark Vantage超频成绩
超频后的GTS450在3DMark Vantage的测试中,性能提升还是比较明显。超频后的成绩相比超频前提升了10%以上。
● DX11理论:《Heaven Benchmark 2.1》
Heaven Benchmark 2.1默认成绩
Heaven Benchmark 2.1超频成绩
《Heaven Benchmark 2.1》是一款基于DX11的测试程序,因此对于超频性能提升最具有代表性。从测试成绩上来看,超频后相比超频前依然提升了10%以上。
总体来说,GTS450的超频性能非常令人满意,在默认电压下就可以达到核心1GHz以上的频率。在小编所测试的众多显卡中,GTS450还是首款NVIDIA能够稳定运行在核心1GHz以上的显卡。
前面我们主要通过游戏和一些基准性能测试软件对GTS450以及当前几款主流级显卡的3D性能进行了测试,但对于现在的N卡来说,这样的测试并不全面。因为NVIDIA显卡还有一个非常重要的特性就是CUDA通用计算。
N卡和A卡在游戏性能和相关功能方面可能是各有所长、互有胜负,谁都没有绝对的领先优势。但在GPU通用计算方面,差距可就不是一点半点了,CUDA应用软件不但在数量上占据压倒性优势,而在质量与性能方面也比Stream强大许多。
所以,在进行了大量的游戏性能测试之后,笔者开始针对CUDA通用计算进行专项测试。这里选用了CUDA的最新作——MediaCode NT视频转码软件。
测试方法:我们将一段720P视频转码成适用于iPhone的视频格式,看转换时间。
转换完成,耗时1分24秒
我们看到,GTS450转换这一段视频的平均帧率达到了50.5帧每秒,仅仅花了1分24秒的时间就完成了整个视频的转换。而如果适用CPU进行同样的操作,性能会比这个弱很多,这正是CUDA通用计算在视频转换领域的应用。
Folding@home是一个由斯坦福大学主持,全球主要硬件厂商共同参与的大规模公益性分布式运算项目。其主要是研究了解蛋白质折叠、误折以及相关的疾病,主要研究的疾病包括:癌症、阿兹海默症、亨廷顿病、帕金森氏症等。我想,这是一个比单纯跑各种Benchmark来得更有价值的事情。
在我们进行GTX470/480首发评测的时候,由于Folding@home官方版本还没有可以支持GTX400和HD5000的显卡,所以只能使用NVIDIA给的离线测试包进行测试。而就在几天前,Folding@home发布了最新的GPU版本GPU3,终于可以支持GTX400系列显卡,但不能支持HD5000。本次我们就使用这个版本的Folding@home进行在线蛋白质折叠运算测试。
GTS450 Folding@home 性能:667ns/Day
GTS250 Folding@home性能:372ns/Day
我们可以看到,NVIDIA的CUDA在Folding@home这个项目上已经非常成熟,相应的客户端程序已经完全可以利用显卡的CUDA核心数量,由于新一代GTS450 CUDA核心数量比上一代GTS250要多,所以成绩也更好一些,反之亦然。
Folding@home是一个每一位拥有PC的用户都可以通过自己的电脑造福全人类的项目,而且基本不会影响电脑的性能,我们希望PCPOP有更多的读者加入到此项目中。
我们的功耗测试方法是直接统计整套平台的总功耗,既简单、又直观。测试仪器为微型电力监测仪,它通过实时监控输入电源的电压和电流计算出当前的功率,这样得到的数值就是包括CPU、主板、内存、硬盘、显卡、电源以及线路损耗在内的主机总功率(不包括显示器)。
● GTS450待机功耗89W、满载功耗234W
● HD5750待机功耗115W、满载功耗218W
在测试中我们选用了相同定位的HD5750进行了对比,可以看到在满载状态下GTS460的功耗相比HD5750高出15W左右,但小编认为用户为了得到更好的游戏体验,牺牲这15W还是值得的。而待机状态下GTS450相比HD5750节能高达20W以上,那么这是如何做到的呢?
● GTS450待机温度38度
● GTS450满载温度60度
通过观察GTS450在待机及满载下的GPU-Z截图,我们的疑惑已经解开:GTS450在待机状态下频率仅为50/100/540,因此相应的待机功耗及温度肯定会很低。
从8600/8500开始,NVIDIA率先支持高清视频硬解码,但仅限于H.264编码,对于VC-1依然是半硬半软式,虽然也能流畅播放高清视频,但比对手少一项功能终归不是滋味。
NVIDIA一步步实现VC-1完全解码
于是,从G98核心开始,NVIDIA将高清解码引擎升级到VP3版本,为VC-1编码提供了完全硬解支持,AMD的UVD引擎再也没有值得骄傲的资本了。
NVIDIA随后还提供了高清视频双流解码技术,同时硬解两部HDTV,支持蓝光画中画功能。次年,AMD在HD4000系列GPU中升级至UVD2引擎,同样支持双流解码和超高码率视频硬解码。在互相攀比与学习的过程中,双方在高清解码方面的实力不相上下。
此外,NVIDIA可以通过CUDA计算技术动用流处理器资源进行高清视频解码加速,兼容性和画质比专用的视频引擎更胜一筹。而AMD在GPU通用计算方面比较落后,不支持该技术。因此综合来看,在高清解码的应用方面,还是NVIDIA更强一些。
● HDMI音频输出之争
但是NVIDIA还有个软肋,HDMI音频输出还是需要“飞线”。当时的NVIDIA也意识到HDMI必将成为消费级市场的主流接口,虽然对HDMI也提供了支持,但其中的音频信号必须从板载声卡导入,安装和设置都非常麻烦。NVIDIA的这种实现方法被称为“飞线式”HDMI音频输出。
通过SPDIF为显卡导入音频信号
AMD针对GPU内置声卡与HDMI一线式输出技术进行了大肆渲染,搞得NVIDIA比较难堪。于是从GT220和GT210核心开始,NVIDIA终于内置了音频模块,为HDMI提供7.1声道数字音频输出,终于摆脱了“飞线”的困扰。
但是,经验老道的AMD又有了新的玩法,在HD5000时代对内置的音频模块进行大幅升级,如今HD5000全线显卡都能够通过HDMI接口向AV功放输出7.1声道音频,除了传统的AC-3、AAC外,首次支持次世代的Dolby TrueHD和DTS Master Audio源码输出!
这是历史上第一次通过显卡为功放输出未经压缩的源码音频流,此前必须使用价值不菲的中高端声卡才能实现。虽然玩高清与HiFi的毕竟是少数人,国内玩家更是少之又少,但AMD的这一做法得到了高清玩家的高度赞赏,好评如潮!
免费附送的功能总比没有强吧,相信很多用户都是这种心态,尤其是在媒体的大肆渲染之下。以NVIDIA的设计实力,不是做不出来,而是想不想做的问题。于是在全新设计的GF104核心中,NVIDIA加强了HDMI Audio,支持bitstreaming Dolby True HD和DTS-HD Master。如此一来,HD5000系列的一大技术优势将不复存在。
事实上,在GF104之前,还有一款显卡也能支持次世代音频源码输出技术,那就是Intel内置在Clarkdale核心(Core i5 6XX和i3 5XX)里面的GMA HD集成显卡,这款显卡及其高清技术都是免费附送的。真正需要用到该功能的玩家未必会使用AMD、Intel或NVIDIA的显卡,所以笔者认为HDMI Audio之战纯粹是王者的意气之争,就是为了堵上竞争对手的嘴。
早在一年半以前,NVIDIA就正式发布了3D Vision立体显示技术,并且联合显示器厂商推出了120Hz的3D显示器,为广大游戏玩家带来了真正切实可用的3D立体解决方案。到了今年,多部重量级3D电影巨作的上映,让更多的用户一睹立体显示的震撼效果,直接推动了3D立体的需求,2010成为了3D立体元年。
确实,3D游戏发展至今,画面很难会有质的提升,但3D Vision技术的引入可以给人眼前一亮的感觉,可以说又是一场视觉革命:
NVIDIA经过多年的发展,产品和技术方面已经非常成熟了,目前几乎所有的PC游戏都能近乎完美的支持3D Vision技术,配以3D眼镜和120Hz显示器的话,就能得以完美呈现。此前之所以未能得到普及,是因为用户了解还不够多,另外3D显示设备量价都不如人意,而现在时机成熟了。
如今,所有的PC游戏都能支持3D Vision技术,所有的2D普通电影都可以通过PowerDVD搭配CUDA技术实时虚拟成3D影片,片源也不再是问题。加之今年3D显示器如雨后春笋般出现在市场上,价格已经贴近主流,普通用户组建一套3D PC不再是痴人说梦。
三屏3D构建梦幻游戏平台
据黄仁勋先生称,2010年南非世界杯的3D转播全部使用NVIDIA解决方案,由NVIDIA GPU驱动,可见3D Vision技术已经获得了业界的一致认可,引领整个行业快速进入3D立体时代!
NVIDIA的3D立体设置与显卡驱动设置浑然一体,非常容易上手
AMD必须借助IZ3D第三方驱动解决方案
在上月的台北电脑展上,AMD也正式公布了基于Radeon显卡的3D立体解决方案,该技术与NVIDIA类似,也需要120Hz显示器和液晶分时眼镜的支持,而使用的驱动引擎为IZ3D的第三方解决方案。
在实现的立体效果方面,双方并没有太大的差别,但本质区别就是:NVIDIA的驱动研发团队经过多年的积累,对于3D游戏的支持度和立体优化远胜第三方解决方案,无论开启3D立体后的性能表现还是对于游戏的支持数量都有着明显优势,针对新游戏也能第一时间提供优化支持,这些都远非第三方解决方案可比。
现在AMD借助IZ3D的力量也迈入了3D立体的殿堂,但实际上IZ3D驱动也能完美兼容N卡。所以在3D立体方面,AMD无论解决方案、游戏效果、游戏兼容性和支持力度,都无法同3D Vision相提并论!
AMD HD5000系列最诱人的技术恐怕就是Eyefinity了,实现三屏环幕的效果确实相当震撼,为游戏玩家提供了非常宽阔的视野。当然这里说的三屏并不是简单的连接三个显示器,而是将三个显示器虚拟成为一个大的分辨率,然后实现超宽分辨率的游戏,这才是玩家最需要的技术。
AMD的GPU在设计之初就考虑到了多屏输出的需要,Cypress核心最多可以提供6个TMDS数字输出通道,Juniper核心最多也能提供5个TMDS。不过实现5屏或者6屏输出只能通过DisplayPort接口实现,使用传统的Dual-Link DVI输出的话,最多只能支持三屏,目前市售HD5000系列都是三屏输出的配置。
6个TMDS通道最多提供6路DP输出,或者3路DVI输出
遗憾的是,NVIDIA新一代的GF100和GF104核心都不支持单GPU多头(三屏以上)输出技术,可能是实现该技术需要对GPU输出模块进行较大的改动,因而来不及加入该功能。但AMD Eyefinity技术目前被炒得火热,该技术不但实用而且非常适合发烧游戏玩家,如果N卡不支持的话会丧失一个非常大的卖点。
为了弥补显示输出方面的不足,NVIDIA灵机一动,双显卡不是可以提供四头输出吗,此前只能单纯组建多头输出,而不能实现超大分辨率。如果使用双显卡,结合SLI技术、并把多头输出合并为大分辨率的话,那就能实现媲美Eyefinity的效果。最终,NVIDIA在不更改硬件的情况下,通过改写SLI驱动,使得双卡能够实现与ATI完全相同的三屏环绕输出。
NVIDIA的三屏需要双卡SLI支持
NVIDIA这种解决方案的缺点就是需要两张显卡才能实现,但优点就是显卡并没有限定非得用刚刚发布的GTX400系列,上一代的显卡也可以,只要组成SLI即可。还有个好处就是SLI系统性能比较强劲,足以带动大分辨率玩BT游戏。
Eyefinity的优势就是单显卡也能支持三屏输出,只需要2D输出的用户可以通过较低的成本组建。但对于3D游戏玩家来说,即便HD5870单卡也未必能够胜任三屏幕玩主流游戏的苛刻要求,此时玩家可能需要购买两块显卡,那么A卡和N卡在功能上就没有优劣之分了,都能提供很完美的三屏效果。
驱动和软件方面是NVIDIA一贯的优势,NVIDIA的SLI环绕配置界面比AMD的Eyefinity更加智能方便,而且不需要DP显示器的支持。AMD的Eyfinity驱动配置起来稍嫌麻烦,还必须要求一个显示器支持DP接口,否则将不能实现三屏输出,限制确实比较多。
新驱动还支持边框矫正技术,操作同样简单方便易上手,让多显示器输出的效果更加接近于真实世界中的窗格。使用边框修正之后,游戏的显示分辨率将会更加开阔。该技术AMD的Eyefinity现在也能支持,这一方面双方做的都不错。
NVIDIA可以实现2D三屏与更高级的3D三屏
当然,最具有特色的就是,三屏环幕结合3D Vision技术,实现3D立体3屏环绕技术,足以产生令人震惊的显示效果。目前AMD的三屏3D技术还停留在实验室和展示阶段,因为3D显示器必须要求使用Dual-Link DVI接口或者HDMI 1.4接口传输双倍的数据流,普通的A卡还不能支持。
PhysX是NVIDIA的一大法宝,在NVIDIA DX11显卡面世之前,旧的N卡正是凭借该技术与A卡相抗衡。通过笔者此前的网友调查来看,虽然PhysX的关注度没有DX11那么高,但还是拥有很多忠实的用户,一些玩家为了同时追求DX11与PhysX,费尽心机通过破解杂交的方式来让N卡和A卡协同工作。
《地铁2033》:同时支持DX11和PhysX
如今GTX480/470正式发布,同时支持DX11和PhysX,玩家没必要再瞎折腾了。而且刚刚发布的《地铁2033》这款游戏对DX11和PhysX都提供了支持,看来不光是玩家,开发商对于PhysX也比较热衷,毕竟这是目前唯一一款支持GPU加速的物理引擎,而另一款物理引擎Havok在被Intel收购之后一直处于雪藏状态,只支持CPU加速,不支持GPU加速,物理效果都是轻量级的,远不如PhysX那么夸张惊人。
此前想要实现物理效果必须购买专用的物理加速卡,而NVIDIA收购了Ageia公司之后,将PhysX技术以完全免费的形式附送给了GeForce显卡,让N卡用户多了一个非常炫的功能。
NVIDIA在游戏界有着举足轻重的影响力,和众多游戏开发商保持着密切的合作关系,大名鼎鼎的“The Way”计划就保证了N卡在几乎所有游戏大作中都有着良好的性能发挥。PhysX物理引擎被NVIDIA收入囊中之后,原本屈指可数的物理游戏逐渐开花结果,以《镜之边缘》、《蝙蝠侠》、《黑暗虚空》为代表的一些重量级大作开始使用PhysX物理引擎,影响力非同小可。
国产FPS网游MKZ中爆炸、破坏、玻璃和布料使用了PhysX技术
而且,中国本土游戏开发商也开始使用PhysX引擎来增强画面,比如《MKZ铁甲突袭》和《剑网3》都内置了PhysX支持,可见PhysX技术显然要比其它同类物理技术更易用一些。
国产网游《剑网3》中,使用PhysX实现了逼真的衣物和布料效果
虽然物理加速技术还没有一个统一的标准,但PhysX无论从游戏数量还是画面效果方面,都更胜一筹。随着使用PhysX引擎的游戏越来越多,少有的PhysX显然将会成为事实上的标准。
新发布的GTX480/470/460系列显卡在PhysX加速方面的性能有了长足的进步,但NVIDIA上一代显卡如果单独拿来做物理加速卡的话,性能也很足够,特效也不会损失,因为PhysX考验的是CUDA并行计算效能,与DX API支持度无关。然如果N卡用户想要升级到GTX480/470的话,旧显卡没必要淘汰。
AMD目前的处境比较尴尬,此前过多的依赖于Havok引擎,希望新版的Havok FX引擎能够早日面世,为A卡提供支持。但是Intel收购之后希望主要使用CPU加速物理效果,导致AMD一筹莫展,之前一些AIB厂商宣称A卡能够支持Havok GPU加速纯粹是无稽之谈。此后AMD寻求第三方合作伙伴的支持,积极加入开源物理加速项目,但目前还没有什么实质性的进展,至今没有任何一款游戏能够支持AMD的GPU加速物理。
提起GPU通用计算,自然会让人想到NVIDIA的CUDA、ATI的Stream以及开放式的OpenCL标准,再加上微软推出的DirectCompute,四种技术标准令人眼花缭乱,他们之间的竞争与从属关系也比较模糊。
首先我们来明确一下概念:
1. OpenCL类似于OpenGL,是由整个业界共同制定的开放式标准,能够对硬件底层直接进行操作,相对来说比较灵活,也很强大,但开发难度较高;
2. DirectCompute类似于DirectX,是由微软主导的通用计算API,与Windows集成并偏向于消费领域,在易用性和兼容性方面做得更出色一些;
3. CUDA和Stream更像是图形架构或并行计算架构,NVIDIA和ATI对自己的GPU架构自然最了解,因此会提供相应的驱动、开发包甚至是现成的应用程序,通过半开放的形式授权给程序员使用。
其中ATI最先提出GPGPU的概念,Folding@Home和AVIVO是当年的代表作,但在被AMD收购后GPGPU理念搁浅;此后NVIDIA后来者居上,首次将CUDA平台推向市场,在这方面投入了很大的精力,四处寻求合作伙伴的支持,并希望CUDA能够成为通用计算的标准开发平台。
NVIDIA CUDA架构示意图
在NVIDIA大力推广CUDA之初,由于OpenCL和DirectCompute标准尚未定型,NVIDIA不得不自己开发一套SDK来为程序员服务,这套基于C语言的开发平台为半开放式标准(类似与Java的授权形式),只能用于NVIDIA自家GPU。AMD始终认为CUDA是封闭式标准,不会有多少前途,AMD自家的Stream平台虽然是完全开放的,但由于资源有限,对程序员帮助不大,因此未能得到大量使用。
ATI Stream示意图
DX11时代我们迎来了微软的DirectCompute 11和OpenCL这两大GPU计算API,其定位就相当于3D图形领域的DirectX和OpenGL。就如同GPU能同时支持DirectX与OpenGL那样,NVIDIA和AMD对DirectCompute和OpenCL都提供了无差别支持。
我们希望新API的出现能够打破目前GPU计算领域混乱的格局,并带来更多实用的应用和软件,但从目前的发展方向来看,进展还是相当缓慢。当前主流的一些GPU计算类软件,主要还是集中在视频转码和编辑方面,都是以NVIDIA和AMD的CUDA/Stream技术为主。
就拿视频转码来说,ATI驱动集成的AVIVO转码器功能太过简单,转换后视频的画质很差,而且主要依靠CPU转码,跟GPU的关系不大。而NVIDIA的Badaboom完全依靠GPU转码,GTX480的性能都能完全释放出来,MediaCoder更是能够充分发挥出CPU和GPU的效能,成为目前转码速度最快的软件;MediaShow能同时支持A卡和N卡,主要依靠CPU转码,对GPU的要求很低,双方性能差距并不明显。
而在视频编辑和应用方面,目前视频倍线软件和2D转3D的软件能够同时支持CUDA和Stream技术,但一般都是等支持CUDA大半年之后,才加入对Stream的支持。此外还有一些加密解密、视频修复软件只支持CUDA不支持Stream,很显然AMD对于GPU计算方面投入的精力还不够多,支持Stream的软件无论数量还是质量都跟CUDA相差一大截。
以上通过对GTS450较为全面的测试不难发现,这款产品在相同定位的产品中优势较为明显,在性能上明显领先HD5750,并且产品的附加价值也更加具有竞争力。为了方便网友进行比较,在最后我们就将GTS450与HD5750的成绩做一汇总。
从以上的对比表格中可以看到,GTS450几乎全胜于相同定位的HD5750,仅仅满载功耗方面略高于对手的产品。而仅仅牺牲16W的功耗,换来更好的游戏体验,相信这对于玩家来说还是值得的。
从本次测试的整体来看,GTS450继承了GTX460的“光荣传统”,在游戏性能测试中以压倒性的优势完胜于相同价位的HD5750,并和定位更高的HD5770打成平手。而产品自身所附带的多种特色功能似乎又为产品增添了不少亮点。
但从价格端来看,NVIDIA这次所给出GTS450官方指导价格似乎有些偏高,为999元。结合性能来看,正如上面所说GTS450在绝大部分游戏上的表现确实比HD5750强势,但和HD5770基本持平,所以小编个人观点GTS450的价格定位应该是介于HD5750与HD5770之间。
就此问题小编从NVIDIA的相关人士了解到:NVIDIA之所以这样做,主要是为了使原本非常热卖的GTS250不至于受到太大的价格冲击。待GTS250的库存基本出净并随着厂商们的非公版产品跟进,相信GTS450的价格会有所下调,以便使其成为新一代主流级超值显卡!■