颠覆高端卡市场!GTX570首发权威评测
泡泡网显卡频道12月7日 在一个多月前,AMD正式发布了其第二代DX11架构的产品——HD6850/6870,这两款产品在核心构架方面相比上一代产品进行了改进。所改进的重点在于性能方面,在提升执行效率的同时,而进一步加强了原本性能偏弱的Tessellation性能。令原本在千元级价位中一向春风得意的GTX460,也感到了几丝压力。
在HD6870/HD6850发布两周之后,NVIDIA也发布了第二代旗舰级产品GTX580,与AMD不同的是GTX580所改进的重点在发热量以及功耗方面:在核心构架基本不变的情况下,改进了40nm工艺制程,并且PCB也经过重新设计。最终采用完整版GF110核心的GTX580,在流处理器和频率均增加的情况下,发热量以及功耗均优于上一代GTX480。
今天NVIDIA又发布了第二款采用GF110的产品——GTX570,这款产品从规格上看和之前的GTX480非常接近,均屏蔽了1组流处理器。而GTX570又出于市场定位的考虑相比GTX480屏蔽了1组显存控制器,因此最终的规格为480个流处理器、1280M 320bit。接下来小编就为大家全面解析一下这款产品。
为了能够让大家对这款产品有一个深入的理解,我们先从GTX570的核心构架开始说起。今年初,由于台积电40nm的产能问题,令拥有超大规模晶体管数量的GF100良品率一直达不到预期,因此最终只能以非完整版的形式进入市场。同时也正是由于当时并不成熟的40nm工艺,使得GF100的功耗以及发热量明显高于预期水平。
从上面的构架图不难看出,采用GF100核心的GTX480,屏蔽了一组SM流处理器簇单元。因此比设计之初的完整版GF100少了32个流处理器、4个纹理单元以及1个多形体引擎,最终拥有480个流处理器、60个纹理单元以及15个多形体引擎。
在GTX480发布9个月之后,11月10日NVIDIA终于发布了新一代采用GF110核心(完整版GF100)的旗舰级显卡GTX580。由于40nm工艺此时已经趋于成熟,并且NVIDIA也在其核心内部做了细微优化。因此GTX580不仅相比GTX480拥有更高的规格、更高的性能,并且核心功耗与温度均有所下降。
而今天所发布的定位于次高端的GTX570为第二款采用GF110的产品,由上图可以看到GTX570在GF110上屏蔽了SM流处理器簇单元以及显存控制器各一组。最终的核心规格与GTX480基本相同为480个流处理器、60个纹理单元以及15个多形体引擎。而显存方面则进一步缩减为显存位宽320bit,显存容量1280MB。
上一页我们已经说到,采用GF100的GTX480唯一不足就是温度与噪音。GTX480发布之后,很多网友调侃这款显卡在冬天可以省去一笔不小的开支,虽然这句话有点夸张,但夏天如果对着出风口50cm以内的距离一定会让你很难受,手更是不敢放在显卡的出风口,有很大的烫伤风险。
NVIDIA的工程师自然也会被这个问题所困扰,而且更困扰他们的是噪音的问题。30亿个晶体管堆积在一起,在现有的工艺制程下高温难以避免,可以通过提高风扇转速的方式来解决,但随之带来的是更大的噪音。
改进散热器是唯一的办法。
GTX570所采用的散热器
于是,NVIDIA的工程师再一次从散热器方面下手,对其进行了改进。这次改进主要解决三个问题:
1、降低用户被烫伤的风险;
2、提高散热效能,保证显卡稳定运行;
3、降低风扇噪音。
● 真空腔恒温板技术
GTX570的散热器采用了目前非常先进的真空腔恒温板技术,下面是它的原理图:
与玩家相对熟悉的热管技术相比,真空腔恒温板原理与理论架构是相同的,只有热传导的方式不相同,热管的热传导方式是一维的,是线的热传导方式,而真空腔恒温板的热传导方式是二维的,是面的热传导方式,所以这种技术比普通的热管技术散热面积更大。
它利用真空/高压/毛细作用传导热。恒温板是一个内壁具有微细结构的真空腔体,当热由热源传导至蒸发区时,腔体里的冷却液在低真空度的环境中受热后开始产生冷却液的气化现象,此时吸收热能并且体积迅速膨胀,气相的冷却介质迅速充满整个腔体,当气相工质接触到一个比较冷的区域时便会产生凝结的现象,借由凝结的现象释放出在蒸发时累积的热,凝结后的冷却液会借由微结构的毛细管道再回到蒸发热源处,此运作将在腔体内周而复始进行,这就是恒温板的运作方式。
● 更大的风扇开口
为了让显卡能够在最短的时间内吸进更多的冷空气,NVIDIA工程师还对显卡散热器的风扇开口进行了调整,GTX570的风扇尺寸及开口明显比GTX470更大,下面是GTX470风扇口径与GTX570风扇口径的对比照片:
上面的那块显卡是公版GTX470,下面的是GTX570,从照片中我们可以非常清楚的看到GTX570的散热风扇口径更大,这样的设计即使在两块显卡组建的SLI系统中,也能吸入足量的冷空气。
值得一提的是,GTX570散热器还对风扇转速自动控制功能进行了改进,之前的风扇转速自动控制功能只有待机、2D和3D三种状态,GTX470有了一项改进,就是当GPU温度超过90摄氏度时,再自动提升风扇的转速,以保证GPU温度不超过95摄氏度。而GTX570再次在这方面进行了改进,风扇会根据应用程序控制转速,比如在玩一些较老的3D游戏是,风扇转速可能仅仅比2D状态快一点点,这样就可以有效的控制风扇所产生的噪音。
GTX570抛弃了GTX470背部的镂空设计
另外,我们还注意到GTX470显卡PCB上的镂空设计在GTX570上被取消了,NVIDIA官方并没有解释过这一细节,但我们综合分析一下,也不难发现取消掉这个设计的道理。
首先,GTX570采用了更大口径的风扇,单位时间内冷空气的吸入量已经能够满足散热的需求,没必要再采用镂空设计。而且,镂空设计在SLI环境下,还可能造成第二片显卡与第一片显卡争抢冷空气的情况,并不太适合。
其次,镂空的设计会产生更多的噪音,这个原理就和飞机引擎发出的巨大声音类似,但一整块的PCB就不会出现这种情况。
除了在散热器方面有了很大的改进之外,在显卡的电源管理方面GTX570也带来了很大的改进,最重要的一点就是加入了硬件电压监控和调整的功能。
就在以前GTX470镂空的位置上,GTX570专门加入了3颗IC,从硬件方面对电源进行管理,一是实施监控电压,二是动态的根据应用程序调整供电的强度,以保证应用程序能够发挥最大的效率,但又能够将功耗、温度以及发热量控制在刚刚好的范围上。
另外在供电的电路方面,GTX570和之前的GTX580基本相同,不过由于GTX570相比GTX580屏蔽了一些流处理器及显存单元,因此显卡核心供电由6相缩减为4相,同时显存还是保留最初的2相独立供电。供电部分虽然没有采用数字供电,但也非常非常豪华,采用了贴片电感+LF-PAK封装的Mosfet,且每一相供电都有单独的控制芯片。值得一提的是尽管GTX570的核心规格与GTX480基本相同,但外接供电只需要双6Pin,可见工艺改进同时也让功耗得到了更好的控制。
这里我们简单的说一下这种采用LFPAK封装Mosfet的优势,相对于传统的DPAK封装的MOSFET来说,LFPAK封装的MOS管具备超低内阻和超低温度两大特性,上图就可以看出因为内阻低,LFPAK封装的MOSFET在电源转换效率方面具有非常大的优势。
除了这些之外,供电部分还有很多其他方面的改进,比如发热量更低的用料、供电电路的优化设计等等,这里我们就不做过多的介绍。
以上讲完了这么多,相信大家已经对GTX570的外观充满了好奇,下面我们就来看一下GTX570公版显卡的外观究竟是什么样的。
外观和GTX580完全相同,只是贴纸不太一样
采用了口径更大的散热风扇,尾部依然设计出风口,为了更加适合SLI平台,散热器尾部的斜面角度更大。
GTX570采用了和GTX580相同的P1261公版PCB,由于显存位宽以及流处理器有所减少,因此在显存的位置有两个空焊位,并且核心供电也减少两相。
GTX570的核心编号为GF110-275-A1,显存搭配10颗三星0.5ns颗粒组成1280M 320bit的规格,默认公版频率为732MHz/1464MHz/3800MHz。
输出接口同样采用NVIDIA一贯的设计方案,采用了mini HDMI+双Dual link DVI设计,能够轻松实现3D Vision Surround技术,同时Mini HDMI接口已经可以支持输出未经压缩的次世代音轨。
Inno3D GTX570是首个到达PCPOP评测室的产品,其完全采用了GTX570公版设计。并且标签非常醒目,3Dvision、PhysX、CUDA等NVIDIA特色技术均在标签上有所体现。
翔升GTX570同样采用了纯公版设计,上方的贴纸延续了翔升一贯的简约风格。
七彩虹GTX570也采用了公版设计方案,不过这款产品为官方预超频版本,默认频率达到了750/3900MHz。
索泰GTX570也采用了公版设计方案,贴纸采用了具有科技感的外星人风格。
由于本次测试的主体以及参加测试的对比显卡都是目前的高端产品,为了尽量避免处理器和内存出现性能瓶颈,本次测试采用了目前非常优异的i7 965处理器搭配6GB内存,主板采用了当前最豪华的华硕玩家国度X58。测试显示器为DELL 3007 30吋液晶显示器,并分别测试1920×1200和2560×1600两个分辨率。
为了能够直观的体现出目前各个高端单核心显卡的性能,本次测试还加入了上一代的GTX480、GTX580以及AMD的HD5870,关于双核心以及双卡平台的测试,我们将在近段时间内单独撰文。
软件环境方面,本次测试依然采用windows7 x64操作系统,N卡测试采用NVIDIA的最新Beta版驱动263.09,A卡测试驱动则采用目前最新通过WHQL验证的催化剂10.10。
下面,我们就一起来看看GTX570在游戏性能方面的表现!
游戏介绍:原计划于11月30日发布的3DMark11,因为一些特殊的原因被推迟到了12月7日发布,根据Futuremark官方的解释,他们的目标是让3DMark 11在发布伊始就能够提供准确可靠而有一致性的测试结果。因此,他们需要多花一些时间来解决几个较严重的BUG,而不是选择在发布后立即推出修正补丁。
原定11月30日发布的3DMark11延期一周
现在Futuremark官方正式确认,新一代DirtectX 11基准测试软件3DMark 11将在延期一周后,于12月7日也就是今天正式发布,具体的时间为格林尼治时间12月7日14点,北京时间晚22点。有趣的是,这一时间几乎和NVIDIA GeForce GTX 570的发布时间完全重合!
此前的Heaven Benchmark和StoneGaint这两款DX11测试软件都片面注重于Tessellation性能,以致于遭到了AMD和部分游戏玩家的不满。而3DMark11则提供了多种负载的测试场景,更加均衡的考验了显卡的DX11性能,因此其测试结果将更具代表性一些。结果相当令人意外,显存规格稍低的GTX570竟然在性能上领先于定位更高的GTX480,看来NVIDIA的确在新产品的核心优化方面下足了功夫。
游戏介绍:3DMark Vantage所使用的全新引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨,号称“显卡危机”的Crysis也不得不甘拜下风。
画面设置:3DMark Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级),只有在这四种模式下才能跑出总分,如果自定义模式就只能得到子项目分数了。我们为这次的优异卡对决选择了最高的Extreme模式,它其实就是最高画质1920x1200分辨率再加上4AA16AF模式。
N卡支持PhysX,在CPU测试子项中成绩会翻几倍,最终总成绩会提高一些,但并不会影响GPU测试子项的成绩。从结果可以看出GTX570领先定位更高的GTX480已经超过了10%。
软件介绍:3DMark06作为DX9C权威的理论测试工具,包括了两个SM2.0测试和两个SM3.0测试场景,基本上达到了DX9C的画面最高境界。虽然当今显卡已全面进入了DX11时代,但考虑到至今仍有不少新游戏依然采用DX9C引擎,加入3DMark06的测试结果对于很多主流游戏都有参考价值的。
画面设置:如今3DMark06已经难不倒高端显卡了,高端显卡在3DMark06中难分高下,所以我们只能最大程度的提高它对系统的要求,比如说提高分辨率开启抗锯齿等。这里我们直接测试2560×1600分辨率并开启8AA16AF下的性能。
其实3DMark 06对于目前的显卡来说主要看SM3.0性能,但在今天的测试中我们不管看哪一个测试结果都可以得到很明确的结论:GTX580无疑是性能王者,而显存位宽稍低的GTX570似乎性能优势并不像以前那么明显了,和HD6870基本相同。
游戏介绍:Unigine Engine率先发布了首款DX11测试/演示程序——Heaven Benchmark,其中大量运用了DX11新增的技术和指令,看来在新版3DMark面世之前,Heaven将会是DX11性能测试的非常好的选择。
画面设置:2.1版本进一步强化了Tessellation技术的应用,细分精度更高,画面更上一层楼,测试时所有特效全开最高,包括Extreme级别的Tessellation。
测试方法:自带Benchmark。
《天堂》2.1加入了Extreme模式Tesselation的支持,在这个模式下最考验的就是显卡的DX11 Tesselation性能,前面我们介绍到因为HD5870只有一个同样功能的前端控制引擎,虽然HD6870在这方面有所改进,但整体架构变化不大,所以性能上就大幅度的落后于N卡。可以预计,未来DX11游戏真正普及之后,AMD要是再不重新设计架构,将会非常被动。
游戏介绍:《科林麦克雷》系列游戏是为纪念去世的英国拉力赛车手科林·麦克雷(Colin McRae)而制作的,因此在游戏过程中不难见到许多麦克雷过往的身影。与一年一款的优品系列赛车游戏不同,DiRT2距离前作已经两年之久,目前《科林麦克雷:尘埃2》主机版早已上市,几乎登陆所有的主机和掌机平台、好评如潮,而PC版由于支持DX11的缘故,所以被延期数月。
画面设置:DIRT2堪称DX11游戏代表作,DX11的五大关键特性在这款游戏中都有体现,但却没有得到大范围的应用,都是点到为止。比如Tessellation主要体现在水洼和旗帜上,而赛车过程中也就那么几处采用了该技术,因此这款DX11的要求并不高,特效全开的话中端显卡都能跑动。
测试方法:游戏自带Benchmark程序,会自动跑完一个固定的赛道,非常接近于真正玩游戏的模式。
《尘埃2》这款游戏中虽然对曲面细分技术应用的不多,但我们仍然可以看到GTX570拥有很大的性能优势,在1920分辨率下轻轻松松的超过了100FPS,并明显领先于AMD的两款产品。
游戏介绍:《Aliens vs. Predator》同时登陆PC、X360和PS3,其中PC版因为支持DX11里的细分曲面(Tessellation)、高清环境光遮蔽(HDAO)、计算着色器后期处理、真实阴影等技术而备受关注,是AMD大力推行的游戏之一,但是这样的主题难免让本作有很多不和谐的地方,暴力血腥场面必然不会少!发行商世嘉在2009年11月就曾明志,表示不会为了通过审查而放弃电子娱乐产品发行商的责任,因为游戏要维持“异形大战铁血战士”这一中心主题,无论画面、玩法还是故事线都不能偏离。
画面设置:AVP原始版本并不支持AA,但升级至1.1版本之后,MSAA选项出现在了DX11增强特效当中,当然还支持Tessellation、HDAO、DirectCompute等招牌。该游戏要求不算太高,所以笔者直接将特效调至最高进行测试。
测试方法:游戏自带Benchmark。
这个游戏似乎对显卡的位宽有一定的要求,GTX570明显领先上代GTX470以及两款AMD产品,但还是稍稍落后于GTX480。
游戏介绍:《战地:叛逆连队2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。开发商EA已经于本月2日正式同步发售了Xbox 360、PS3、PC版。该游戏是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连队》的直接续作,在继承前作特性的基础上,强化了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。
测试方法:游戏不带Benchmark,笔者选取了单人任务模式下的一段无需手动干涉的过场动画进行测试,其中包括大量激烈的轰炸爆破激战场面,完全可以反映真实的游戏性能。
《叛逆联队2》虽然是款DX11游戏,霜寒引擎也是备受期待的DX11引擎,曾被ATI用来做Tessellation的技术展示。不过最新版本的对DX11的支持非常有限,仅仅是采用新指令集渲染HBAO特效而已,游戏会自动侦测显卡的DX级别来选择渲染模式。在这款游戏中,GTX570依然发挥稳定领先于GTX480以及两款AMD产品。
游戏介绍:《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作,也是DX11游戏的新成员。该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。
画面设置:《地铁2033》虽然支持PhysX,但对CPU软件加速支持的也很好,因此使用A卡玩游戏时并不会因PhysX效果而拖累性能。该游戏由于加入了太多的尖端技术导致要求非常BT。
测试方法:选用第三方Benchmark程序,这是一小段地铁隧道中的战斗场景,场面复杂战斗激烈,对显卡提出了严峻考验。
这款游戏支持PhysX物理加速,由于A卡不支持GPU物理加速(可以采用CPU渲染,但不具备可比性),所以这里还是不予测试。这款游戏对显卡的要求是在是非常BT,尤其在2560分辨率下GTX580也没有办法让游戏流畅运行,必须降低设置才可以勉强玩转,所以中低端显卡的用户还是别考虑这款游戏了。
游戏介绍:《失落的星球2》的游戏舞台是前作故事发生后十几年之后经过温暖化改变的EDN-3rd,这里将新增丛林等新场景,主人公也并非前作那样为一人,而是以“雪贼”们不同的视点展开故事。
画面设置:与前作相同,《失落的星球2》采用CAPCOM公司原创引擎MT Framework的最新版VER.2.0进行开发,游戏世界的表现将更加细致和美丽。而不仅仅是画面上的进化,本作将会在前作玩家要求基础上追加大量全新要素,新场景、新角色、新武器等自不必说,角色的动作也比前作更加丰富多彩。
测试方法:游戏自带Benchmark,测试A场景。
《失落星球2》也是一款应用Tesselation技术非常多的DX11游戏,因此这款游戏的测试结果非常离谱,在1920分辨率下,GTX570的性能都接近了两款A卡的2倍。2560分辨率下由于对显存要求更高,A卡的Tesselation性能又不行,自然全军覆没。
游戏介绍:《鹰击长空2》是一款结合了拟真与空战要素而成的模拟飞行游戏,玩家可驾驶多种高性能战机,在高空中进行巡逻、护航、轰炸等任务。值得一提的是,游戏中的地面场景乃参考GeoEye卫星空照图所构建而成,这项游戏与现实生活的科技结合,让玩家仿佛置身于战机的驾驶舱内,逼真的地表风貌一览无遗。
画面设置:《鹰击长空2》直接内置支持DX11,在我们今天的测试中我们分别测试2560×1600以及1920×1200两种分辨率,开启DX11功能,并开启4AA。
测试方法:游戏自带Benchmark。
《鹰击长空2》也大量的采用了Tesselation技术,因此N卡表现仍然非常优秀,在各种分辨率上,N卡性能都超过了A卡的两倍以上。
游戏介绍:游戏引擎开发商BitSquid与游戏开发商Fatshark近日联合公布了一个展示DX11强大技术的DEMO。这个名为《StoneGiant》(石巨人)的DEMO,可以让玩家来测试自己PC显卡的DX11性能。BitSquid Tech即将提供PC平台的引擎,并且大概在今年第三季度将提供PS3和Xbox 360等其他平台的引擎。
画面设置:StoneGiant是一款技术演示Demo,画面做的非常精美,进入之后可以选择开启关闭Tessellation以及DOF(DX11级别景深)进行测试,这两项技术都十分消耗资源,尤其是同时打开时。其中Tessellation技术对画质的改善最为明显,但DOF仔细看也有不小的画质提升,所以我们这里将Tesselation和DOF都开启进行测试。
测试方法:游戏自带Benchmark。
《石巨人》这款游戏在Tesselation方面更为极端。从测试结果我们可以看出,拥有完整的16个多形体引擎的GTX580表现非常神勇,拥有15个多形体引擎的GTX570以及GTX480表现也非常不错,但两款A卡表现相对来说太差劲了,这个测试程序虽然非常极端,但可以很好的体现出A卡的架构在DX11曲面细分方面的劣势。
游戏介绍:Crysis(孤岛危机)无疑是DX11出现之前对电脑配置要求最高的PC游戏大作。Crysis的游戏画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。Crysis还有个资料片Warhead,使用了相同的引擎,只是多了一个关卡,因此我们还是使用原版做测试。
画面设置:Crysis只有在最高的VeryHigh模式下才是DX10效果,但此前所有高端显卡都只能在低分辨率下才敢开启DX10模式,如今的DX11显卡终于有能力单卡特效全开流畅运行。我们直上1920x1200高分辨率,开启4AA和8xAA两种模式进行测试。
测试方法:Crysis内置了CPU和GPU两个测试程序,我们使用GPU测试程序,这个程序会自动切换地图内的全岛风景,得到稳定的平均FPS值。
虽然显卡已经更新换代数次,但《孤岛危机》仍然是目前的杀手级游戏,在1920分辨率下只有GTX580敢说真正流畅,而在2560×1600分辨率下GTX580也只能跑20多帧。即便如此,究竟哪一款显卡性能更好还是能看出来的,我们看到在两种分辨率下GTX570均稍稍领先于显存规格更高的GTX480。
游戏介绍:《冲突世界》将带领玩家返回著名的冷战时期,玩家每一个决定均影响游戏中人物和情节。可于游戏中感受不一样的团队精神,与队友于阴森恐怖的战场上一同作战。《苏联进攻》是其最新的资料片,收录全新角色、扮演苏联军队、10套新影片和全新多人联机地图等等。
画面设置:《冲突世界》是首批DX10游戏之一,采用了自行研发的MassTech引擎,支持多种当前的主流显示特效,如容积云,景深效果,软阴影等,光照系统也表现出色,尤其是半透明的容积云特效营造出了十分逼真的户外场景,物理加速结合体积光照渲染出了最逼真的爆炸效果。
测试方法:内置Benchmark是一段非常华丽的过场动画作为测试程序,最终得出最大、最小和平均FPS,测试结果非常精确。WIC最高支持4AA,因此我们只测试4AA16AF模式。
《冲突世界》是一款非常华丽的DX10游戏,但引擎优化的不错,基本难不倒目前的高端显卡。我们可以看到即使在2560×1600这样的极限分辨率下,所有的显卡都能够流畅运行。不过在这款游戏中我们也一样可以看到显卡与显卡之间的性能分级,GTX580无疑是单卡王者,GTX480和GTX570性能相同,而最新发布的HD6870性能最低。
游戏介绍:自《孤岛惊魂》系列的版权被UBI购买之后,该公司蒙特利尔分部就已经开始着手开发新作,本作不但开发工作从Crytek转交给UBI,而且游戏的故事背景也与前作毫无关系,游戏的图形和物理引擎由UBI方面完全重新制作。
画面设置:借助于蒙特利尔工作室开发的全新引擎,游戏中将表现出即时的天气与空气效果,所有物体也都因为全新的物理引擎,而显得更加真实。你甚至可以在游戏中看到一处火焰逐渐蔓延,从而将整个草场烧光!而且首次对DX10.1提供支持,我们在这里依然将其当作DX10游戏进行测试。
测试方法:游戏自带Benchmark工具。
在《孤岛惊魂2》这款游戏中,显卡的性能级别也体现的非常明显,但本次参测的所有产品都可以在最极限的设置下流畅跑完该游戏的BenchMark程序。我们看到,在1920分辨率下,GTX580是唯一一个平均帧数超过100FPS的显卡,同时GTX570再次明显领先于GTX480以及两款AMD产品。
游戏介绍:CAPCOM公司于1987年推出的大型电玩机台格斗游戏《街头霸王》,堪称目前格斗类游戏的始祖。经过了20多年的不断演化之后,如今的PC版《街头霸王4》不仅在画面上走向了全新方向,而且加入了各种新系统,试图让传统2D格斗游戏得到重生。
画面设置:街霸4 PC版和游戏机版相比,除了支持高分辨率输出之外,还为玩家提供了画面渲染风格选择的功能,除与家用机版一样的“普通”模式外,还有“水彩”、“海报”和“烟灰墨”这三种追加的渲染风格,带给完全全新的视觉体验。
测试方法:测试时使用游戏自带Benchmark。由于游戏要求较低,因此直接开启最高的8xMSAA+16AF模式。
《街霸IV》这款游戏中各款显卡都表现很正常,GTX580与其他各款参测显卡都拉开了差距。不过这款游戏似乎对显存带宽有些敏感,GTX570稍稍落后于GTX480。
游戏介绍:《黑手党2》(Mafia II)将带领玩家进入1940年至1950年虚构的地下世界,就像好莱坞电影般的游戏世界,玩家可在拟真的城市中冒险。在1940年代的城镇中,居民如同往常过着平静的生活,帮人擦鞋、卖报纸,而路边偶尔会出现黑帮份子。
画面设置:这是一款支持PhysX GPU物理加速的最新游戏,但依然使用了DX9C引擎,因此画面本身并不出彩,但大量的爆炸、烟雾、破碎、衣料等物理效果还是很不错的。
测试方法:游戏自带Benchmark,内置的抗锯齿并不知道是多少倍数,分为不开PhysX和High两种模式进行测试。
以上两张柱状图体现的是这款游戏在不开启 PhysX物理加速的情况,当分辨率为1920×1200时,GTX580性能领先其他各款显卡都非常明显,但当分辨率升至2560×1600时,GTX570以及上一代的GTX480表现都非常不错,大幅度缩小了与GTX580的差距。
而接下来的这两张柱状图体现的是当开启PhysX物理加速之后N卡的性能表现(A卡不支持PhysX物理加速所以未测试),最终的结果GTX570依然稍稍领先于GTX480。
MediaCoder是一个免费的通用音频/视频批量转码工具,它将众多来自开源社区的优秀音频视频编解码器和工具整合为一个通用的解决方案,可以将音频、视频文件在各种格式之间进行转换。MediaCoder具备一个可扩展的架构和丰富的功能,可满足各种场合下的转码需求。目前,MediaCoder的用户已经遍布全世界170多个国家。
通俗一点的说:玩高清的朋友一定用过终极解码或者完美解码吧,终极解码就是整合了一大堆播放器和解码器的视频播放软件,而MediaCoder就是整合了一大堆编码器和插件的视频转码软件。功能大而全、灵活性高、开源、免费是这类软件的共性,如果要为MediaCoder起个中文名称的话,笔者认为“终极转码”或者“完美转码”都不错^_^。
MediaCoder的版本更新非常频繁,其开发团队在马不停蹄的加入各种新的功能并优化转码效率,自引入CUDA编码器以来就针对用户的需求以及发现的BUG不断修正,目前已经趋于完善。
由上图可以看到GTX570利用NVIDIA的CUDA技术在短短10分钟的时间里,就将一个大小为1.3G、片长为30分钟的视频,轻松转成720P的MP4,平均帧率达到了69.7fps。而如果适用CPU进行同样的操作,性能会比这个弱很多,这正是CUDA通用计算在视频转换领域的应用。
Folding@home是一个由斯坦福大学主持,全球主要硬件厂商共同参与的大规模公益性分布式运算项目。其主要是研究了解蛋白质折叠、误折以及相关的疾病,主要研究的疾病包括:癌症、阿兹海默症、亨廷顿病、帕金森氏症等。我想,这是一个比单纯跑各种Benchmark来得更有价值的事情。
在我们进行GTX470/480首发评测的时候,由于Folding@home官方版本还没有可以支持GTX400和HD5000的显卡,所以只能使用NVIDIA给的离线测试包进行测试。而就在几天前,Folding@home发布了最新的GPU版本GPU3,终于可以支持GTX400系列显卡,但不能支持HD5000。本次我们就使用这个版本的Folding@home进行在线蛋白质折叠运算测试。
GTX470 Folding@home 性能:908ns/Day
GTX570 Folding@home性能:1103ns/Day
我们可以看到,NVIDIA的CUDA在Folding@home这个项目上已经非常成熟,相应的客户端程序已经完全可以利用显卡的CUDA核心数量,由于新一代GTX570 CUDA核心数量比上一代GTX470要多,所以成绩也更好一些,反之亦然。
Folding@home是一个每一位拥有PC的用户都可以通过自己的电脑造福全人类的项目,而且基本不会影响电脑的性能,我们希望PCPOP有更多的读者加入到此项目中。
我们的功耗测试方法是直接统计整套平台的总功耗,既简单、又直观。测试仪器为微型电力监测仪,它通过实时监控输入电源的电压和电流计算出当前的功率,这样得到的数值就是包括CPU、主板、内存、硬盘、显卡、电源以及线路损耗在内的主机总功率(不包括显示器)。
● GTX570待机功耗152W,满载功耗347W
在测试中我们选用了GTX480、GTX470与HD5870进行了对比,可以看到在满载状态下GTX570的功耗相比上代GTX470减少30W左右,而相比GTX480更是减少了100W以上。而待机状态下4款参测显卡相差不到20W,其中HD5870功耗最低为137W。
● GTX570待机温度47度
● GTX570满载温度83度
从测试中不难看出,GTX570对发热的控制相当不错,在待机情况下频率仅为47度,而在满载情况下为83度,明显好于GTX480/470的水平。
从8600/8500开始,NVIDIA率先支持高清视频硬解码,但仅限于H.264编码,对于VC-1依然是半硬半软式,虽然也能流畅播放高清视频,但比对手少一项功能终归不是滋味。
NVIDIA一步步实现VC-1完全解码
于是,从G98核心开始,NVIDIA将高清解码引擎升级到VP3版本,为VC-1编码提供了完全硬解支持,AMD的UVD引擎再也没有值得骄傲的资本了。
NVIDIA随后还提供了高清视频双流解码技术,同时硬解两部HDTV,支持蓝光画中画功能。次年,AMD在HD4000系列GPU中升级至UVD2引擎,同样支持双流解码和超高码率视频硬解码。在互相攀比与学习的过程中,双方在高清解码方面的实力不相上下。
此外,NVIDIA可以通过CUDA计算技术动用流处理器资源进行高清视频解码加速,兼容性和画质比专用的视频引擎更胜一筹。而AMD在GPU通用计算方面比较落后,不支持该技术。因此综合来看,在高清解码的应用方面,还是NVIDIA更强一些。
● HDMI音频输出之争
但是NVIDIA还有个软肋,HDMI音频输出还是需要“飞线”。当时的NVIDIA也意识到HDMI必将成为消费级市场的主流接口,虽然对HDMI也提供了支持,但其中的音频信号必须从板载声卡导入,安装和设置都非常麻烦。NVIDIA的这种实现方法被称为“飞线式”HDMI音频输出。
通过SPDIF为显卡导入音频信号
AMD针对GPU内置声卡与HDMI一线式输出技术进行了大肆渲染,搞得NVIDIA比较难堪。于是从GT220和GT210核心开始,NVIDIA终于内置了音频模块,为HDMI提供7.1声道数字音频输出,终于摆脱了“飞线”的困扰。
但是,经验老道的AMD又有了新的玩法,在HD5000时代对内置的音频模块进行大幅升级,如今HD5000全线显卡都能够通过HDMI接口向AV功放输出7.1声道音频,除了传统的AC-3、AAC外,首次支持次世代的Dolby TrueHD和DTS Master Audio源码输出!
这是历史上第一次通过显卡为功放输出未经压缩的源码音频流,此前必须使用价值不菲的中高端声卡才能实现。虽然玩高清与HiFi的毕竟是少数人,国内玩家更是少之又少,但AMD的这一做法得到了高清玩家的高度赞赏,好评如潮!
免费附送的功能总比没有强吧,相信很多用户都是这种心态,尤其是在媒体的大肆渲染之下。以NVIDIA的设计实力,不是做不出来,而是想不想做的问题。于是在全新设计的GF104核心中,NVIDIA加强了HDMI Audio,支持bitstreaming Dolby True HD和DTS-HD Master。如此一来,HD5000系列的一大技术优势将不复存在。
事实上,在GF104之前,还有一款显卡也能支持次世代音频源码输出技术,那就是Intel内置在Clarkdale核心(Core i5 6XX和i3 5XX)里面的GMA HD集成显卡,这款显卡及其高清技术都是免费附送的。真正需要用到该功能的玩家未必会使用AMD、Intel或NVIDIA的显卡,所以笔者认为HDMI Audio之战纯粹是王者的意气之争,就是为了堵上竞争对手的嘴。
早在一年半以前,NVIDIA就正式发布了3D Vision立体显示技术,并且联合显示器厂商推出了120Hz的3D显示器,为广大游戏玩家带来了真正切实可用的3D立体解决方案。到了今年,多部重量级3D电影巨作的上映,让更多的用户一睹立体显示的震撼效果,直接推动了3D立体的需求,2010成为了3D立体元年。
确实,3D游戏发展至今,画面很难会有质的提升,但3D Vision技术的引入可以给人眼前一亮的感觉,可以说又是一场视觉革命:
NVIDIA经过多年的发展,产品和技术方面已经非常成熟了,目前几乎所有的PC游戏都能近乎完美的支持3D Vision技术,配以3D眼镜和120Hz显示器的话,就能得以完美呈现。此前之所以未能得到普及,是因为用户了解还不够多,另外3D显示设备量价都不如人意,而现在时机成熟了。
如今,所有的PC游戏都能支持3D Vision技术,所有的2D普通电影都可以通过PowerDVD搭配CUDA技术实时虚拟成3D影片,片源也不再是问题。加之今年3D显示器如雨后春笋般出现在市场上,价格已经贴近主流,普通用户组建一套3D PC不再是痴人说梦。
三屏3D构建梦幻游戏平台
据黄仁勋先生称,2010年南非世界杯的3D转播全部使用NVIDIA解决方案,由NVIDIA GPU驱动,可见3D Vision技术已经获得了业界的一致认可,引领整个行业快速进入3D立体时代!
NVIDIA的3D立体设置与显卡驱动设置浑然一体,非常容易上手
AMD必须借助IZ3D第三方驱动解决方案
在上月的台北电脑展上,AMD也正式公布了基于Radeon显卡的3D立体解决方案,该技术与NVIDIA类似,也需要120Hz显示器和液晶分时眼镜的支持,而使用的驱动引擎为IZ3D的第三方解决方案。
在实现的立体效果方面,双方并没有太大的差别,但本质区别就是:NVIDIA的驱动研发团队经过多年的积累,对于3D游戏的支持度和立体优化远胜第三方解决方案,无论开启3D立体后的性能表现还是对于游戏的支持数量都有着明显优势,针对新游戏也能第一时间提供优化支持,这些都远非第三方解决方案可比。
现在AMD借助IZ3D的力量也迈入了3D立体的殿堂,但实际上IZ3D驱动也能完美兼容N卡。所以在3D立体方面,AMD无论解决方案、游戏效果、游戏兼容性和支持力度,都无法同3D Vision相提并论!
AMD HD5000系列最诱人的技术恐怕就是Eyefinity了,实现三屏环幕的效果确实相当震撼,为游戏玩家提供了非常宽阔的视野。当然这里说的三屏并不是简单的连接三个显示器,而是将三个显示器虚拟成为一个大的分辨率,然后实现超宽分辨率的游戏,这才是玩家最需要的技术。
AMD的GPU在设计之初就考虑到了多屏输出的需要,Cypress核心最多可以提供6个TMDS数字输出通道,Juniper核心最多也能提供5个TMDS。不过实现5屏或者6屏输出只能通过DisplayPort接口实现,使用传统的Dual-Link DVI输出的话,最多只能支持三屏,目前市售HD5000系列都是三屏输出的配置。
6个TMDS通道最多提供6路DP输出,或者3路DVI输出
遗憾的是,NVIDIA新一代的GF100和GF104核心都不支持单GPU多头(三屏以上)输出技术,可能是实现该技术需要对GPU输出模块进行较大的改动,因而来不及加入该功能。但AMD Eyefinity技术目前被炒得火热,该技术不但实用而且非常适合发烧游戏玩家,如果N卡不支持的话会丧失一个非常大的卖点。
为了弥补显示输出方面的不足,NVIDIA灵机一动,双显卡不是可以提供四头输出吗,此前只能单纯组建多头输出,而不能实现超大分辨率。如果使用双显卡,结合SLI技术、并把多头输出合并为大分辨率的话,那就能实现媲美Eyefinity的效果。最终,NVIDIA在不更改硬件的情况下,通过改写SLI驱动,使得双卡能够实现与ATI完全相同的三屏环绕输出。
NVIDIA的三屏需要双卡SLI支持
NVIDIA这种解决方案的缺点就是需要两张显卡才能实现,但优点就是显卡并没有限定非得用刚刚发布的GTX400系列,上一代的显卡也可以,只要组成SLI即可。还有个好处就是SLI系统性能比较强劲,足以带动大分辨率玩BT游戏。
Eyefinity的优势就是单显卡也能支持三屏输出,只需要2D输出的用户可以通过较低的成本组建。但对于3D游戏玩家来说,即便HD5870单卡也未必能够胜任三屏幕玩主流游戏的苛刻要求,此时玩家可能需要购买两块显卡,那么A卡和N卡在功能上就没有优劣之分了,都能提供很完美的三屏效果。
驱动和软件方面是NVIDIA一贯的优势,NVIDIA的SLI环绕配置界面比AMD的Eyefinity更加智能方便,而且不需要DP显示器的支持。AMD的Eyfinity驱动配置起来稍嫌麻烦,还必须要求一个显示器支持DP接口,否则将不能实现三屏输出,限制确实比较多。
新驱动还支持边框矫正技术,操作同样简单方便易上手,让多显示器输出的效果更加接近于真实世界中的窗格。使用边框修正之后,游戏的显示分辨率将会更加开阔。该技术AMD的Eyefinity现在也能支持,这一方面双方做的都不错。
NVIDIA可以实现2D三屏与更高级的3D三屏
当然,最具有特色的就是,三屏环幕结合3D Vision技术,实现3D立体3屏环绕技术,足以产生令人震惊的显示效果。目前AMD的三屏3D技术还停留在实验室和展示阶段,因为3D显示器必须要求使用Dual-Link DVI接口或者HDMI 1.4接口传输双倍的数据流,普通的A卡还不能支持。
PhysX是NVIDIA的一大法宝,在NVIDIA DX11显卡面世之前,旧的N卡正是凭借该技术与A卡相抗衡。通过笔者此前的网友调查来看,虽然PhysX的关注度没有DX11那么高,但还是拥有很多忠实的用户,一些玩家为了同时追求DX11与PhysX,费尽心机通过破解杂交的方式来让N卡和A卡协同工作。
《地铁2033》:同时支持DX11和PhysX
如今GTX480/470正式发布,同时支持DX11和PhysX,玩家没必要再瞎折腾了。而且刚刚发布的《地铁2033》这款游戏对DX11和PhysX都提供了支持,看来不光是玩家,开发商对于PhysX也比较热衷,毕竟这是目前唯一一款支持GPU加速的物理引擎,而另一款物理引擎Havok在被Intel收购之后一直处于雪藏状态,只支持CPU加速,不支持GPU加速,物理效果都是轻量级的,远不如PhysX那么夸张惊人。
此前想要实现物理效果必须购买专用的物理加速卡,而NVIDIA收购了Ageia公司之后,将PhysX技术以完全免费的形式附送给了GeForce显卡,让N卡用户多了一个非常炫的功能。
NVIDIA在游戏界有着举足轻重的影响力,和众多游戏开发商保持着密切的合作关系,大名鼎鼎的“The Way”计划就保证了N卡在几乎所有游戏大作中都有着良好的性能发挥。PhysX物理引擎被NVIDIA收入囊中之后,原本屈指可数的物理游戏逐渐开花结果,以《镜之边缘》、《蝙蝠侠》、《黑暗虚空》为代表的一些重量级大作开始使用PhysX物理引擎,影响力非同小可。
国产FPS网游MKZ中爆炸、破坏、玻璃和布料使用了PhysX技术
而且,中国本土游戏开发商也开始使用PhysX引擎来增强画面,比如《MKZ铁甲突袭》和《剑网3》都内置了PhysX支持,可见PhysX技术显然要比其它同类物理技术更易用一些。
国产网游《剑网3》中,使用PhysX实现了逼真的衣物和布料效果
虽然物理加速技术还没有一个统一的标准,但PhysX无论从游戏数量还是画面效果方面,都更胜一筹。随着使用PhysX引擎的游戏越来越多,少有的PhysX显然将会成为事实上的标准。
新发布的GTX480/470/460系列显卡在PhysX加速方面的性能有了长足的进步,但NVIDIA上一代显卡如果单独拿来做物理加速卡的话,性能也很足够,特效也不会损失,因为PhysX考验的是CUDA并行计算效能,与DX API支持度无关。然如果N卡用户想要升级到GTX480/470的话,旧显卡没必要淘汰。
AMD目前的处境比较尴尬,此前过多的依赖于Havok引擎,希望新版的Havok FX引擎能够早日面世,为A卡提供支持。但是Intel收购之后希望主要使用CPU加速物理效果,导致AMD一筹莫展,之前一些AIB厂商宣称A卡能够支持Havok GPU加速纯粹是无稽之谈。此后AMD寻求第三方合作伙伴的支持,积极加入开源物理加速项目,但目前还没有什么实质性的进展,至今没有任何一款游戏能够支持AMD的GPU加速物理。
提起GPU通用计算,自然会让人想到NVIDIA的CUDA、ATI的Stream以及开放式的OpenCL标准,再加上微软推出的DirectCompute,四种技术标准令人眼花缭乱,他们之间的竞争与从属关系也比较模糊。
首先我们来明确一下概念:
1. OpenCL类似于OpenGL,是由整个业界共同制定的开放式标准,能够对硬件底层直接进行操作,相对来说比较灵活,也很强大,但开发难度较高;
2. DirectCompute类似于DirectX,是由微软主导的通用计算API,与Windows集成并偏向于消费领域,在易用性和兼容性方面做得更出色一些;
3. CUDA和Stream更像是图形架构或并行计算架构,NVIDIA和ATI对自己的GPU架构自然最了解,因此会提供相应的驱动、开发包甚至是现成的应用程序,通过半开放的形式授权给程序员使用。
其中ATI最先提出GPGPU的概念,Folding@Home和AVIVO是当年的代表作,但在被AMD收购后GPGPU理念搁浅;此后NVIDIA后来者居上,首次将CUDA平台推向市场,在这方面投入了很大的精力,四处寻求合作伙伴的支持,并希望CUDA能够成为通用计算的标准开发平台。
NVIDIA CUDA架构示意图
在NVIDIA大力推广CUDA之初,由于OpenCL和DirectCompute标准尚未定型,NVIDIA不得不自己开发一套SDK来为程序员服务,这套基于C语言的开发平台为半开放式标准(类似与Java的授权形式),只能用于NVIDIA自家GPU。AMD始终认为CUDA是封闭式标准,不会有多少前途,AMD自家的Stream平台虽然是完全开放的,但由于资源有限,对程序员帮助不大,因此未能得到大量使用。
ATI Stream示意图
DX11时代我们迎来了微软的DirectCompute 11和OpenCL这两大GPU计算API,其定位就相当于3D图形领域的DirectX和OpenGL。就如同GPU能同时支持DirectX与OpenGL那样,NVIDIA和AMD对DirectCompute和OpenCL都提供了无差别支持。
我们希望新API的出现能够打破目前GPU计算领域混乱的格局,并带来更多实用的应用和软件,但从目前的发展方向来看,进展还是相当缓慢。当前主流的一些GPU计算类软件,主要还是集中在视频转码和编辑方面,都是以NVIDIA和AMD的CUDA/Stream技术为主。
就拿视频转码来说,ATI驱动集成的AVIVO转码器功能太过简单,转换后视频的画质很差,而且主要依靠CPU转码,跟GPU的关系不大。而NVIDIA的Badaboom完全依靠GPU转码,GTX480的性能都能完全释放出来,MediaCoder更是能够充分发挥出CPU和GPU的效能,成为目前转码速度最快的软件;MediaShow能同时支持A卡和N卡,主要依靠CPU转码,对GPU的要求很低,双方性能差距并不明显。
而在视频编辑和应用方面,目前视频倍线软件和2D转3D的软件能够同时支持CUDA和Stream技术,但一般都是等支持CUDA大半年之后,才加入对Stream的支持。此外还有一些加密解密、视频修复软件只支持CUDA不支持Stream,很显然AMD对于GPU计算方面投入的精力还不够多,支持Stream的软件无论数量还是质量都跟CUDA相差一大截。
自GTX580发布之时起,业界就不断有人怀疑新一代的GF110只是“新瓶装旧酒”,但由于当时条件的限制还无法对其进行验证。不过今天这款GTX570发布彻底打消了人们的疑虑:GTX570核心规格和上一代GTX480相当接近,且显存位宽还减少了64bit,即便在这种情况下GTX570的整体性能还是要明显超出GTX480。同时功耗大为下降,满载时的功耗甚至比GTX470还要低出不少。由此可见NVIDIA的确为新一代的GF110核心进行了大副优化。
而从价格端来看,NVIDIA这次所给出GTX570官方指导价格非常厚道,仅为2999元。再结合性能来看,正如上面所说GTX570在绝大部分游戏上的表现相比更高端GTX480依然比较强势,由此可以推断GTX570将彻底改变高端显卡市场的格局。
由于时间的关系,可能本次首发评测中的测试项目并不全面。关于玩家们最感兴趣的超频测试,小编会在稍后放出敬请期待!■