泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

携DX11五大特性:微星GTX480/470评测

    泡泡网显卡频道4月23日 经过数次跳票,基于Fermi架构的GTX470/480终于在晚竞争对手6个月之后发布了。不过令我们欣慰的是,NVIDIA并不完全因为40nm工艺问题延误了发布时间,而是在打造一个被称为“真DX11”架构的新产品。从全球媒体的评测数据来看,GTX480与GTX470在性能方面也体现出了其“真DX11”架构的优势,尤其是在一些新的DX11游戏中,非常明显的表现出了相对于HD5000系列显卡的强势。

军规级做工用料!微星GTX480/470评测

    作为一款全新架构的产品,GTX480/470发布之后,各大合作伙伴也争相推出了自有品牌的GTX480/470显卡,首批产品绝大部分来自NVIDIA的AIC合作伙伴,今天我们要给大家介绍的就是来自连续五年荣获销量冠军的微星推出的GTX480与GTX470。

msi微星N480GTX-M2D15显卡

微星 (MSI) GTX480——N480GTX

msi微星N470GTX-M2D12显卡

微星 (MSI) GTX470——N470GTX

    微星推出的这两款GTX480/470产品和首批上市的绝大部分产品一样,采用纯公版设计,两者都采用先进的40nm工艺,其中GTX480拥有480个流处理器,搭配1536MB/384Bit的GDDR5显存;而GTX470则采用448个流处理器,搭配1280/320Bit的GDDR5显存。两款显卡在频率方面也有所区别,GTX480默认频率为700/1401/3696MHz,而GTX470为607/1215/3348MHz。

    前面我们说到,NVIDIA之所以花费了这么长的时间打造一款“真DX11”的产品,为什么要这么做呢?这还得从DX11架构的特性说起!

    从游戏画面逼真度来看,短期内恐怕没有哪款游戏能够达到Crysis的高度,但是这款依靠暴力模型、着色技术和诸多特效堆积而成的游戏,对显卡的要求之高令人叹为观止,至今都没有哪颗GPU敢打包票说能在最高特效下面流畅运行。也就是说CryEngine 3是丝毫没有考虑现有GPU的性能而开发的一款超级引擎。


虚幻3是最高效最成功的引擎,Cryengine只是画面最强的引擎

    以高效率著称的虚幻引擎缔造者Tim Sweeney称,想要把现有游戏模型复杂度提高数十倍是很容易的事情(比如CG模型和影视渲染),但同样的你也需要数十倍与现有主机机能的显卡才能流畅运行,比如三路甚至四路优异系统,而这种系统的市场占有率连1%都不到,独孤求败的Crysis还卖不过快餐式的使命召唤系列、Cryengine至今无法染指游戏机领域就是这个道理。

    所以,架空硬件的引擎是不可取的,唯有充分利用有限的GPU资源,通过各种辅助技术最大化画面表现力,才是图形技术公司和游戏开发商首当其冲要解决的内容。

    因此,在DX10发布四年、成为主流之后,业界将期望都寄托在了DX11身上,虽然DX11并没有带来全新的特效,但却通过各种手段提升了GPU的渲染效率,当GPU有了富裕的运算资源之后,游戏开发商就可以大胆的去使用更多的特效和技术,如此一来DX11游戏很容易就能从画面到速度全面超越DX10游戏!

    DX11最关键的特性有以下五点:

1. Tessellation:镶嵌式细分曲面技术
2. Multi-Threading:多线程处理
3. DirectCompute 11:计算着色器
4. ShaderModel 5.0:着色器模型5.0版
5. Texture Compression:纹理压缩

    DX11的五大关键特性也有主次之分,其中Tessellation和DirectCompute 11堪称革命性的技术,前者可以大幅提升游戏画质、后者可以大大提高游戏效率。接下来,我们逐一对这5大特性进行简单讲解。

● Tesselation

    Tessellation技术最早由ATI倡导,早在DX9C时代,微软XBOX360游戏主机中由ATI设计的Xeno显示芯片就已经开始支持这项技术,从DX10时代到DX10.1时代,ATI HD2000/3000/4000系列显卡全都整合了一个叫做Tessellator的模块,但由于当时该技术并不成熟,而且GPU性能有限,导致该技术一直没能得到游戏厂商的广泛认可。

微软在DX11中专门加入了辅助Tesselation的模块——Hull shader&Domain shader

    直到DX11时代,GPU自身的性能有了长足的进步,硬件上真正具备了细分曲面的实力,再加上微软重新改写API渲染流程,专为Tessellation开辟了新的着色器,这才让Tessellation技术得以重见天日。

完美DX10!ATI新王者HD2900XT权威评测

Tesselation的作用:生成更多真实的顶点

    Tessellation这个英文单词直译为“镶嵌”,也就是在顶点与顶点之间自动嵌入新的顶点。Tessellation经常被意译为“细分曲面”,因为在自动插入大量新的顶点之后,模型的曲面会被分得非常细腻,看上去更加平滑致密。上图就非常形象的反映出Tessellation技术的原理和所实现的效果。

开启/关闭Tesselation技术的房屋瓦片对比

    Tesselation的用途非常广泛,比如取代虚假的视差映射贴图技术、生成物体运动的物理效果、流体的运动效果等等。上面这张图片就是Tesselation最典型应用——细分曲面、取代视差映射贴图。

    除了大幅提升模型细节和画质外,Tessellation最吸引程序员的地方就是:他们无需手动设计上百万个三角形的复杂模型,只需简单勾绘一个轮廓,剩下的就可以交给Tessellation技术自动镶嵌,大大提高开发效率;而且简单的模型在GPU处理时也能大幅节约显存开销,同时大幅提升渲染速度!

● DirectCompute

    在Windows 7发布之后,我们就经常提到了Direct Compute这项技术,简单的说,Direct Compute就是微软开发的GPGPU通用计算接口,欲统一GPU通用计算标准,正面与OpenCL对抗。

    虽说DirectCompute标准才刚刚问世,但目前已经有了三个版本,它与微软的DirectX版本是一一对应的(10.0、10.1、11.0),毕竟DirectCompute目前还只是DirectX的一个子集,羽翼未丰之前难以自立门户。DirectCompute是与DX11一同发布的,因此相比“过去式”的10.0版,DirectCompute 11作出的改进比较多:

    可以看出,同DX11类似,DirectCompute 11的改进主要集中在降低系统资源开销与提高效能方面,也就是说新的DX11显卡会有更强的通用计算效能。而旧的DX10显卡虽然会慢一些,但实现的功能也不会差多少,如此一来就完美的解决的兼容性问题,也能很好的凸出新显卡的优势,用户和厂商皆大欢喜。

DX11新作《地铁2033》当中使用DirectCompute11实现景深效果

    DirectCompute在图像画质方面也有很多应用,比如顺序无关透明、电影级景深特效、高清晰环境光等等,上图就是在《地铁2033》游戏中利用Direct Compute实现的景深特效。

● Shader Model 5.0

    Shader(译为渲染或着色)是一段能够针对3D对象进行操作、并被GPU所执行的程序,ShaderModel的含义就是“优化渲染引擎模式”,我们可以把它理解成是GPU的渲染指令集。历代DirectX每逢重大版本升级时最主要的更新内容就包括在了ShaderModel之中:

    ShaderModel 1.0 → DirectX 8.0
    ShaderModel 2.0 → DirectX 9.0b
    ShaderModel 3.0 → DirectX 9.0c
    ShaderModel 4.0 → DirectX 10
    ShaderModel 5.0 → DirectX 11

    高版本的ShaderModel是一个包括了所有低版本特性的超集,对一些指令集加以扩充改进的同时,还加入了一些新的技术,现在我们就来看看DX11 SM5.0都有哪些新特性:

    由于统一渲染架构的特性,Shader Moder 5.0是完全针对流处理器而设定的,所有类型的着色器,如:像素、顶点、几何、计算、Hull和Domain(位于Tessellator前后)都将从新指令集中获益。

    其中,覆盖采样及Gather4纹理拾取两项指令是从在DX10.1基础上发展而来的,SM5.0要比SM4.1更加智能和灵活,它可以针对特定颜色分别采样、还能自动识别可做阴影映射的值,精度和效率都进一步提高。

    由于DX10.1与DX10在指令方面的相似性,现有的DX10.1游戏可以很容易的通过更新程序代码升级支持DX11,从而获得更好的运行效率,比如《BattleForge》和《STALKER》这两款DX10.1游戏率先对DX11提供了支持。

● Multi-threading多线程处理

    如果一个软件能够对多核心多线程处理器进行优化的话,那么在使用双核或四核处理器时,其运行效率将会提升2-4倍,遗憾的是如今的游戏都无法支持多核处理。

    通过大量的游戏性能测试来看,GPU占绝对主导,而CPU只是考验单核效能,通过对CPU极限超频可以让游戏性能提高不少,但使用四核或者带HT技术的“八核”处理器几乎不会有任何性能提升。在多核成为大势所趋的情况下大量CPU资源被白白浪费,瓶颈可能依然卡在CPU上面。

    DX11当中新增的多线程处理技术,则是专门针对多核应用而生的,它通过引入“延迟执行”的指令将一个渲染进程拆分为多个线程,并根据处理器核心/线程数设定延迟执行内容的数目。多线程的涵义是非常广的,每一帧画面可以被分为几个图层,每个图层又可以分为N个区块,所有的这些都可以被并行调度到延迟执行的线程之中。

    这是一项很聪明的技术,标记为“立即执行”的线程与传统的渲染没有区别,而标记为“延迟执行”的线程则可以在后台将图形生成所必须的资源做预先的存取,比如纹理拾取、像素生成、常数缓冲等操作都可以多线程并行处理,通过多核CPU富裕的资源来减少程序等待时间,从而使得渲染不再受到CPU的瓶颈制约。

    多线程技术是非常灵活的,它既可以在游戏中通过程序代码来控制,也可以通过DirectX自动分配,还能够通过驱动程序进行优化。即便是驱动没有针对多核进行优化,DX11运行库也会通过模拟的方式提供新的功能,也就是说所有DX11游戏都将或多或少的从多核多线程CPU中获益。

    多线程技术的引入对于双卡甚至多卡互联系统更为重要,以往多颗GPU在DirectX中只能模拟成一个虚拟GPU,所有的GPU必须共享指令缓冲区并接受CPU调度,渲染线程的拆分与合并指令延迟都很大,GPU越多则效率越低!而在DX11当中,如果用多核CPU搭配多路SLI系统的话,每颗CPU都可以单独控制一颗GPU的渲染线程,在均分CPU负担的同时,提高了GPU资源利用率,从而大幅提升游戏性能。

    NVIDIA称,GTX480 SLI在DX11游戏中的性能几乎达到了单卡的两倍,而不再是以往的1.8倍左右,这其中DX11多线程技术功不可没,当然也需要驱动程序的大力优化支持。

    其实多线程技术也能应用在DX9/DX10甚至是OpenGL上面,但由于API及函数指令的限制,开启多线程会产生很多重复的指令,导致性能提升有限甚至不升反降,因此微软并不建议在旧API模式开启多线程模式,除非程序员做过严格的测试与优化。

● 两种新的纹理压缩格式:BC6H和BC7

    丰富的纹理细节对于最终图像的质量尤为重要,目前的游戏也都在朝着超大规模、超精细的纹理细节方向发展。但是,大规模的纹理非常占用显存以及带宽。而纹理压缩就是为了解决这个问题,将大规模的纹理以一种优化的算法进行压缩。试想,如果图象的纹理都不进行压缩的话,那么2GB的显存容量恐怕都不够用。

为王位而生 GeForce8800全面解析测试
细致的纹理效果

    但是,目前纹理压缩技术并不支持HDR(高动态范围)图像,这也是开启HDR很占用显存的一个很大的原因。为了解决这个问题,DirectX 11加入了两种新的压缩算法——BC6H和BC7。其中,BC6H是专门针对HDR图像设计的压缩算法,压缩比为6:1;而BC7是专门给高品质RGB[A]纹理设计的压缩算法,压缩比为3:1。

    上图展示的是图像通过BC6H压缩模式进行压缩的前后效果对比图。其中左边的图像为原始图像,中间的是在压缩过程中损失的一些细节,而右边的就是压缩后的图像。可以看出,从画质上来看几乎没有损失(肉眼看不出),但是却可以大幅度降低显存的占用。

    这幅图展示的是BC7针对LDR纹理的压缩与传统的BC3纹理压缩对比。可以看出传统的BC3纹理压缩损失了大量的纹理细节,压缩之后的效果也很不好。而采用BC7算法压缩后的纹理,丢失的细节很少,效果也非常好,这就是改进纹理压缩的魅力。

    前面我们简单的介绍了DX11技术的一些新特性,可以看出DX11最大的作用就是提升GPU的运行效率,并且随着Tesselation技术的引入,在画质方面也有非常大的突破。接下来我们具体看看微星本次发布的这两款产品。

● MSI N480GTX外观赏析

msi微星N480GTX-M2D15显卡

微星GTX480正面,散热器热管直接裸露在外

msi微星N480GTX-M2D15显卡

显卡尾部设有出风口,防止热量堆积

msi微星N480GTX-M2D15显卡

显卡背部,PCB风扇位置经过镂空处理,加大进风量

msi微星N480GTX-M2D15显卡

显卡输出部分,采用双DVI+Mini HDMI设计

msi微星N480GTX-M2D15显卡

显卡、包装、附件全家福

GTX480散热器拆解:常见的涡轮风扇+平行风槽式散热片,热管辅助

    GTX480的散热器实在是不简单,为了充分利用空间,加大散热鳍片密度,四条热管不得不裸露在外(还有一条隐藏在里面);为了加大涡轮风扇的进风量,PCB经过了镂空处理,而且散热器外壳的风扇位置刻意下沉了一段距离,这样就能保证多块GTX480紧挨着插在主板上时,也不会发生散热器吸风受阻影响散热的情况。

    GTX480的散热片是一体式的,外壳直接裸露在外,可以一定程度上加强散热能力。经过镀镍之后的金属外壳也很有质感,使得公版卡别具特色。但该散热片与热管在显卡满载工作时非常烫手,笔者就在拆GTX480显卡时不小心被烫伤了,因为其它所有显卡都用塑料外壳温度并不高,而GTX480的金属外壳几乎与核心温度相同。

● MSI N480GTX内部拆解

    GTX480并没有像ATI那样采用先进的数字供电,但规模和做工用料也非常豪华,我们来仔细看看:

供电相数一目了然:核心6相、显存2相

    GTX480的供电模块使用了CHiL的解决方案,CHL8266是一颗最高支持6相供电的数字式PWM主控,最大输出电流可达200A,最高输出电压2V,可支持400W的核心。CHL8266兼容Intel最新的VMR11.1规范,支持可编程或动态开关相位的节能技术及高转换效率模式,提供了智能调节负载与电压输出的Gamer模式,非常适合大功率显卡使用。

    CHL8266主控搭配6颗CHL8510 MOS管驱动器构成一套完整6相供电回路,每颗CHL8510最高可输出6A电流,6颗可提供超过400W的功率输出,完全满足GF100核心的需要。

电容部分为日系富士通固态电容搭配钽电容的设计

这是+12V滤波电路

    GTX480的TDP(热设计功耗)达到了250W,双6Pin PCI-E供电接口无法提供如此大的功率输入,因此只好采用了8+6Pin的设计,再加上PCI-E接口本身的供电,最高可达300W功率输入。

● MSI N470GTX外观赏析

msi微星N470GTX-M2D12显卡

微星GTX470显卡正面,和公版GTX470一样

msi微星N470GTX-M2D12显卡

显卡尾部预设有出风口,防止热量堆积

msi微星N470GTX-M2D12显卡

显卡背部,PCB风扇位置经过镂空处理,加大进风量

msi微星N470GTX-M2D12显卡

输出部分:双DVI+Mini HDMI

msi微星N470GTX-M2D12显卡

微星GTX470包装及附件全家福

    GTX470的散热器结构与GTX480完全相同,但散热片小一些,热管也少一根,由于体积的缩小,GTX470包括弯曲热管在内的所有散热片都可以被装在外壳里面,没有任何金属裸露在外,不用怕被烫伤了。

● MSI N470GTX内部拆解

    GTX470的PCB比GTX480更短小,因此元器件的排列密度更高了,不过各大模块的布局依然十分清晰。

    GTX470的核心代号是GF100-275,也是40nm工艺A3步进。这颗核心被屏蔽掉了两组SM,也就是64个流处理器和8个纹理单元,另外还屏蔽了组64bit显存控制器,光栅单元少了8个。

    依然是三星GDDR5 32Mx32显存颗粒,但速度慢了一点,0.5ns理论频率是4000MHz。而GTX470的默认显存频率只有3350MHz,最终显存带宽只比HD5850高一点点。

    320bit的显存位宽只需要10颗显存颗粒就能满足,比GTX480少了两颗,因此GTX470的显存规格就是1280MB,容量也少了256MB。

    GTX470的供电部分也经过了重新设计,电源主控更换为安森美半导体的NCP5388 4相PWM控制器,兼容Intel VMR11.0规范,不支持动态节能技术。这颗主控经常出现在中低端显卡之上,不过该主控同样具有大电流稳定输出的能力。

    供电模块的做工用料比较传统,可谓是比上不足比下有余。

    输出接口同样没有安装DVI屏蔽罩,对于普通1920x1200级别分辨率可能影响不大,但如果使用2560x1600分辨率的显示器或者120Hz 3D显示器的话,就有影响了。

    对微星产品经常关注的朋友应该知道,在去年微星显卡提出了“军规级”用料标准,根据微星给出的资料,军工级用料应当包含以下三要素:

1、SSC固态静音电感
2、Hi-C电容(高导电聚合物电容)
3、军工级固态电容

    那么,最新发布的微星GTX480/470是否满足这三要素呢?我们不妨来单独看一看:

● SSC固态静音电感

    我们就拿相对低端的GTX470来说,显卡上采用的电感并非我们平常见到的电感线圈,而是非常豪华的密闭式固态电感,由于内部为固体,自然不会发出声音,故满足条件。

● Hi-C电容(高导电聚合物电容)

    GTX470上同样采用了“军规”标准中要求的Hi-C电容,Hi-C高导电聚合物电容其核心采用“钽”,钽是一种极其稀有的贵重金属,化学特性稳定,耐温非常高,导电性惊人,故这一项也满足“军规”用料标准。

● 军工级固态电容

    这种固态聚合物电容已经很常见了,基本上在高端显卡上都会采用,GTX470也自然会采用这样的电容。这种固态聚合物电容具有高容量、超长寿命以及超低ESR值等特性。这一点也完全满足微星“军规”用料的要求。

    所以,虽然是采用公版设计,但微星本次发布的GTX470/480依然完全符合其推出的“军规”用料标准,不管在显卡品质、寿命以及超频潜力上都有保障。

    由于这两款产品都是纯公版产品,GTX480/470首发评测文章中已经有非常详尽的评测数据,故我们本次就不做专门的测试,直接饮用之前文章中评测的部分成绩。为了更加具有代表性,我们直接引用7款DX11测试程序在1920×1200分辨率下的成绩,更加详细的测试数据请直接查阅《革命性DX11架构!GTX480/470权威评测》:

● 《Heaven Benchmark》

● 《BattleForge》

● 《STALKER:COP》

● 《尘埃2》

● 《异形大战铁血战士》

● 《战地:叛逆联队2》

● 《地铁2033》

    从所有DX11程序的测试结果来看,很明显GTX470/480在性能方面是领先竞争对手的HD5850/HD5870的,这也正是NVIDIA“真DX11”架构的体现。由于在GTX480/470首发评测里所有的总结都非常详细,这里就不做过多赘述了。

    之前我们已经多次介绍过微星的一款显卡超频软件——Afterburner,这款显卡超频软件不仅仅可以实现传统超频软件的所有功能,其最大的特点是可以支持通过给显卡加电压的方法进行超频。随着GTX470/480的发布,这款超频软件也很快加入了最新显卡的支持,最新版本已经加入了GTX470/480电压调节。

性价比提升达13%!GTX480加压超频评测

    上图就是通过微星的Afterburner将GTX480的核心电压调到了1.113V(默认为1.0)的情况,不过由于GTX480本来发热量就很大,建议普通用户超频别超过1.1V,而且应当将风扇转速设置为全速运转。

携DX11五大特性:微星GTX480/470评测

   国外的TweakTown网站日前使用微星的这款软件,在风冷情况下成功的将电压加到了1.125V(软件所支持的最大值),显卡频率设定在了864/1728/4276MHz,最终在运行于4.2GHz的i7处理器上得到了如上图的3DMark Vantage成绩——P25923。

    当然,我们极力不推荐你这么做,因为这样会导致显卡非常热,除非你有非常强劲的水冷散热系统。在这里我们只是向大家介绍微星这款强悍的超频软件而已,如果你非得尝试,请自行承担风险。

    早在去年9月,AMD就率先推出了DX11架构的HD5870,随后又连续发力陆续推出了面向高端、中端、主流及低端的HD5000系列DX11产品,可以说在DX11产品发布方面,NVIDIA落后了很久,至少落后了半年。

    但是,现在NVIDIA的DX11产品已经正式发布并上市,采用NVIDIA核心的DX11时代已经正式到来。从测试的性能和产品的规格方面来看,这半年的时间并没有让我们白等。相对于ATI仅仅是在上一代产品中加入DX11功能的做法来说,NVIDIA对消费者和整个产业更加负责,专门为DX11设计了全新的架构。

    从目前的形式来看,NVIDIA最新发布的GTX480/470相对于竞争对手具有一定的优势,全新的架构不仅仅带来了性能方面质的飞跃,也很好的诠释了DX11这一代全新API应有的特性。不过,AMD也不是吃素的,我们了解到目前AMD已经在全力准备HD6000系列产品。

msi微星N480GTX-M2D15显卡    msi微星N470GTX-M2D12显卡

   单从本次我们介绍的微星这两款产品来看,虽然产品本身和公版完全一样,没有什么特别的可圈可点的地方,但鉴于目前GTX480/470整体铺货还在刚开始的阶段,作为国际一线大厂的微星在售后服务方面也有保障,打算购买GTX470/480显卡的朋友不妨去市场上看看微星的GTX470/480有没有货。■

0人已赞

关注我们

泡泡网

手机扫码关注