深度解读DX10架构!Shader激超2200MHz
回望过去DX7时代3DFX的陨落;DX8时代NV与ATI的双雄争霸;DX9时代NV从NV30的绝对劣势到NV40的反击确立性能王者地位,作为业界最广泛被使用的图形接口,DirectX的每一次升级都给业界带来近乎翻天覆地的变化,当然到了DX10时代来临的时候同样如此。机会总是稍瞬即逝的,如何能在DirectX更新换代时抓住先机是显卡芯片厂商每一代显示芯片的兵家必争之地,G80的抢先发布无疑是给AMD R600给了沉重的压力。
从G80开始NV为新一代的显示芯片带入了统一着色器架构(Unified Pipeline and Shader Design),简单地说就是不同于从前那样分开Pixel Shader、Vertex Shader等等不同类型的Shader单元去处理数据,而是以一个被称为GigaThread的线程处理器根据不同的工作负荷分配流处理器完成各种指令。这样设计的好处是,加上标量架构设计的配合,即便是面对各种各样的图形接口,显示芯片都能够以最高的工作效率运作,而不会出现Pixel或者Vertex上的自愿浪费,影响效能。
以G80为例,128个标量化流处理器扮演着顶点着色器、几何着色器、像素着色器等等的角色。与以往不同,当Pixel、Vertex等等的渲染工作就交由标量化流处理器完成,那么大部分渲染工作的完成效能就涉及到流处理器频率的问题。以往我们惯用提升显卡效能的手段无非是提高显卡核心频率或者显存频率,再要提高效能充其量就是在显存的时序上动些手脚,但在承继了G80统一着色器架构的显卡上,除了核心频率以及显存频率外影响效能的还有标量流处理器Shader的频率,而这个Shader的频率在不少玩家口中流传着一种说法就是Shader频率决定了效能的高低,而核心频率的作用被Shader频率的作用淡化。
而事实上我们可以从NV官方放出的架构图上见到,无论是Texture Flitering(TF)还是Texture Addressing(TA)都是和Streaming Processors分离的独立单元,此外NV的官方文档也提及了很重要的一点:CoreClock是控制着包括dispatch、textuneunit和ROP unit的效能,也就是说单单从理论上看,在显卡处理运作的时候,实际上Shader频率提升后,如果CoreClock维持,当Shader处理能力很强,但Textuneunit或者ROP一旦出现瓶颈,那么显卡性能还是不会有大幅提升。
值得一提的是,在高端的G80身上被验证是成功的统一着色器架构被NVIDIA带进Geforce 8系列中低端显卡中。而事实上作为G80精简3/4、7/8后的G84/G86并没有表现出与G80性能精简后同比列后相似的性能,实际上是流处理器优化的问题。
如此以来我们再去验证下究竟是超频流处理器Shader频率还是整体超频能未显卡整体效能带来更大的性能提升。
硬件平台 | |
CPU | Intel Core 2 Duo E6600 oc 400x9 3.6G |
内存 | V-Data DDRII 800 2x1Gb |
主板 | Gigabit P965-DS4 |
硬盘 | Seagate 7200.10 250G |
电源 | 航嘉500w |
操作系统 | Windows XP Professional + SP2 |
测试对象 | 影驰Geforce 8600GTS |
影驰最近的8600GTS经过改造后频率能够达到惊人的1000/2200/2500MHz,其中Shader频率相当高,显卡频率规格高,同时还留有超频余地,因此是测试ShaderCore以及ClockCore不错的选择。
与其它AIC不同,影驰拥有很强的产品设计研发实力,旗下所有8600系列产品都采用了自家非公版设计,其中有控制成本定位低端的版本,也有不惜用料定位超频玩家的版本。最新的这款8600GTS骨灰魔魂属于影驰8600系列最高档的版本,自然在做工用料方面令人无可挑剔、叹为观止:
● 做工精良、不惜用料、卖相充足
酷冷至尊最新的“龙骨”热管散热器、三洋SVP固体贴片电容、镀镍带屏蔽的双DVI接口、0.8ns显存、玩家系列特殊功能……,影驰显卡无论从哪方面来说,都是市面上8600显卡中的最强者!
● 供电模块特写,3相式全固态
对于一款超频版显卡来说,供电模块的重要性不言而喻。可以看到影驰采用了核心2相+显存1相的分离式设计,3颗电感都是全封闭磁蔽型号,核心和显存供电部分的电容都是目前最高档的三洋SVP固体贴片电容。还有两颗普通电解电容是给控制芯片供电,负载很小因此没必要使用高档电容。
● 默认频率720/2200MHz
G84-400就是8600GTS核心,支持HDCP,8600GTS的默认频率是675MHz,影驰出厂就给超频到了720MHz。显存使用了最快的0.8ns颗粒,默认频率2200MHz,还有很大的超频潜力!
● 酷冷最新“龙骨”热管散热器
默认高频率,发热自然更大,影驰为其配备了酷冷最新版的“骨灰”散热器,散热效率高而且很安静。
这款散热器得造型非常夸张,粗壮的热管给人一种安全感,散热片也非常密集,结构确实和思民VF-900比较相似。只不过VF-900是双热管全铜的,而酷冷只用了一条很粗壮的热管,散热片虽然不是全铜,但分为上下两层。
散热器底座直接与GPU接触相当于一个小散热片,风扇直吹放射状散热片进行散热。除此之外还通过一根粗壮的环形热管将热量导出至风扇边缘的散热片,从而达到更大的有效散热面积,这样只需很低的转速就能达到不错的散热效果,将噪音控制在很低的水准。
这个小透明风扇使用了3Pin供电接头,可以在系统内手动调节/监控风扇转速,在噪音和效能之间做出平衡的选择。值得一提的是,影驰用的3pin风扇不仅可以温控风扇转速,而且通过影驰附送的专用控制软件可以直接设定转速,还能实时察看运转速度,大概在1000-3000转之间,要低温度还是低噪音都在自己掌握中。
● 接口部分特写,独家镀镍带屏蔽罩
DVI数字显示输出并不需要低通滤波,但在高分辨率下容易受到高频电磁干扰影响画质,因此大家可以发现高端显卡和专业显卡都带有DVI屏蔽罩,而且NVIDIA/ATI原厂8600/2600显卡也带有DVI屏蔽罩,但市售显卡全都被省掉了。
我们非常欣喜地看到,影驰在8600系列显卡上保留了这种设计,最低端的8600GT魔灵只有一个DVI,但也安装了屏蔽罩,给用户提供非常好的输出画质。今天的这款8600GTS骨灰魔魂的两个DVI都安装了屏蔽罩,而且接口经过镀镍处理,耐插拔防锈而且显示出了高档身份!
无论是经典理论性能测试还是实际游戏测试,从测试中都可以见到实际上Shader频率的提升对效能影响是比较明显的,尤其当Shader频率到了2200的时候,这张超高频率的8600GTS效能已经逼近高端的8800GTS了,从这样的频率中我们甚至可以窥视到即将在11月发布的采用256bit带宽的G92的性能——因为据猜测,G92的标量化流处理器应该是64个,刚好是G84也就是8600系列的一倍,而确定了的显存带宽则刚刚好也是G84的一倍,也就是说运行在1000//2400MHz的G84效能应该近乎运行在500/1200MHz的G92效能。当然G92频率上应该更高,同时NV方面应该会再对Shader作出优化,但从中我们也可以推测出G92的大致性能。
对于统一着色器架构来说,Shader频率的引入令显卡无论是厂商差异化还是玩家超频都有了多种玩法,绝对频率、整体频率以及Shader频率和核心频率的比值都有着直接影响效能的作用,从测试上可以看到Shader频率对效能的影响要比核心频率以及显存频率大,但是核心频率和显存频率的作用实际上并不能被淡化,毕竟dispatch、textuneunit和ROP unit的效能直接和核心频率挂钩,一旦Shader处理能力到了一定高度的时候,ROP等等的效能就必须要有相应的提高,避免瓶颈出现,这样核心频率的提高就很有必要了;而对于高清视频玩家来说,高核心频率也能够带来更加流畅的高清视频体验。<