中端新王者!NV 7600GT全方位对比测试
自从去年中期NVIDIA发布7800之后,绝大多数用户都在期盼GeForce 7系列的中端产品出现。时隔半年之久NV最先发布的却是定位低端的G72核心,虽然7300GS的性价比也很出色,不过中端市场才是用户关注程度最高的领域,既要性能好还要价格低,这就是千元级显卡备受青睐的原因。
随着90nm工艺的成熟和良品率的提高,NV终于将新工艺引入了中高端显示芯片,90nm先进工艺能够在相同大小的芯片中集成更多的晶体管,在GPU核心频率提高的同时发热与功耗也能得到很好的控制。所以NV新款G73核心的表现如何令人非常期待!
● 管线升级到12条!G73核心架构解析:
6600GT | 6800GS | 7600GT | X1600XT | |
核心代号 | NV43 | NV42 | G73 | RV530 |
工艺制程 | 110nm | 110nm | 90nm | 90nm |
晶体管数 | 1.44亿 | 2.02亿 | 1.77亿 | 1.57亿 |
核心面积 | 125 | 149 | ||
显存容量 | 128MB | 256MB | 256MB | 256MB |
显存位宽 | 128Bit | 256Bit | 128Bit | 128Bit |
显存类型 | GDDR3 | GDDR3 | GDDR3 | GDDR3 |
显存规格 | 2.0ns | 2.0ns | 1.4ns | 1.4ns |
显存封装 | 144Ball | 144Ball | 136Ball | 136Ball |
核心频率 | 500MHz | 425MHz | 560MHz | 590MHz |
显存频率 | 1000MHz | 1000MHz | 1400MHz | 1380MHz |
像素单元 | 8 | 12 | 12 | 12 |
顶点单元 | 3 | 4 | 5 | 5 |
纹理单元 | 8 | 12 | 12 | 4 |
光栅单元 | 4 | 8 | 8 | 4 |
上市价格 | $199 | $249 | $199 | $249 |
从硬件规格上来说,7600GT已经完全凌驾于中端同类产品之上,仅仅在显存位宽和光栅处理器上逊于256Bit的6800GS。
● 延续经典管线论,Pipe Line与Shader Unit的区别:
RV530确确实实拥有12个像素渲染单元和5个顶点着色单元,规格上远高于8管线的NV43,看起来似乎和G73差不多,很多人也喜欢将它称之为12管线的产品。实际上ATI与NV的GPU架构完全不同,ATI在像素渲染单元的设计上完全将像素和纹理剥离,两者通过超线程分配单元统一调度。
ATI认为将来的游戏对像素的需求远大于纹理,因此为12个像素单元的RV530仅仅分配了4个纹理单元,构成了和高端R580相同的“像素:纹理=3:1”架构。
NV则认为纹理单元的作用依然非常重要,不同的游戏所需的像素处理难以统计,并且这一比列并不是固定的,随着场景设计的差异动态变化。何况3D物体的表面材质、纹理贴图等都随着分辨率的提高层数不断增多,实际游戏对纹理操作的需求并没有下降的趋势。因此PSU和TMU一直是1:1的比例。
实际上无论是1:1还是3:1的架构,都需要最大限度的将Shader Unit的性能发挥出来,这方面除了对GPU核心架构进行优化设计之外,很大程度上还要取决于游戏引擎的设计。RV530本来在纹理单元数量上就没有优势,而在效能上很难达到像素与纹理绑定设计的水平。因此RV530与G73虽然同为12PS/5VS的结构,然而实际性能确却有一定的差距。
● 顶点着色单元(Vertex Shader)设计:
不管使用什么图形芯片,3D图形的处理顺序都是最先从顶点部分开始,因为顶点是用来构造几何物体的,进行3D运算建模顶点是最基本最核心的内容。而像素对应工作就是将显卡合成的三维图形以二维的方式输出,简单说像素是二维而顶点则是三维的。然而与3D息息相关的顶点运算的需求是取决于游戏本身,每一个游戏的3D模型一旦确定,在一个静态的3D场景中,顶点数目也就固定下来了,这并不会因为游戏的细节程度、特效和分辨率而发生改变。所以顶点引擎往往没有像素引擎那么繁忙,游戏开发者通常会利用贴图等手段控制模型的3D顶点数目。
高端显卡无论G70/G71还是R520/R580都拥有8个顶点着色单元,应付所有游戏都不成问题,而中低端显卡则会适当减少顶点单元的数目,因此顶点单元的数目对中端显卡性能的影响比较大,需要特别关注。
G73的顶点着色单元架构基本与NV43是相同的,最直观的是数量上增加了2个,不过由于实现了单周期FMADD指令运算能力和强化了特殊功能单元(SFU)的性能,因此整个顶点单元算术性能相对NV43来说性能提高了一倍以上!
另外G73的顶点纹理拾取(VTF:Vertex Texture Fetch)性能有一定的提升,这主要是得益于纹理缓存吞吐量的提高。VTF的性能对于硬件加速位移映射来说非常重要。而ATI X1000系列在顶点着色单元的设计上与NV不同,ATI放弃了VTF这个SM3.0规定必须实现的功能,而是采用了渲染至顶点缓存的方式,因此适用范围不够广,在部分游戏当中效能可能会受影响。
● 除了PS/VS/TMU/ROP数量上的差异,G73架构比NV43更加优秀!
通过前面的规格表可以看出,G73相比NV43在硬件规格和制造工艺上有了很大的提升,这是最直观也最容易理解的。不过千万不要忽视了架构上进化,G73与NV43之间的差别就好比G70相对于NV40所做出的改进。虽然G70已经发布半年有余,不过G73的出现毕竟是GeForce 7系列首次进入中端市场,因此这里还是有必要作一简单介绍:
像素渲染单元部分,G73能够单周期完成FMADD(Floating-point Multiply and Add、浮点乘加运算,即运行一次乘法和加法运算),而NV43虽然也具备两个ALU,不过只能分别运行一个FMUL(浮点乘法)和一个FMAD(浮点加法)。在遇到需要两个FADD或者两个FMADD操作的时候,NV43需要两个周期才能完成而G73只需要一个周期。这就是G73真正拥有12×2=24个ALU的原理!
除了FMADD指令之外,G73在某些像素指令方面也有提升,例如RSQ(平方根)的指令吞吐能力就比NV43高一倍。
顶点着色单元部分,G73同样能够单周期完成FMADD计算,效能比NV43提高20%以上,Setup引擎在处理固定功能操作的时候效能比NV43提高30%以上。顶点纹理拾取性能也有了一定程度的提高。
● 小结:
可以这么说,RV530基本相当于三分之一个R580,NV43相当于半个NV40或者说三分之一个G70,而G73相当于半个G71,虽然这种说法非常不严谨(GPU架构所涉及重要参数诸如PS、VS、TMU、ROP、显存和频率等等都不尽相同),但却是很容易理解的。
因此在R580和G71性能不相上下的情况下,虽然RV530的规格看似高于NV43,其实两者处于同一性能水平,而G73从各个方面来说都应该是完胜NV43/RV530的,到底能否如同理论分析,在后面的性能测试中见分晓!