泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

中端新王者!NV 7600GT全方位对比测试

    自从去年中期NVIDIA发布7800之后,绝大多数用户都在期盼GeForce 7系列的中端产品出现。时隔半年之久NV最先发布的却是定位低端的G72核心,虽然7300GS的性价比也很出色,不过中端市场才是用户关注程度最高的领域,既要性能好还要价格低,这就是千元级显卡备受青睐的原因。

    随着90nm工艺的成熟和良品率的提高,NV终于将新工艺引入了中高端显示芯片,90nm先进工艺能够在相同大小的芯片中集成更多的晶体管,在GPU核心频率提高的同时发热与功耗也能得到很好的控制。所以NV新款G73核心的表现如何令人非常期待!

● 管线升级到12条!G73核心架构解析:

{imageTitle}
 
    G73是NV 2006年的主流中端产品,沿袭了高端G71的架构,差别就在于渲染管线和显存位宽上面。与上一代中端NV43相比,顶点着色单元由3个提升至5个,像素渲染管线从8条提高至12条。G73总共3组Quad阵列,每组拥有4条完整的像素渲染管线,这部分的结构与G71是完全相同的(G71拥有6组Quad阵列共24条管线)。
 
    GeForce 6/7系列都采用的是一条像素渲染管线绑定一个纹理单元的架构,因此,G73与NV43相比像素渲染管线提高到12条,自然纹理单元也拥有12个。
 
    ROP(光栅处理器、也称为像素输出管线)部分,高端的NV40和G71都拥有16个ROP,NV43只有4个,而在G73上面NV将ROP数目提高至8个。ROP负责的是像素的最终输出处理,翻倍的ROP能够大幅提高G73的像素填充率,这对提升AA性能非常有利!
 
    G73的显存控制器依然是128Bit,同NV43一样采用了两个64Bit通道设计。128Bit设计的好处就是只需要搭载4颗8M×32Bit显存,能够很好的控制显存成本以及简化PCB设计。
 
    由于硬件规格上大幅提高,因此G73的晶体管数由NV43的1.46亿增加到了1.77亿,不过得益于90nm工艺的采用,虽然晶体管数增加不少,但核心面积反而比NV43更小;在提高主频率的同时,GPU的功耗与发热反而有所下降。
 

 

6600GT

6800GS

7600GT

X1600XT

核心代号

NV43

NV42

G73

RV530

工艺制程

110nm

110nm

90nm

90nm

晶体管数

1.44亿

2.02亿

1.77亿

1.57亿

核心面积

 155

 222

125

149

显存容量

128MB

256MB

256MB

256MB

显存位宽

128Bit

256Bit

128Bit

128Bit

显存类型

GDDR3

GDDR3

GDDR3

GDDR3

显存规格

8M×32Bit×4

2.0ns

8M×32Bit×8

2.0ns

16M×32Bit×4

1.4ns

16M×32Bit×4

1.4ns

显存封装

144Ball

144Ball

136Ball

136Ball

核心频率

500MHz

425MHz

560MHz

590MHz

显存频率

1000MHz

1000MHz

1400MHz

1380MHz

像素单元

8

12

12

12

顶点单元

3

4

5

5

纹理单元

8

12

12

4

光栅单元

4

8

8

4

上市价格

199

249

199

249

    从硬件规格上来说,7600GT已经完全凌驾于中端同类产品之上,仅仅在显存位宽和光栅处理器上逊于256Bit的6800GS。

● 延续经典管线论,Pipe Line与Shader Unit的区别:

    实际上像素渲染管线并非一个正式名词,只是一个笼统的称谓,以大家默认的传统说法来讲,一条渲染管线是由PSU(Pixel Shader Unit、像素渲染单元)和TMU(Texture Memory Unit、纹理单元)两部分组成的。从功能上看,PSU完成像素处理,TMU负责纹理渲染,而ROP(Raster Operation、光栅操作处理器)负责像素的最终输出。因此,一条完整的像素管线意味着在一个时钟周期完成至少进行一次像素运算,并输出一次纹理。
 
功耗大革命
GeForce 7系列像素渲染架构
 
    GeForce 7系列的每条像素渲染管线中都包含了两个完全相同的32位浮点Shader Unit,不过只有Shader Unit 1共享TMU处理纹理指令,而Shader Unit 2只处理算术指令进行像素着色运算,另外每个Shader Unit旁边的Mini-ALU主要进行乘法补充计算。因此G73实际上拥有12×2=24个Pixel Shader Unit和24个Shader ALU,但我们依然称之为12管线,这是因为只有包含了TMU才能称为一条完整的Pipe Line。
 
{imageTitle}
RV530核心架构图

    RV530确确实实拥有12个像素渲染单元和5个顶点着色单元,规格上远高于8管线的NV43,看起来似乎和G73差不多,很多人也喜欢将它称之为12管线的产品。实际上ATI与NV的GPU架构完全不同,ATI在像素渲染单元的设计上完全将像素和纹理剥离,两者通过超线程分配单元统一调度。

    ATI认为将来的游戏对像素的需求远大于纹理,因此为12个像素单元的RV530仅仅分配了4个纹理单元,构成了和高端R580相同的“像素:纹理=3:1”架构。

    NV则认为纹理单元的作用依然非常重要,不同的游戏所需的像素处理难以统计,并且这一比列并不是固定的,随着场景设计的差异动态变化。何况3D物体的表面材质、纹理贴图等都随着分辨率的提高层数不断增多,实际游戏对纹理操作的需求并没有下降的趋势。因此PSU和TMU一直是1:1的比例。

    实际上无论是1:1还是3:1的架构,都需要最大限度的将Shader Unit的性能发挥出来,这方面除了对GPU核心架构进行优化设计之外,很大程度上还要取决于游戏引擎的设计。RV530本来在纹理单元数量上就没有优势,而在效能上很难达到像素与纹理绑定设计的水平。因此RV530与G73虽然同为12PS/5VS的结构,然而实际性能确却有一定的差距。

● 顶点着色单元(Vertex Shader)设计:

    不管使用什么图形芯片,3D图形的处理顺序都是最先从顶点部分开始,因为顶点是用来构造几何物体的,进行3D运算建模顶点是最基本最核心的内容。而像素对应工作就是将显卡合成的三维图形以二维的方式输出,简单说像素是二维而顶点则是三维的。然而与3D息息相关的顶点运算的需求是取决于游戏本身,每一个游戏的3D模型一旦确定,在一个静态的3D场景中,顶点数目也就固定下来了,这并不会因为游戏的细节程度、特效和分辨率而发生改变。所以顶点引擎往往没有像素引擎那么繁忙,游戏开发者通常会利用贴图等手段控制模型的3D顶点数目。

    高端显卡无论G70/G71还是R520/R580都拥有8个顶点着色单元,应付所有游戏都不成问题,而中低端显卡则会适当减少顶点单元的数目,因此顶点单元的数目对中端显卡性能的影响比较大,需要特别关注。

    G73的顶点着色单元架构基本与NV43是相同的,最直观的是数量上增加了2个,不过由于实现了单周期FMADD指令运算能力和强化了特殊功能单元(SFU)的性能,因此整个顶点单元算术性能相对NV43来说性能提高了一倍以上!

    另外G73的顶点纹理拾取(VTF:Vertex Texture Fetch)性能有一定的提升,这主要是得益于纹理缓存吞吐量的提高。VTF的性能对于硬件加速位移映射来说非常重要。而ATI X1000系列在顶点着色单元的设计上与NV不同,ATI放弃了VTF这个SM3.0规定必须实现的功能,而是采用了渲染至顶点缓存的方式,因此适用范围不够广,在部分游戏当中效能可能会受影响。

● 除了PS/VS/TMU/ROP数量上的差异,G73架构比NV43更加优秀!

    通过前面的规格表可以看出,G73相比NV43在硬件规格和制造工艺上有了很大的提升,这是最直观也最容易理解的。不过千万不要忽视了架构上进化,G73与NV43之间的差别就好比G70相对于NV40所做出的改进。虽然G70已经发布半年有余,不过G73的出现毕竟是GeForce 7系列首次进入中端市场,因此这里还是有必要作一简单介绍:

    像素渲染单元部分,G73能够单周期完成FMADD(Floating-point Multiply and Add、浮点乘加运算,即运行一次乘法和加法运算),而NV43虽然也具备两个ALU,不过只能分别运行一个FMUL(浮点乘法)和一个FMAD(浮点加法)。在遇到需要两个FADD或者两个FMADD操作的时候,NV43需要两个周期才能完成而G73只需要一个周期。这就是G73真正拥有12×2=24个ALU的原理!

    除了FMADD指令之外,G73在某些像素指令方面也有提升,例如RSQ(平方根)的指令吞吐能力就比NV43高一倍。

    顶点着色单元部分,G73同样能够单周期完成FMADD计算,效能比NV43提高20%以上,Setup引擎在处理固定功能操作的时候效能比NV43提高30%以上。顶点纹理拾取性能也有了一定程度的提高。

● 小结:

    可以这么说,RV530基本相当于三分之一个R580,NV43相当于半个NV40或者说三分之一个G70,而G73相当于半个G71,虽然这种说法非常不严谨(GPU架构所涉及重要参数诸如PS、VS、TMU、ROP、显存和频率等等都不尽相同),但却是很容易理解的。

    因此在R580和G71性能不相上下的情况下,虽然RV530的规格看似高于NV43,其实两者处于同一性能水平,而G73从各个方面来说都应该是完胜NV43/RV530的,到底能否如同理论分析,在后面的性能测试中见分晓!

0人已赞

关注我们

泡泡网

手机扫码关注