泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

功耗大革命 GF7900/7600全球同步测试

    2005年6月,NVIDIA发布了代号为G70的GeForce 7800GTX,首次将渲染管线的数目提高到了24条之多,强大的性能以及全新优秀的架构让7800系列备受青睐,SLI的双倍火力也让NV抵达巅峰性能!2005年11月,NV重新设计PCB推出了高频版的7800GTX 512MB,将110nm G70的性能发挥到了极限!如今NV再次沿用了G70优良的架构,凭借90nm先进工艺推出了更高频率、经过优化设计的G71核心。那么究竟是何原因让NV如此青睐24管线的G70架构呢?

NV再掀GS风暴

  • 24条像素渲染管线的威力!

    回顾近年来显示芯片的发展就可以发现,6800/X800时代是ATI和NVIDIA两大巨头竞争最激烈的时期,可以说谁都没有明显的优势。主要原因就在于两款产品规格上比较相似,均为16条像素渲染管线和6个顶点着色单元设计,因此性能差距并不大。虽然6800能够支持先进的SM3.0技术,但在当时没能得到充分利用,不过NV超前的设计让GeForce 6系列的生命周期非常长,这是后话。

    而7800GTX一举将像素渲染管线的数目提高到了24条之多,性能提升非常显著!作为G70的直接竞争对手,ATI的X1800XT虽然采用了全新的架构,但依然只有16条管线,于是不得不依靠高频率弥补性能上的差距,R520比G70整整晚了4个月性能上却没能拉开差距,因此高频版的7800GTX 512MB轻松击败X1800XT并不意外。

{imageTitle}
G71的核心架构图,与G70完全相同
 
    G71的核心架构与G70是完全相同的,但是并不能简单的认为G71就是90nm工艺的G70,至于原因为何后面将会提到。G71依然拥有8个顶点着色单元,像素渲染引擎部分为四个一阵列总共六组,构成了庞大规模的24条像素渲染管线架构!
 
    然而ATI最新的R580核心,并没有单纯增加像素渲染管线,而是将像素渲染单元的数目翻了三倍,达到了前所未有的48个之多!那么沿用G70架构的G71面对R580有什么优势呢?
  • 像素渲染单元(Shader Unit)像素渲染管线(PipeLine)的区别:
    实际上像素渲染管线并非一个正式名词,只是一个笼统的称谓,以大家默认的传统说法来讲,一条渲染管线是由Pixel Shader Unit(像素渲染单元)和TMU(纹理单元)两部分组成的。从功能上看,PSU完成像素处理,TMU负责纹理渲染,而ROP(光栅操作处理器)负责像素的最终输出。因此,一条完整的像素管线意味着在一个时钟周期完成至少进行一次像素运算,并输出一次纹理。
 
{imageTitle}
G70/G71像素渲染架构
 
    现在就来看看G70/G71的像素渲染架构,每条流水线中都包含了两个完全相同的32位浮点Shader Unit,不过只有Shader Unit 1共享TMU处理纹理指令,而Shader Unit 2只处理算术指令进行像素着色运算,另外每个Shader Unit旁边的Mini-ALU主要进行乘法补充计算。因此G70/G71虽然拥有24×2=48个Shader Unit,但NV依然称之为24管线,也没有特别强调48个像素渲染单元,这主要是因为Shader Unit 1和Shader Unit 2虽然结构完全相同,但运算能力和负载量是不同的。
 
{imageTitle}
R580像素渲染引擎
 
    再来看看ATI RD580的架构设计,R580拥有独立的48个像素单元,但是这些像素单元并没有直接关联相应的纹理单元,而是通过Ultra-Threaded Dispatch Processor单元统一调度。实际上R580总共拥有与R520相同的16个纹理单元。ATI认为像素的作用要大于纹理,未来游戏的发展趋势就是需要更多的像素处理而非纹理,因此像素与纹理的比例达到了3:1,ATI中端的X1600也采用了这种架构!
 
    而NV则认为纹理单元的作用依然非常重要,不同的游戏所需的像素处理难以统计,并且这一比列并不是固定的,随着场景设计的差异动态变化。何况3D物体的表面材质、纹理贴图等都随着分辨率的提高层数不断增多,实际游戏对纹理操作的需求并没有下降的趋势。因此PSU和TMU一直是1:1的比例。
 
    抛开像素与纹理的比例不谈,无论是24×2还是16×3,都需要最大限度的将Shader Unit的性能发挥出来,这方面除了对GPU核心架构进行优化设计之外,很大程度上还要取决于游戏引擎的设计。那么究竟谁的优势更加明显呢?游戏当中见分晓!
  • 顶点着色单元(Vertex Shader)设计:

    无论G70/G71还是R520/R580都拥有8个顶点着色单元,在像素渲染单元飞速增长的今天,为何顶点着色单元的进步如此缓慢?

    不管使用什么图形芯片,3D图形的处理顺序都是最先从顶点部分开始,因为顶点是用来构造几何物体的,进行3D运算建模顶点是最基本最核心的内容。而像素对应工作就是将显卡合成的三维图形以二维的方式输出,简单说像素是二维而顶点则是三维的。然而与3D息息相关的顶点运算的需求是取决于游戏本身,每一个游戏的3D模型一旦确定,在一个静态的3D场景中,顶点数目也就固定下来了,这并不会因为游戏的细节程度、特效和分辨率而发生改变。所以顶点引擎往往没有像素引擎那么繁忙,游戏开发者通常会利用贴图等手段控制模型的3D顶点数目。

    不过在最新的G71核心当中,虽然沿用了G70的架构没有增加顶点单元的数目,但NV为了加强顶点着色单元的处理能力,特别提高了频率与其他模块分开设定。比如7900GTX的核心频率为650MHz,而顶点着色单元的频率高达700MHz!

    与NV40相比,G70/G71顶点纹理拾取(VTF:Vertex Texture Fetch)性能有一定的提升,在纹理缓存的吞吐能力方面有所改进。顶点纹理拾取的性能对于硬件加速位移映射来说非常重要。而R520/R580在顶点着色单元的设计上与NV不同,ATI放弃了VTF这个SM3.0规定必须实现的功能,而是采用了渲染至顶点缓存的方式,因此适用范围不够广,在部分游戏当中效能可能会受影响。

  • 小结:

    G71并非之前传闻中所说的拥有32条像素渲染管线,在架构上依然沿用了G70 24条管线的设计,很多人可能对此比较失望。而实际上无论从今后的发展趋势上来看,还是对比竟争对手ATI的产品,都没有必要继续增多管线。

    当然,如果不考虑晶体管数、成本、发热与功耗等因素,片面将像素管线提高到32条是极不明智的做法,如今的GPU发展速度太快,功耗成倍增长如果说还能勉强解决的话,那么当恐怖的发热风冷无能为力之时,GPU发展的脚步也应该放缓了,就如同Intel Pentium 4止步于4GHz一样,GPU也应该好好考虑考虑未来的路怎么走了!

0人已赞

关注我们

泡泡网

手机扫码关注