功耗大革命 GF7900/7600全球同步测试
2005年6月,NVIDIA发布了代号为G70的GeForce 7800GTX,首次将渲染管线的数目提高到了24条之多,强大的性能以及全新优秀的架构让7800系列备受青睐,SLI的双倍火力也让NV抵达巅峰性能!2005年11月,NV重新设计PCB推出了高频版的7800GTX 512MB,将110nm G70的性能发挥到了极限!如今NV再次沿用了G70优良的架构,凭借90nm先进工艺推出了更高频率、经过优化设计的G71核心。那么究竟是何原因让NV如此青睐24管线的G70架构呢?
- 24条像素渲染管线的威力!
回顾近年来显示芯片的发展就可以发现,6800/X800时代是ATI和NVIDIA两大巨头竞争最激烈的时期,可以说谁都没有明显的优势。主要原因就在于两款产品规格上比较相似,均为16条像素渲染管线和6个顶点着色单元设计,因此性能差距并不大。虽然6800能够支持先进的SM3.0技术,但在当时没能得到充分利用,不过NV超前的设计让GeForce 6系列的生命周期非常长,这是后话。
而7800GTX一举将像素渲染管线的数目提高到了24条之多,性能提升非常显著!作为G70的直接竞争对手,ATI的X1800XT虽然采用了全新的架构,但依然只有16条管线,于是不得不依靠高频率弥补性能上的差距,R520比G70整整晚了4个月性能上却没能拉开差距,因此高频版的7800GTX 512MB轻松击败X1800XT并不意外。
- 像素渲染单元(Shader Unit)像素渲染管线(PipeLine)的区别:
- 顶点着色单元(Vertex Shader)设计:
无论G70/G71还是R520/R580都拥有8个顶点着色单元,在像素渲染单元飞速增长的今天,为何顶点着色单元的进步如此缓慢?
不管使用什么图形芯片,3D图形的处理顺序都是最先从顶点部分开始,因为顶点是用来构造几何物体的,进行3D运算建模顶点是最基本最核心的内容。而像素对应工作就是将显卡合成的三维图形以二维的方式输出,简单说像素是二维而顶点则是三维的。然而与3D息息相关的顶点运算的需求是取决于游戏本身,每一个游戏的3D模型一旦确定,在一个静态的3D场景中,顶点数目也就固定下来了,这并不会因为游戏的细节程度、特效和分辨率而发生改变。所以顶点引擎往往没有像素引擎那么繁忙,游戏开发者通常会利用贴图等手段控制模型的3D顶点数目。
不过在最新的G71核心当中,虽然沿用了G70的架构没有增加顶点单元的数目,但NV为了加强顶点着色单元的处理能力,特别提高了频率与其他模块分开设定。比如7900GTX的核心频率为650MHz,而顶点着色单元的频率高达700MHz!
与NV40相比,G70/G71顶点纹理拾取(VTF:Vertex Texture Fetch)性能有一定的提升,在纹理缓存的吞吐能力方面有所改进。顶点纹理拾取的性能对于硬件加速位移映射来说非常重要。而R520/R580在顶点着色单元的设计上与NV不同,ATI放弃了VTF这个SM3.0规定必须实现的功能,而是采用了渲染至顶点缓存的方式,因此适用范围不够广,在部分游戏当中效能可能会受影响。
- 小结:
G71并非之前传闻中所说的拥有32条像素渲染管线,在架构上依然沿用了G70 24条管线的设计,很多人可能对此比较失望。而实际上无论从今后的发展趋势上来看,还是对比竟争对手ATI的产品,都没有必要继续增多管线。
当然,如果不考虑晶体管数、成本、发热与功耗等因素,片面将像素管线提高到32条是极不明智的做法,如今的GPU发展速度太快,功耗成倍增长如果说还能勉强解决的话,那么当恐怖的发热风冷无能为力之时,GPU发展的脚步也应该放缓了,就如同Intel Pentium 4止步于4GHz一样,GPU也应该好好考虑考虑未来的路怎么走了!