专访NVIDIA黄仁勋,将GeForce 6推广
GeForce 6800 Ultra发布了。伴随详细深入的性能测试的陆续公布,有关它性能的种种争论也终于尘埃落定。在见识了这款有史以来最为强劲的3D图形核心的真正实力之后,人们的好奇心自然就会转移到另一个层面:我们什么时候能够在市场上看到基于GeForce 6图形核心的显卡产品?
2004年4月22日,在GeForce 6800 Ultra中国发布会第二天的媒体专访中,NVIDIA公司创始人、CEO黄仁勋先生告诉我们:今年之内,基于GeForce 6系列图形核心的全系列显卡产品将横扫中国市场!
此外,在此次媒体专访中,黄仁勋先生还就NVIDIA的市场策略、PCI-E规格、芯片组以及竞争对手的最新动向等问题发表了自己的看法。
专访一开始,黄仁勋先生首先向我们再次强调了GeForce 6系列所拥有的3大重大技术突破,其中的一些甚至在整个图形加速技术的发展史上也将具有“里程碑”式的意义。
● Shader Model 3.0
对应微软DirectX 9.0c的规格,GeForce 6系列的Shader Model全面升级到3.0(Pixel Shader 3.0和Vertex Shader 3.0)。关于Shader Model 3.0的深入技术分析请看【这里】。
黄仁勋先生以Pixel Shader 3.0为例进行了分析,并着重强调了其中两点技术改进。
Pixel Shader 3.0首次取消了对程序长度的限制。
这不仅意味着程序员可以根据需要,编写任意长度的像素着色程序以实现任何复杂的光影效果,同时更意味着对像素渲染程序处理效率的大幅度提升——在上一个版本,也就是2.0版的Pixel Shader中,每个程序的代码长度最多只能有96条。
黄仁勋先生说,假如Piexl Shader存在每周期处理64条指令的限制,而应用程序包含256条像素着色程序代码,图形核心就只能将这些代码以64条为单位拆分成4组,用4个周期来进行处理——这种处理过程也就是平时测试软件中常见的“Multi Pass”。
处理周期的增加,无疑会延长指令处理的时间,由此导致效率降低。而对于能够处理无限条像素着色指令的GeForce 6系列图形核心来说,256条指令完全能够用单一周期(也就是“Single Pass”)完成。周期一旦缩短,效率自然大为提高。
CineFX 3.0引擎将像素着色精度提高到了32位。
GeForce 6800 Ultra具备32bit浮点像素处理能力,这是NVIDIA此次发布新品的又一个重要技术亮点。这里黄仁勋先生以发布会上《虚幻III》的演示为例进行了说明。他指出,《虚幻III》的画面之所以看起来格外真实,其中很重要的一点是对灰阶的处理较以前有了很大的进步。
更宽泛的灰阶范围能够使亮的地方更亮、暗的地方更暗,并且可以表现出更为丰富的亮与暗的层次。在此之前,3D世界中物体的阴影就是一团漆黑。而现在,有了更多的灰阶,暗处的细节也会变得清晰,这意味着我们将能够看到阴影中的物体,甚至“阴影中物体的阴影”——就像现实世界里的情况一样。
至于32位的浮点精度到底能够实现多少灰阶,黄仁勋先生指出,目前广泛采用的R/G/B显示方式,每种颜色也只不过支持到8位精度,每种颜色有256级灰阶。因此32位浮点精度理论上可以表现无限多的灰阶——此时显卡输出的画面精度已经不是问题,反倒是显示器对灰阶的表现能力会成为人们享受新视觉体验的瓶颈。
● 超标量架构与更多流水线
与以往的图形核心相比,GeForce 6最具有革命性的改进在于引入了超标量(SuperScalar)流水线的结构——从Pentium开始,这项技术被广泛应用于微处理器,并且成为CPU发展史上的里程碑式的技术革新之一。
和处理器所采用的超标量技术一样,GeForce 6系列的超标量流水线可以并行处理两组指令操作。和传统的图形核心相比,基于超标量架构的GeForce 6 GPU拥有至少两倍于过去的处理能力,处理指令操作的效率得到大幅度提高。
此外,目前最高端的GeForce 6800 Ultra GPU拥有多达16条像素渲染管线,高端的GeForce 6800标准版GPU也拥有12条像素渲染管线。这和之前高端GPU普遍采用的8流水线设计相比,GeForce 6系列图形核心无疑拥有更加强大的处理能力和数据吞吐量,这也是推动GeForce 6800性能飙升的重要因素。<