王者归来性能翻番 GeForce6技术解析
● 超标量设计
超标量设计,这个技术名词我们其实早就听说过,不过都是在一些关于处理器的信息中看到的,而对于显示芯片,采用超标量设计才是比较新的一种方式。
作为超标量设计,其实就是在一个时钟周期内完成多个操作,从而实现性能的翻倍。为了更好的解释问题,我们先来看看传统的着色器。
没有采用超标量设计
我们看到,在这样的情况下,整个着色单元拥有一个像素着色单元,由于每个单元的处理能力是4个操作,所以每一个时钟周期能够完成4个操作。
采用超标量设计
我们再来看看采用了超标量设计的GeForce 6系列图形芯片的着色器。它拥有了第2组着色器单元,每个周期能完成两倍的像素操作,也就是8个操作。
凭借两组着色器单元,GeForce 6系列图形芯片的体系架构可以支持真正的并行双路处理,也就是在不同的着色器单元上同时执行两条指令。
有些体系架构也会尝试采用非超标量的单着色器架构来实现单周期双指令执行。然而这种体系架构和我们今天介绍的GeForce 6系列图形芯片拥有的架构却完全不同,因为它们在完成着色的方式上的区别是非常大的。
传统的架构(左)对NVIDIA超标量架构(右)
对于单着色器架构,只有两条指令在同一个着色器单元上执行,并且两条指令必须作用于同一像素或者全部字段的分量上。
而在GeForce 6系列图形芯片的体系架构上,我们能在像素分量上实现更多的总算术计算的吞吐量。在每个周期里,双着色器单元能在每个周期执行4条指令,相当于每个像素能进行了8个操作。
● 全32位浮点处理
GeForce架构始终允许游戏开发人员可以为每个画面或者场景选择所需的精度级别。随着GeForce 6系列图形芯片正式支持32位精度,现在开发者的选择更简单了,因为使用全32位浮点精度的时候会造成性能降低的问题已经消除了。
开发人员依然能在优先考虑内存空间利用率的时候使用16位模式,但是他们能够在需要更加精细的画质以及效果的时候采用32位精度。那样就能够做出效果更为出众的图像,而用户也将体验到更丰富、更绚丽的画面,游戏开发人员也能够以此让自己的作品获得更好的评价。<