榨干所有潜能!8800GTS 320M超频秘籍
在GPU内部分为很多模块,这些模块各司其职,分别处理不同的任务,比如像素单元、顶点单元、纹理单元、光栅单元等等,而且在有些GPU中不同的模块工作频率并不相同,通常所说的GPU核心频率其实是一个非常模糊的概念,在超频之前我们首先需要了解一下这方面的内容:
● 传统GPU架构:核心各部分模块以相同频率运行
在G80之前,所有GPU都是采用了传统Pixel Shader(像素渲染)和Vertex Shader(顶点渲染)分离式的架构,绝大多数GPU内部的所有运算模块都是以相同的工作频率运行。比如ATI X1950XTX的核心频率为650MHz,实际上就是说R580核心内部48个像素单元和8个顶点单元的工作频率是650MHz,其它模块比如纹理单元和光栅单元也是650MHz。
而对于NVIDIA的GPU来说,情况稍微有些不同,在G70/G71之前所有GPU的各部分模块工作频率也是一致的。而G71的情况比较特殊,7900GTX显卡的像素单元、纹理单元和光栅单元的频率为650MHz,唯独顶点单元工作在700MHz下,比通常所说的“核心频率”高50MHz,7900GT的顶点单元频率也要比核心高20MHz:
NVIDIA之所以这么做就是想要提高有限的8个顶点单元的性能,但这对超频玩家造成了一定的困难——当79GTX核心频率超到700MHz时,顶点已经达到了750MHz,本来核心还有一定的潜力,但受限于顶点单元无法继续提升频率。因此后期很多厂商的79GT/79GS在出厂时就将核心和顶点的频率调为一致,GPU各部分依然保持相同的频率运行!
● G80采用统一渲染架构,流处理器频率达到核心频率的两倍以上:
G80的发布宣告了DX10时代的来临,所有GPU改用了更灵活的统一渲染架构,这种架构将Pixel Shader(像素渲染)和Vertex Shader(顶点渲染)交给了相同的Shader阵列来统一处理,通过Thread Processor(线程分配器)来动态分配像素和顶点的负载。除了像素和顶点之外,以往交由CPU处理的Geometry(几何)和Physical(物理)运算都改用效能更强的GPU Shader处理,从而消除了3D绘图的瓶颈:
G80采用了统一渲染架构,核心集成多达128个浮点运算处理器,NVIDIA将其称之为Streaming Processor(流处理器),如果用传统的观念来看,可以把流处理器当作是像素管线和顶点管线的合体:
NVIDIA在G80架构的设计方面着眼点更远,为了实现更强的通用计算能力(GPGPU),G80的流处理器部分采用了超标量运算架构,因此可以轻松达到很高的频率。8800GTS的流处理器工作频率高达1200MHz,而纹理、光栅以及其它分配单元(Dispatch Units)的频率只有500MHz。
由此可见通常我们所说的核心频率,对于G80来说并不是“像素管线”和“顶点管线”的频率,而仅代表纹理、光栅及分配单元的频率。影响G80性能最重要的频率应该是流处理器,而并非通常所说的“核心”频率,所以超频时流处理器的频率也非常关键!
另一方面,由于流处理器的工作频率非常高,因此也很容易出现流处理器频率已经达到上限、但核心频率还有潜力的现象,这就与G71的情形有些相似了,因此需要慎重对待!