泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

游戏的八度空间,ATi与nVIDIA中档主

让我们先从AGP 8X的用途说起,众所周知当初AGP是为了缓解PCI 133MB/s总线的低传输率无法满足3D应用高数据量要求而产生的,从CPU到显卡之中专门开设一条独立的高带宽通道,这就是AGP的设计初衷。而我们常说的AGP 2X/4X/8X指的是在同一时钟内,所能传递的数据量指标。有关于AGP技术的内容大家可以参考Intel相关的AGP白皮书,现在我们就来说说从AGP 4X升级到AGP 8X的一些变化。

AGP8X的带宽优势

从上面的表格中可以看出,AGP 8X的总带宽大约在2128MB/s左右,而之前的AGP 4X的总带宽则在1056MB/s左右,就这么一看,好像真的很不错。提高了整整一倍的总带宽数据量,并且还加入了其它的预处理的更为先进的功能。如果再配合AGP快写功能,不需要通过内存,CPU就能经由北桥直接与AGP总线通话并传递数据,那么显卡的效率提升将相当的明显。所以nVIDIA就在它们的新一代产品中力推AGP 8X的功能妙用。例如它们力推的GF4 MX440 8X与GF4 Ti4200 8X都支持这一项新的功能。

正如我们上文所说的AGP 8X是为了进一步缓解AGP 4X的总带宽而产生的,那么在实际中是不是将一款显卡从AGP 4X改为AGP 8X就能大幅度的提高性能呢,我想并不是这么简单的,具体的提升幅度还是有相当程度上的针对性。要说明这个问题前我们需要先弄清楚AGP这条总线上所传输的数据基本上包括了两种:顶点数据与纹理数据。其中纹理数据只占据了AGP总线很少的传输时间,基本上由于目前游戏普遍并没有应用到十分大量的纹理素材比如1600x1200分辨率或者立体式的Cube纹理,所以应用软件通常都先通过AGP总线把这些纹理都复制到显卡的本地显存上。所以AGP总线所要应付的主要对象就是要命的顶点数据量。3D应用在做模型体建构的时候,并非渲染出整个的三角形,而是通过渲染出这个三角形的三个顶点数据来构建一个三角形,所以顶点数据实际上就是最为原始的3D模型渲染。在以往的评测中,我们多次提过了一个三角形的生成实际上就是一个顶点坐标的乘法运算:

虽然只有三个顶点(X,Y,Z),但是运算过程通常还需要加入一个参考值。所以我们可以简单的看成是一个四顶点的乘法,第完成一个顶点的乘法大约需要一条的指令,以此推断完成一个完整的三角形全部顶点生成就需要4条指令的运算。

现在让我们来做一道计算题,如果一个模型由1M(M=百万)个的三角形组成,其中每一个顶点的数据量大约为32 Byte,由于每个顶点基本上都是被共享的,所以可以看成每个顶点可以生成至少一个的三角形。如果要以每秒60个FPS运行这个模型的话,那么这个模型的总数据量大约是1M*32*60=1920MByte。显然无论是AGP 2x或者AGP 4x都无法满足这个模型所用到的多边形数量,只有AGP 8X才能满足。而在DX8越来越普及,DX9也即将到来的时候,在高精细度的游戏中出现这样的场景并不是什么奇怪的事,甚至目前的一些游戏已经达到这样的水准,所以AGP 8X是绝对必不可少,甚至还会有无法满足顶点数据量传输的危险。

另一方面,我们在考量了AGP所能承受的顶点数据量之后,还有一个因素需要考虑。那就是显卡GPU本身的三角处处理能力,如何计算一颗GPU的处理能力?通常我们将一颗具有Vertex Shader或者T&L能力显卡的主频率乘上顶点处理单元的流水线再除以4(指每4条指令完成一个三角形的生成)。这样可以求出一个理论值的多边形生成率,当然具体的性能还应参考进各家的设计优化体系和相关光影场景。通过这个公式我们大体上可以求出几款主流显卡在非常好的的条件下多边形生成能力的对比:

<

0人已赞

关注我们

泡泡网

手机扫码关注