开创视觉计算帝国GTX280/260权威评测
第二章/第二节 GTX200核心第二代统一渲染架构解析
NVIDIA将G80称为第一代“统一渲染架构”,而GTX200则被称为第二代“统一架构”,渲染二字不复存在,从这个细微的变化就可以看出新一代的GPU的架构已经在朝着非图形领域发展了。现在我们就来看看两代核心架构图:
统一渲染架构,说白了就是使用全新的Shader模块(现在被称为流处理器)取代之前的顶点管线和像素管线,然后通过专用的控制单元来统一协调指令分配,按照游戏的负载来动态的调度顶点、几何、像素指令。
所以从理论上来讲,NVIDIA和AMD之前的GPU在统一渲染架构的设计原理上是一致的。第一代统一渲染架构,就是将像素、顶点、几何、物理等图形渲染指令统一了起来,按照比例和优先级交给流处理器处理。
GTX200核心架构图
近年来,GPU除了进行图形渲染的本职工作之外,开始越来越多地涉足非图形计算领域,比如科学计算、媒体编码、数据分析等。NVIDIA甚至专门发布GPGPU的新品牌——Telsa,而且为GPU开发了全新的CUDA语言,为GPU的通用化提供了简单易用的新平台。
两年时间过去了,虽然G80能够很好的胜任并行数据计算的需要,但NVIDIA发现图形架构还有继续改进的余地,只要在核心内部设计全新的控制模块,并对微架构进行专门的优化,就能将GPU的图形架构改造成更加适合非图形领域的并行数据处理架构。
通过核心架构图可以看到,GTX200总共拥有十个流处理器阵列,每个阵列内部拥有8×3=24个流处理器,其中每8个为一组构成SIMT(单指令多任务架构),并共享16K指令缓存,三组SIMT共享一级缓存。这样的标量流处理器设计适合执行高度并行化指令,无论对于传统的图形渲染,还是物理加速运算、大规模数据处理都游刃有余。
因此,第二代统一渲染架构的主要含义,就是将图形处理架构和并行计算架构完美的结合起来,成为一颗真正意义上的通用处理器,超越图形处理器的概念!