决战性能之巅!NV双芯旗舰GTX590评测
不管GPU架构改不改,流处理器数量总是要扩充的,准确的说是以级数规模增长,这样才能大幅提升理论性能。在流处理器数量急剧膨胀之后,如何管理好如此庞大的规模、并与其它模块协调工作成为新的难题。
9.3 Fermi(GF100)和Cayman图形架构对比
自从DX10时代以来,ATI在架构上就一直没有太大的变化,即使到了DX11时代的HD5000/HD6000系列产品上,其核心架构仍然延续当年R600的设计思想。当然,细节进行了改进。
HD6970/HD6950(Cayman)核心架构图
这一次发布的HD6900系列从整体架构上来说也没有什么变化,和之前的几代产品都差不多。不过在一些细节的改进上,采用 Cayman 核心的 HD6900可以说是改进最多的一款产品,抛弃了沿用数年的VLIW5架构(俗称5D),而采用了VLIW4架构,增强了后端渲染能力,DX11中的Tesselation执行单元也从一个增加到了两个。
GF100芯片透视图,GF100图形架构:居然是四核心GPU
如果说Cypress是“双核心”设计的话,那么GF100的流处理器部分就是“四核心”设计,因为GF100拥有四个GPC(图形处理器集群)模块,每个GPC内部包含一个独立的Raster Engine(光栅化引擎),而在以往都是整颗GPU共享一个Raster Engine。
在特性方面,除了完全符合DirectX 11关于Compute Shader和并行kernel所要求的硬件环境之外,GF100还支持分支论断和基于CTA(线程块)级别的乱序执行,这使得GF100的整体Thread效率得到了进一步的显著提升。
当然,由于NV自GT200一来对通用计算市场的规划和态度,GF100中包含着规模庞大的DP单元,在特性上也支持了虽然同样划时代但仅对C++体系有巨大意义的统一定址体系。这部分晶体管的沉重负担不仅对图形过程毫无助益,甚至直接导致了NVIDIA不得不再次在纹理和后端作出了妥协,削减了纹理资源与运算资源的比例。这也是无法被抹杀的事实。