显卡进入GHz时代!GTX550Ti 首发评测
在GF104(GTX460)发布之前,大家都以为NVIDIA会把GF100核心的主要规格全部减半,从而制造出一颗拥有256SP 256Bit的主流核心。事实上之前国内外的媒体都是这样猜测的,因为GF100模块化四核心的设计,很容易将其“拆分为”规模大小不一的中低端核心:
但NVIDIA却没有这样做,最终GF104核心的规模出乎所有人的预料!如上图所示,GF104核心并非是GF100一半的规格,NVIDIA在微观架构方面做了不小的改动,那NVIDIA为什么要这样做呢?
● GF100更适合做并行计算、GF104/114更适合做图形处理
相信细心的读者已经看出来了,GF104/114相比GF100,最主要改变就是GPC(图形处理器集群)从4个减至2个,显存控制器从6个64bit(共384bit)减至4个64bit(共256bit),而最最重要的改变就是——每组SM当中的CUDA核心数量从32个增至48个。
我们知道,对GPU性能影响最大的模块就是流处理器(CUDA核心),如果能在GPU内部尽可能多的塞入CUDA核心的话,性能方面就会有很大的提升。但是CUDA核心也会消耗不少的晶体管,如果晶体管数太过庞大的话,GPU制造成本、良品率、功耗、发热也会受到较大影响。
大家可以注意看GF100芯片透视图,其中间位置有1/3的面积,这些是GF100一体式的二级缓存。NVIDIA为了提升GPU并行计算的效率,像CPU那样不惜成本的设计了大容量L2。L2对于性能的贡献主要集中在密集型计算任务当中,而对于普通的图形渲染来说,贡献就非常小了。那么如果将这些L2的容量进一步压缩,把节约出来的晶体管都变成CUDA核心的话,那么图形渲染性能将会得到显著提升。
GF104的SM要比GF100“胖”一些,CUDA核心横向扩张
于是,拥有较小L2、较多CUDA核心的GF104就诞生了,新核心每组SM中包含CUDA核心的数量从32个增至48个,增加了50%,流处理器总数达到了384个。NVIDIA在晶体管数一定的情况下,通过优化核心与缓存的配比,制造出了一颗更适合做图形处理的核心。
● 每组SM当中的纹理单元数量从4个增至8个
当然,NVIDIA也没有单纯增加CUDA核心的数量,针对新游戏的发展方向,GF104/114也做了较大的改进——纹理单元数量加倍!
纹理单元数量加倍
GF100核心的每组SM当中拥有32个CUDA核心,还包括了4个纹理单元,这样GF100总共就拥有64个纹理单元(GTX480屏蔽了一组是60个),少于Cypress的80个纹理单元。而API步入到DX10、11之后,游戏纹理贴图的大小爆发式增长,这样一来相对较少的纹理单元使得GTX400系列在大量使用了纹理贴图的游戏中难以发挥全部实力,如《孤岛危机》。
GF104/114核心只有8组SM,如果还是保持GF100的设计不变,那么纹理单元将只有32个,还没有HD5770多(40个)。所以NVIDIA对纹理单元部分也做了改良,每组SM中的数量直接加倍,最终GF104/114拥有64个纹理单元,与GF100相等!
CUDA核心数量增加了50%,而纹理单元增加了100%,偏向图形处理的改进意图显而易见。这些改进注定GTX460就是一款为新游戏而生的显卡。