钛平盛世 精彩视界 GTX660Ti首发评测
● 从SM到SMX:流处理器和每瓦性能双飞
基于效能和计算能力方面的考虑,NVIDIA与AMD不约而同的改变了架构,NVIDIA虽然还是采用SIMT架构,但也借鉴了AMD“较老”的SIMD架构之作法,降低控制逻辑单元和指令发射器的比例,用较少的逻辑单元去控制更多的CUDA核心。于是一组SM当中容纳了192个核心的壮举就变成了现实!
通过上面这个示意图就看的很清楚了,CUDA核心的缩小主要归功于28nm工艺的使用,而如此之多的CUDA核心,与之搭配的控制逻辑单元面积反而缩小了,NVIDIA强化运算单元削减控制单元的意图就很明显了。
Fermi的硬件相关性检查变为Kepler的软件预解码
此时相信有人会问,降低控制单元的比例那是不是意味着NVIDIA赖以成名的高效率架构将会一去不复返了?理论上来说效率肯定会有损失,但实际上并没有想象中的那么严重。NVIDIA发现线程的调度有一定的规律性,编译器所发出的条件指令可以被预测到,此前这部分工作是由专门的硬件单元来完成的,而现在可以用简单的程序来取代,这样就能节约不少的晶体管。
● 摆脱CUDA核心的束缚:GPU核心频率暴涨
除了CUDA核心数量大增之外,开普勒架构还有个很明显的改变,那就是CUDA核心的频率不再是GPU频率的两倍,现在整颗GPU所有单元的工作频率都是相同的!
NVIDIA官方对CUDA与核心同频的解释是——功耗原因,为了尽可能的控制GTX680的功耗,不再让CUDA工作在两倍频率下。
总而言之,表面上看来来这个改变似乎不是什么好事,但实际上却意义重大。之前GTX580之所以核心频率低而显卡功耗高很大程度上就是受到过高CUDA核心频率的影响。如今摆脱CUDA核心的束缚,GPU核心频率轻而易举就能突破1GHz,这样一来显卡运行效率更高,同时功耗也控制在了很低的水平。
● 显存频率后来居上 全面超越对手
显存作为显卡数据交换的“仓库”,其效率高低直接影响到整体的性能。在开普勒核心诞生之前,AMD一直在显存方面占据绝对优势。
现在,NVIDIA在显存频率上面终于反超AMD,重新设计的显存控制器突破了频率的桎梏,瞬间从4000MHz飙升至6000MHz,带宽提升达50%之多!