火力全开超TITAN!GTX780GHz首发评测
Kepler GK110为NVIDIA Tesla打造,其目标是成为世界上并行计算性能最高的微处理器。GK110 不仅大大超过由 Fermi 提供的原始计算能力,而且非常节能,显著减少电力消耗,同时产生的热量更少。完整 Kepler GK110 实施包括 15 SMX 单元和六个 64 位内存控制器。不同的产品将使用GK110 不同的配置。例如,某些产品可能部署 13 或 14 个 SMX。在下面进一步讨论的该架构的主要功能,包括:
1、新 SMX 处理器架构
2、增强的内存子系统,在每个层次提供额外的缓存能力,更多的带宽,且完全进行了重新设计,DRAM I/O 实施的速度大大加快。
3、贯穿整个设计的硬件支持使其具有新的编程模型功能
GK104框架规格
Kepler GK110芯片框图(GTX 780屏蔽了其中的两组SMX)
Kepler GK110 支持新 CUDA Compute Capability 3.5。(有关 CUDA 的简介请参考附录 A ‐CUDA 快速回顾)。下表对比了 Fermi 和 Kepler GPU 架构的不同计算能力的参数:
Fermi和Kepler GPU的计算能力
性能/功率比
Kepler架构的一个主要设计目标是提高电源效率。设计Kepler时,NVIDIA工程师应用从Fermi中积累的经验,以更好地优化Kepler、实现高效运行。台积电的 28nm 制造工艺在降低功耗方面起着重要的作用,但许多 GPU 架构需要修改,以进一步降低功耗,同时保持出色的性能。
Kepler每一个硬件设备都经过设计和擦洗,以提供卓越的性能/ 功率比。出色性能/功率比的非常好的案例是Kepler GK110新流式多处理器 (SMX) 中的设计,与最近Kepler GK104引入的 SMX 单元的许多方面类似,但计算算法包括更多双精度单位。