超越费米!NVIDIA创高性能计算新标准
泡泡网显卡频道5月18日 全新架构使节能性可达原来的三倍,让开发者能够更轻松地对GPU加速计算系统进行编程。
2012 年5月15日(星期二)—GPU技术大会—英伟达公司今天发布了全新系列的英伟达(NVIDIA)Tesla GPU,该系列产品基于革命性的英伟达(NVIDIA) Kepler GPU计算架构,这款架构让更广范围的高性能计算(HPC)科学与技术应用程序能够更轻松地利用GPU加速的计算性能。
全新的英伟达Tesla K10和K20 GPU是计算加速器,旨在处理全球最复杂的HPC 难题。在Kepler设计过程中,英伟达专注于高性能和优异节能性,因此Kepler的效率可达上一代架构英伟达(NVIDIA)Fermi的三倍。Fermi架构在两年前发布之时曾树立了并行计算的新标准。
英伟达首席科学家兼研究副总裁Bill Dally表示:“Fermi是计算领域的一次重大进步。它确立了GPU加速计算在高性能计算中的上层地位,让数十万开发者加入了GPU计算平台的阵营。Kepler将同样具有颠覆性,由于简单易用、广泛适用以及高效等特点,Kepler架构将让GPU广泛应用于技术计算领域。
NVIDIA GK110核心
作为英伟达一系列公布内容的一部分,英伟达Tesla K10和K20 GPU曾在 GPU技术大会(GTC)上正式推出,所有公布的内容均可在GTC在线新闻中心找到。
英伟达开发了一系列创新架构技术,这些技术让Kepler GPU性能强劲、十分节能,而且还更适用于更广范围的开发者和应用程序。主要创新如下:
SMX流式多处理器——SMX流式多处理器是每一颗 GPU 的基本构成模块,我们完全专为高性能和节能性而对其进行了重新设计。它在每瓦特性能方面可达 Fermi 流式多处理器的三倍,因而以区区10台服务器机柜即可打造出计算性能高达 1 Petaflop的超级计算机。SMX的节能性是通过增加四倍数量的英伟达 (NVIDIA)CUDA架构核心来实现的,它同时还降低了每个核心以及GPU电源门控零件在闲置时的时钟频率,还最大限度增大了专门用于并行处理核心而非控制逻辑的GPU区域。
动态并行机制——该功能让GPU线程能够动态生成新线程,从而让GPU动态适应数据。这大大简化了并行编程,让GPU加速能够应用到更广范围的流行算法上,例如自适应网格细分、高速多级法以及多栅法。
Hyper-Q——该技术让多个CPU核心能够同时利用单个Kepler GPU上的诸多 CUDA架构核心。这大大提升了GPU的利用率、缩短了CPU闲置时间、提高了可编程性。Hyper-Q非常适合采用MPI的集群应用程序。
英伟达GPU工程高级副总裁兼Kepler首席架构师Jonah Alben表示:“我们在设计Kepler的过程中注重三点:性能、效率以及易于使用。它是GPU加速计算领域中的一个重要里程碑,将在计算研究领域中孕育出下一轮突破。”