NVIDIA GPU加速超级计算机开创节能世界纪录
泡泡网显卡频道1月31日 意大利优异超级计算中心利用 Kepler 加速器与水冷方式超越了当前 Green500 头号系统。2013 年 1 月 31 日 — 美国加利福尼亚州圣克拉拉 — NVIDIA Kepler是全球最快、最高效的高性能计算 (HPC) 架构,意大利的“Eurora”超级计算机采用的正是基于这一架构的 NVIDIA Tesla GPU 加速器。NVIDIA(英伟达) 公司今天宣布,这台超级计算机在数据中心节能性方面开创了一项全新的纪录。
意大利博洛尼亚的 Cineca 机构是这个国家最强大的超级计算中心。Eurora 超级计算机由 Eurotech 打造,于周三部署在了该中心内。这台超级计算机的每瓦特持续性能达到了 3,150 Megaflops(1),比最近发布的 Green500 全球最节能超级计算机榜单中的头号系统高 26%。(2)
Eurora 之所以能够取得这一破纪录的成就,是因为它将 128 个节能而高性能的 NVIDIA Tesla K20 加速器与 Eurotech Aurora Tigon 超级计算机结合到了一起。后者采用创新的 Aurora 热水散热技术,在该 HPC 系统中的所有电子电气部件上均直接使用热水散热。
高级计算合作伙伴 (PRACE) 成员与意大利主要的研究机构均可使用 Eurora,这台超级计算机将让科学家能够在一系列科学学科中推动研究与探索的进步,这些学科包括材料科学、天体物理学、生命科学以及地球科学。
Cineca 高性能计算部门主任 Sanzio Bassini 表示: “先进的计算机模拟让科学家能够探索新现象与测试假设条件,而这类模拟需要海量的性能,会消耗大量电能。Eurora 配有超高效 Aurora 系统与 NVIDIA GPU 加速器,将让欧洲研究人员能够拥有足够的计算性能来研究所有类型的物理系统与生物系统,同时让我们能够抑制数据中心的功耗与成本。”
Eurora 系统将 NVIDIA Tesla K20 GPU 与 Eurotech 的 Aurora 热水散热技术相结合,因而比传统的风冷解决方案更高效、更紧凑。Eurora 的硬件架构包括 Eurotech Aurora Tigon,基于该架构的 HPC 系统让数据中心能够将能耗成本最多降低 50%,将总体拥有成本降低 30-50%。(3)
此外,在像意大利这样通常是温暖气候的地区,Aurora 热水散热技术的运用还能够减少空调的使用或完全不需要空调。系统产生的热能可以用于给建筑物供热、驱动吸附式制冷机以调节空气温度或用于发电、加热以及制冷三者相结合的三联产。
NVIDIA Tesla 加速计算事业部总经理 Sumit Gupta 表示: “GPU 加速器生来就比 CPU 节能,而 Tesla K20 加速器大幅拉开了这一差距。节能性现已成为界定计算性能的一大要素。从小型集群到未来的百亿亿次级 (Exascale) 系统,GPU 让各种尺寸的数据中心计算机系统均能够在经济可行的能耗预算之内实现性能目标。”
Eurora 是 PRACE 2IP 计划中专为 Cineca 而开发的一款原型系统,旨在提供一个可持续的高品质基础架构,以满足欧洲 HPC 用户群体最严苛的需求。Eurotech 今天还推出了 Eurotech Aurora Tigon 超级计算机的一个商用版本。如需了解更多信息,敬请访问 Eurotech 网站。
关于 NVIDIA Tesla GPU
NVIDIA Tesla GPU 是基于 NVIDIA CUDA? 并行计算平台与编程模型的大规模并行加速器。Tesla GPU 完全专为节能的高性能计算 (HPC)、计算科学以及超级计算而设计,与仅使用 CPU 的做法相比,能够大幅加速一系列科学与商业应用程序。
如需了解 CUDA 的更多信息或者如需下载最新版本,敬请访问 CUDA 网站。如需了解更多的产品信息,敬请访问 NVIDIA Tesla 网站。大家可以在 Twitter 上关注我们 @NVIDIATesla。
(1) 系统配置: 64 个 Aurora Tigon 节点系统; 每个节点 2 颗 Intel 至强 E5-2687W 和 2 块 NVIDIA K20 GPU 加速器; 测量能耗时所遵循的程序与 Green500 指导方针中规定的相同,使用的仪表为经过校准的功率表,运行的软件为定制版本的 LINPACK。
(2) 与 Beacon 系统的每瓦特 2,499 Megaflops 相比,该系统位于美国国家计算科学研究院/田纳西大学。 数据来源:http://green500.org/lists/green201211
(3) 我们对拥有 1,800 个服务器节点的中型数据中心进行了风冷与水冷之间的对比,该数据根据对比结果计算得出,每个节点均包含两颗 Intel 至强 E5-2670 2.6 Ghz 处理器。