应用因素+部件能耗 曙光服务器新标准
在解决功耗方面,除采用上述CPU功耗控制、CPU工作频率调整、液体冷却、低功耗专用芯片、芯片级冷却等技术以外,学术界和企业界也在研究系统级节能技术和产品,包括:基于负载情况动态调整系统状态、实施部分节点或部件的休眠;根据各进程能耗的不同对CPU任务队列进行调整,如将一些产生较多热量的任务从温度较高的CPU上迁移到温度较低的CPU上从而实现能耗的均衡。如国家高性能计算机工程技术研究中心开发的自适应功耗管理系统,可实现基于能效的作业调度策略,IBM PowerExecutive允许用户 “ 计量 ” 任何单一物理系统或一组物理系统的实际电力使用数据和趋势数据,并可对实际用电量进行监视,并在系统、机箱或机架层次上对数据中心中的电耗和热耗进行有效分配。
服务器节能技术发展趋势
当前全球最快性能Top 500超级计算机其每瓦Gflops性能都在0.5以下,未来高效能计算机系统,其每瓦Gflops性能应在1.0GFlops per watt 以上,当前混合异构体系结构、自主节能管理、应用加速、系统级节能等技术的发展正推动这一目标的逐步实现。
体系结构促动节能技术的发展
虽然尚存在软件的可用性、任务调度、编程模式等诸多问题,基于标量处理器、FPGA、向量及多线程处理器、图形处理器等来构建混合异构的高性能计算机系统已成为解决能耗的主要途径之一,其中可重构计算结构能以较低的硬件复杂度实现指令、数据及线程级并行,并且具有较大的性能/功耗、性能/价格优势,已广泛应用于科学计算等诸多领域,以实现应用加速。采用混合异构的高性能计算机系统包括IBM代号为“Roadrunner”的千万亿次超级计算机,其采用混合异构刀片机群来构建,每个机箱包括3个计算节点,每个节点包括4个刀片,2个QS22 Cell刀片,1个扩展连接刀片,另外一个是LS21双核AMD Opteron刀片。全系统采用6562颗AMD 双核Opteron CPU 和12240颗八核Cell 处理器芯片,其中,Opteron处理器负责一般的计算进程、文件IO和通讯,Cell负责那些复杂的、重复的、大量消耗机器资源的计算过程,同时Roadrunner还采用先进的“混合编程(Hybrid Programming)”软件,以实现异构计算。该款机器以437.43 MFLOPS/watt的能效成绩排在Green500中第三名。
节能趋向全方位发展
芯片级、基础架构级以及系统级节能确实能够节约部分功耗,但并不能提高机房的冷却效率,高性能计算机系统中节能和散热冷却是紧密结合在一起的,基于服务器能耗监控和制冷设备的联动可以提升冷却系统的效率,实现精确制冷。服务器能耗监控和制冷设备的联动基于完整的机房散热模型,评估机房的散热效率,并根据散热模型计算相应制冷量,调整空调的风压和风速、液冷机柜的温度、流速、机柜风扇转速以实现精确制冷的需求。
可以说,未来服务器系统的节能必将向芯片、基础架构、系统、机房制冷联动全方位发展,包括芯片级节能技术、低功耗专用芯片、芯片级冷却、应用加速、液体冷却、CPU频率动态调整、功耗限制、实施部分节点或部件的休眠、根据各进程能耗的不同对CPU任务队列进行调整、基于能效的作业调度策略、基于散热模型的机房制冷联动等诸多方面。
自主节能管理浮出水面
未来节能管理和服务器监控管理融合的趋势将进一步增强,包括自动监控各类资源部件的能耗,对能耗监控历史数据深度挖掘、关联推理并实施系统动态功耗预测,通过其自配置、自恢复、自优化等特性自主地采取措施、减少人工干预,实施和作业调度、虚拟计算环境、机房制冷的联动,可根据应用的能耗特征构造虚拟计算环境,并提供保证服务质量的综合手段以及分析、诊断应用系统的工具,减少人工干预,以实现智能功耗管理。自主节能管理可以有效缓解高性能计算机系统管理的复杂性和功耗壁垒双重压力。