2560块4870X2打造天河一号超级计算机
知道了详细的CPU和GPU配置之后,我们再来细算“天河一号”的理论计算能力与实际计算能力:
● 3072个E5540搭配3072个E5450的理论峰值计算能力为:
3072x(40.48+48)=271810.56GFlops≈272TFlops(双精度)
● 2560块HD4870X2的理论峰值计算能力为:
920x2x2560/5=942080GFlops≈942TFlops(双精度)
这样加起来的话,“天河一号”的理论双精度浮点运算能力为1214TFLPOS,比官方公布的峰值数据稍高一点。
“天河一号”的实测双精度浮点运算能力为564TFlops,一般CPU的运算效率最高可达80%左右,那么由此可估算出GPU所贡献的运算量为346TFlops,也就是说GPU在该超级计算机中的性能贡献已经超过了CPU!
通过估算来看,目前的GPU运算效率只有37%左右,官方称经过优化之后,GPU的计算效率可从20%提高至70%左右,看来“天河一号”还有很大的潜力可挖!
再来看看去年另外一台基于Tesla GPU的超级计算机,它是由东京工业大学打造的首款基于CPU+GPU异构计算架构的超级计算机,并率先挤入世界500强。
TSUBAME超级计算机通过加入170台Tesla S1070 1U系统,理论峰值性能为170TFLOP,2008年11月实测的Linpack性能达到了77.48 TFLOP,排名世界第29位,其后经过不断调试与优化,Linpack成绩提高至87.01TFlops,2009年6月排名第41位。
日本东京工业大学的TSUBAME总体实力和“天河一号”有很大的差距,但两者的运算效率差不多。由此可见中国国防科技大学的“天河一号”在异构计算方面的研发已经达到了世界顶尖水平,这对于我国超级计算机的发展来说是个不小的突破,也证明了异构计算已经成为了发展趋势。