AMD的雄心:32核APU32GB内存、7nm工艺
AMD最近也提出了百亿亿次计算的计划,使用的是自家的32核APU,每个APU都具备10TFLOPS(1TFLPS=一万亿次),10万个这样的节点就能实现百亿亿次计算了。
中国与美国在超级计算机领域存在或明或暗的竞争,在禁止对中国出口高性能计算机芯片之后,奥巴马政府推出了新的超级计算机计划,希望在2025年研发出百亿亿次超级计算机,夺回世界最快的称号。官方的计划还有10年时间,不过美国的科技公司有可能提前实现这个目标,AMD最近也提出了百亿亿次计算的计划,使用的是自家的32核APU,每个APU都具备10TFLOPS(1TFLPS=一万亿次),10万个这样的节点就能实现百亿亿次计算了。
自从AMD 9年前收购ATI之后就开始考虑CPU、GPU融合计算的事了,这么多年来AMD的APU总算开始上道了,不过跟AMD设想的还有点远。7月中旬,AMD的研究人员在IEEE发表了“通过异构计算实现百亿亿次计算”的论文,他们希望通过使用APU这样的异构处理器来实现计算性能的大跨越。
AMD的10万亿次性能APU架构
具体来说就是,AMD未来推出的APU至少拥有32个CPU内核,并搭配AMD研发的堆栈式缓存以及大容量非易失性内存,计算性能达到10TFLOPS(10万亿次)的高性能APU,具备极高的带宽及低开销、高速度的网络。
目前双精度浮点性能最强的加速卡之一是AMD的FirePro S9170,但性能也不过是2.62TFLOPS,Intel新一代的Xeon Phi加速卡双精度性能可达3TFLOPS,AMD未来的APU性能是10TFLOPS,差不多是目前水平的三到四倍,这样实现百亿亿次计算只需要10万个APU节点就可以了。
但是先别高兴的太早,这些都还是AMD的论文提出的设想,即便AMD内部有了这样的规划,实现起来也不是那么容易,目前见诸网络报道的32核、32GB HBM2.0显存、3072个流处理器单元等具体数据实际上也不是确定的,唯一能够确定的是这款APU可能要到2020年才能问世,而非报道中提及的2016-2017年,所以它也不是面向14nm甚至10nm节点的,未来将使用7nm节点,CPU架构至少也得是Zen架构的改进版Zen+甚至Zen+之后的新一代了。■