泡泡网显卡频道 PCPOP首页      /      显卡     /      新闻    /    正文

专访黄仁勋:CUDA-X86效率远胜多核CPU

记者:为何此次大会会要公布路线图?

黄仁勋:因为人们很想知道。

专访黄仁勋:群核GPU效率远胜多核CPU

NVIDIA下两代GPU路线图

记者:昨天在开场的Keynote演讲上你提到了下一代产品Kepler以及更下一代的产品的Maxwell,并且您也提到了针对Tesla产品,最终Maxwell在双精度运算每瓦特性能上将会有16倍以上的提升,那么您对未来的GPU在双精度运算性能与功耗之间的平衡是怎么看?

黄仁勋:现在的问题越来越有针对性了。可能是1:0.5,也许是2:3,也许是其他的比例。这些都是可能的答案,因为我还需要等待最终的设计完成。如果结论是1:0.5的比例的话,也许我将会在GPU中不知更多的SM单元,但是如果每个SM不能够充分的被利用,我也可能会减少SM单元,但是每个SM单元的效能上进行提升。

    再加上在制程以及显存等方面的选择,让这个问题的答案更加复杂了。这个答案只有在打样的一年到半年前左右才能够真正揭晓。

记者:您谈到Maxwell与Tesla的提升大约为16倍的性能功耗比,这个提升主要体现在性能上提升上还是功耗的控制上?

黄仁勋:不止16倍,Tesla到Fermi,大致提升3-4倍,Fermi到Kepler的提升大概3-4倍,Kepler到Maxwell的提升大致3-4倍。

这个提升主要体现在性能上,因为功耗一定的。对于整机而言,1000w是一个极限。我们的设计理念中不会过于强调晶体管的单个性能。这正是并行计算的优势所在,随着工艺的提升,晶体管的功耗会越来越低,我们就可以放入更多的晶体管,每个晶体管的性能会有提升,但是并不是

记者:未来会不会将IO加入到GPU的设计之中?

黄仁勋:这是个好主意,我们也正在进行相关的尝试。最大的问题不是物理上的接口问题,而是逻辑接口的问题,目前IO都是直接与系统存储相连,点用数据是需要从系统内存通过IO再到GPU,这个过程非常浪费。我认为PCI-E更为适合,PCI-E的贷款足够进行大规模数据传输。主要的瓶颈还是系统内存。我希望在未来可以从DMA直接到内存,不通过CPU。性能提升不只一翻。

0人已赞

关注我们

泡泡网

手机扫码关注