专访黄仁勋:CUDA-X86效率远胜多核CPU-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 新闻 / 正文

专访黄仁勋:CUDA-X86效率远胜多核CPU

2010年09月25日 00:09作者：孙敏杰编辑：孙敏杰文章出处：泡泡网原创

记者：为何此次大会会要公布路线图？

黄仁勋：因为人们很想知道。

NVIDIA下两代GPU路线图

记者：昨天在开场的Keynote演讲上你提到了下一代产品Kepler以及更下一代的产品的Maxwell，并且您也提到了针对Tesla产品，最终Maxwell在双精度运算每瓦特性能上将会有16倍以上的提升，那么您对未来的GPU在双精度运算性能与功耗之间的平衡是怎么看？

黄仁勋：现在的问题越来越有针对性了。可能是1:0.5，也许是2:3，也许是其他的比例。这些都是可能的答案，因为我还需要等待最终的设计完成。如果结论是1:0.5的比例的话，也许我将会在GPU中不知更多的SM单元，但是如果每个SM不能够充分的被利用，我也可能会减少SM单元，但是每个SM单元的效能上进行提升。

再加上在制程以及显存等方面的选择，让这个问题的答案更加复杂了。这个答案只有在打样的一年到半年前左右才能够真正揭晓。

记者：您谈到Maxwell与Tesla的提升大约为16倍的性能功耗比，这个提升主要体现在性能上提升上还是功耗的控制上？

黄仁勋：不止16倍，Tesla到Fermi，大致提升3-4倍，Fermi到Kepler的提升大概3-4倍，Kepler到Maxwell的提升大致3-4倍。

这个提升主要体现在性能上，因为功耗一定的。对于整机而言，1000w是一个极限。我们的设计理念中不会过于强调晶体管的单个性能。这正是并行计算的优势所在，随着工艺的提升，晶体管的功耗会越来越低，我们就可以放入更多的晶体管，每个晶体管的性能会有提升，但是并不是

记者：未来会不会将IO加入到GPU的设计之中？

黄仁勋：这是个好主意，我们也正在进行相关的尝试。最大的问题不是物理上的接口问题，而是逻辑接口的问题，目前IO都是直接与系统存储相连，点用数据是需要从系统内存通过IO再到GPU，这个过程非常浪费。我认为PCI-E更为适合，PCI-E的贷款足够进行大规模数据传输。主要的瓶颈还是系统内存。我希望在未来可以从DMA直接到内存，不通过CPU。性能提升不只一翻。

0人已赞

第1页：会不会在GPU中集成X86的CPU？第2页：会不会为Tegra开发操作系统？第3页：CUDA图像处理软件会不会支持AMD？第4页：下代Kepler和下下代Maxwell提升多少？第5页：GPGPU和APU这两种设计思路谁更好？

专访黄仁勋:CUDA-X86效率远胜多核CPU

关注我们