专访黄仁勋:CUDA-X86效率远胜多核CPU
泡泡网显卡频道9月25日 美国当地时间9月20日至23日,NVIDIA第二届GTC2010 GPU技术大会在NVIDIA总部加利福尼亚州圣何塞市召开,NVIDIA公司首席执行官黄仁勋在台上做了精彩的演讲,我们也第一时间为大家献上了现场报道。
GTC2010相关报道:都是物理学家!NV四代GPU架构代号解读
GTC2010相关报道:探秘游戏之道!NVIDIA公司总部大揭密
GTC2010相关报道:NVIDIA发布CUDA-X86!跑CUDA无须显卡
GPU技术大会结束后,出席会议的记者们有幸对NVIDIA创始人、总裁兼首席执行官黄仁勋先生进行了专访,黄先生饶有兴趣的为大家详细解读了NVIDIA的产品计划和相关技术,并耐心的一一解答了来自世界各地的媒体编辑的问题。下面笔者就将专访相关内容整理给大家:
记者:您是否考虑研发基于X86架构的CPU?
黄仁勋:我们在CPU领域的策略是Arm,我们已经在Tegra中集成了Arm处理器。我选择Arm是因为Arm是目前世界上成长最快的CPU产品;我们选择Arm是因为Arm是目前世界上最重要的操作系统所适合的CPU产品,这些操作系统包括Android等;我们选择Arm是因为在Arm上集中了全球最多的应用编程人员;我们选择Arm是因为Arm是代表未来的CPU产品,而不是代表过去的CPU。
X86是平缓的上升曲线,而Arm的成长是垂直提升。而我们应该选择哪个与之合作呢?
记者:但是我们目前并没有看到Arm在您业务中占有非常大的比重?
黄仁勋:你不能关注在目前的业务比重,而应该关注在未来的业务比重。当你前进的时候,一定要站在时代的前列,而不是人云亦云。
记者:您是否会考虑在GPU中集成X86的CPU?
黄仁勋:不会。我认为Tegra是我们成长最快的个人计算机业务。GeForce+Tegra的模式一定会成长。我不知道未来Windows未来会怎么发展,但是我注意到微软已经通过了对Arm的授权。微软是一个软件公司,而未来世界上最大的软件市场将会在哪里?——Arm!
我认为所有有远见的公司都会在Arm进行投入,而不是在X86上进行投入。
记者:昨天我们看到了PGI发布了CUDA-X86编译器,我们理解:面向x86平台的PGI CUDA C编译器(CUDA-x86)能让开发人员在x86架构工作站、服务器、集群上编译、优化和运行CUDA架构应用程序,有无NVIDIA GPU均可。从这个角度上说,CUDA X86编译器的出现有何深远意义?是希望将CUDA架构进行更进一步的推广和普及,还是为了让编程人员看到CPU在硬件架构上的不足而更青睐于进行GPU的编程方式?
另外,您也提到,PGI的CUDA-X86是商业项目,如果运行效率较低的情况下,您认为应该以何种方式进行推广?
黄仁勋:多核心的CPU解决方案的是不可能与拥有核群GPU的解决方案在延展性达到一样的执行效率的。现实中很多应用中并不能对多核心并行运算进行非常好的扩展性支持。造成这种情况的原因与GPU拥有的高带宽及运算连贯性有关,但是不止如此。
即使实际的性能表现并不像使用GPU的扩展性那么好,在CPU使用CUDA X86进行编程还是可以较大幅度提升应用运行的效率。如果CUDA可以在一个1000核心的CPU核心集群中运行,执行的速度仍然会得到提升,仍然会带来很多的优势。最重要的优势是CUDA应用可以在任何配置下运行。
PGI将会努力提升CUDA X86的性能,我也会努力提升这个编译器的性能,因为我希望CUDA可以成功,那CUDA一定要在保证应用在所有平台上。
PhysX可以在没有NVIDIA芯片的iPhone、Xbox 360,PSP都能运行,同样PhysX也可以在X86和CUDA上运行,我们为PhysX在所有的平台上进行优化,因为我们希望PhysX成功。