专访NV首席科学家：CUDA将是业界标准-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 新闻 / 正文

专访NV首席科学家：CUDA将是业界标准

2008年06月26日 08:08作者：孙敏杰编辑：孙敏杰文章出处：泡泡网原创

● 对于高性能计算来说，处理器的性能一般都是用浮点运算能力来衡量的，这次NVIDIA最新的GTX280是933GFLOPS，它实际上没有超过上一代的9800GX2，甚至不如AMD最新的HD4850/4870。我想问这个理论值是不是跟实际值有一定的差距？GTX280的优势在哪？

非常遗憾的是，GTX280的浮点运算能力未能超越9800GX2/HD3870X2

David博士：9800GX2和GTX280实际上是不具可比性的，一个是双芯片、一个是单芯片，架构和外部总线的规格都有很大的差异，所以光看理论值不代表真正的性能，要看最后的实际应用。

AMD的理论值看似很高，实际上和真正性能之间是有差距的，大家通过其游戏性能表现就能略知一二，对于并行计算来说也是相同的道理，我们的架构更加适合通用计算，拥有更高的效率。

就GTX200系列来讲，在并行计算架构方面做了进一步的优化，比如Dual-Issue的效率达到了93%-94%之高，实际性能更加接近于理论值，新一代产品拥有更高的输出率，工作效率和成本比也更好。

● GTX280的频率如果再高一点的话，实际上浮点运算能力就能突破万亿次（TFLOPS）了。但Intel却认为目前的架构和工艺很难真正实现万亿次浮点运算，在他看来DRAM带宽和Cache延迟都不可能符合万亿次运算，那么NVIDIA怎么看待这个问题，GPU的浮点运算为何能达到CPU的数十倍这么夸张？

David博士：我们所谈的高性能计算范畴中的万亿次计算，通常指的是双精度64Bit浮点运算，现在我们讲的这个万亿次计算是单精度的，目前双精度运算的速度只有单精度的1/10左右，因此距离真正的万亿次还有不小的距离。

但是GPU比传统的CPU已经有了很大的进步，无论单精度还是双精度的性能都要远远超越CPU。而且GPU的效率实际上也要比CPU高很多，因为CPU的内存带宽只有GPU显存带宽的1/10，存储效率要低很多，这就限制了其运算能力，虽然CPU通过更大的Cache来弥补不足，但也是杯水车薪，付出和回报不成比例。

比如GTX280，其双精度浮点运算能力是117GFLOPS，而显存带宽达到了141GB/s，超过1：1的比例保证了数据存取不会产生瓶颈，这方面GPU就要比CPU好很多了。这就是我们选择512Bit显存的重要原因，也是GTX280比上代产品、比竞争对手更强大之处！

0人已赞

第1页：NV首席科学家&伊利诺伊大学教授谈CUDA 第2页：什么是CUDA：针对GPU的C语言开发环境第3页：CUDA为何不支持A卡？能否成为行业标准？第4页：GPU万亿次浮点运算能力有多少实际意义？第5页：GPU和CPU到底谁更重要？未来发展趋势？

专访NV首席科学家：CUDA将是业界标准

关注我们