泡泡网显卡频道 PCPOP首页      /      显卡     /      新闻    /    正文

专访NV首席科学家:CUDA将是业界标准

● 对于高性能计算来说,处理器的性能一般都是用浮点运算能力来衡量的,这次NVIDIA最新的GTX280是933GFLOPS,它实际上没有超过上一代的9800GX2,甚至不如AMD最新的HD4850/4870。我想问这个理论值是不是跟实际值有一定的差距?GTX280的优势在哪?

开创视觉计算帝国GTX280/260权威评测
非常遗憾的是,GTX280的浮点运算能力未能超越9800GX2/HD3870X2

David博士:9800GX2和GTX280实际上是不具可比性的,一个是双芯片、一个是单芯片,架构和外部总线的规格都有很大的差异,所以光看理论值不代表真正的性能,要看最后的实际应用。

    AMD的理论值看似很高,实际上和真正性能之间是有差距的,大家通过其游戏性能表现就能略知一二,对于并行计算来说也是相同的道理,我们的架构更加适合通用计算,拥有更高的效率。

    就GTX200系列来讲,在并行计算架构方面做了进一步的优化,比如Dual-Issue的效率达到了93%-94%之高,实际性能更加接近于理论值,新一代产品拥有更高的输出率,工作效率和成本比也更好。

● GTX280的频率如果再高一点的话,实际上浮点运算能力就能突破万亿次(TFLOPS)了。但Intel却认为目前的架构和工艺很难真正实现万亿次浮点运算,在他看来DRAM带宽和Cache延迟都不可能符合万亿次运算,那么NVIDIA怎么看待这个问题,GPU的浮点运算为何能达到CPU的数十倍这么夸张?

开创视觉计算帝国GTX280/260权威评测

David博士:我们所谈的高性能计算范畴中的万亿次计算,通常指的是双精度64Bit浮点运算,现在我们讲的这个万亿次计算是单精度的,目前双精度运算的速度只有单精度的1/10左右,因此距离真正的万亿次还有不小的距离。

    但是GPU比传统的CPU已经有了很大的进步,无论单精度还是双精度的性能都要远远超越CPU。而且GPU的效率实际上也要比CPU高很多,因为CPU的内存带宽只有GPU显存带宽的1/10,存储效率要低很多,这就限制了其运算能力,虽然CPU通过更大的Cache来弥补不足,但也是杯水车薪,付出和回报不成比例。

    比如GTX280,其双精度浮点运算能力是117GFLOPS,而显存带宽达到了141GB/s,超过1:1的比例保证了数据存取不会产生瓶颈,这方面GPU就要比CPU好很多了。这就是我们选择512Bit显存的重要原因,也是GTX280比上代产品、比竞争对手更强大之处!

0人已赞

关注我们

泡泡网

手机扫码关注