不惧CUDA/PhysX!AMD HD5000发布专访
第一部分:通用计算方面CUDA与Stream
显卡之间的游戏性能之争,通过之前大量的评测,相信大家都已经心里有数了,无论技术、规格还是功耗,HD5000系列赢得毫无悬念。但NVIDIA有大量CUDA通用计算软件撑腰,而AMD方面比较弱势,因此CUDA与Stream之争成为新的关注焦点,无论编辑还是玩家相信都迫切的想知道AMD的看法与策略。
● AMD承认Stream落后于CUDA,但DX11时代CUDA将风光不再
首先AMD坦承,在通用计算方面近年来NVIDIA CUDA的发展速度的确很快,在业界统一标准没有出台之前,CUDA的应用领先与Stream。AMD虽然起步较晚,但也在不断努力,现在很多知名CUDA加速软件的新版本也能支持Stream了,比如PowerDVD和TotalMedia Theatre的GPU倍线技术、PowerDirect视频编辑、MediaShow Espresso视频转码、Adobe的PhotoShop加速和Flash加速都能支持AMD的GPU。
但CUDA毕竟是私有标准,它的威力也仅限于此了,随着微软DirectCompute和苹果主导的OpenCL标准出台后,软件开发商不会固守着CUDA不放,它们都将基于通用型的DirectCompute和OpenCL来开发适用于任何GPU的计算软件,而不是仅支持某一家的GPU,因为这样会损失很多的用户。
不管NVIDIA、AMD还是未来Intel的GPU,在通用计算方面的应用都不会有太大差别,CUDA与Stream之争也不会是比较谁支持的软件多些,而是比实际性能,就像对比游戏性能一样。
● AMD的GPU有很强大的浮点运算能力
王启尚先生指出,AMD的GPU拥有很强大的理论浮点运算能力,HD4870率先突破1TFLOPS,HD5870更是达到了2.7TFLOPS的浮点运算,达到上代产品的两倍以上。
至于效率方面,近年来随着架构的改进与驱动优化也取得了突破,比如目前中国最强的超级计算机(世界最强的CPU+GPU异构超级计算机)“天河一号”所使用的HD4870X2显卡,其实际运算能力达到了理论值的70%左右,这是一个令人非常惊喜的数字。未来AMD GPU的运算效率将会更高,通过一些权威的测试软件可以证明,AMD GPU超强的GFLOPS绝对不是虚标!
● CUDA局限性很大,GPU不可能干任何事情
CUDA的应用虽然很多,但因为NVIDIA自身的策略关系,还是有很大的局限性。由于NVIDIA只有GPU没有CPU,因此它总是一味的将所有任务塞给GPU去做,并强调GPU的重要性,而CPU则处于空闲状态,这样极端的做法不会让电脑性能提高很多,反而会误导消费者。
近年来多核CPU性能倍增,价格也一路走低,逐渐走向普及,用户没有理由让CPU和GPU其中之一闲着而让另一个满负荷工作,从异构计算的效率方面来讲,只有平衡分配任务才能最大化电脑性能。因此AMD将很多精力放在了CPU+GPU协同运算方面,让CPU和GPU负责适合各自架构和指令集的运算,未来Intel也将会这样做,但NVIDIA不会。