不惧CUDA/PhysX!AMD HD5000发布专访
泡泡网显卡频道11月16日 作为WCG2009的主要赞助商之一,AMD此次抓住了千载难逢的机会,在中国成都WCG2009总决赛期间,正式召开Radeon HD5000系列显卡产品发布会,并在WCG会场设立了很大的展台,为比赛用电脑提供3A平台,并且现场展示HD5000显卡的特性和优势,让游戏迷们在观看赛事之余,可以亲身体验新一代DX11显卡的魅力!
泡泡网于11月13日下午对AMD HD5000发布会进行了网上全程视频直播,如果您错过了机会的话,可以进入我们的专题报道《Radeon HD5000发布会专题》观看录像;如果您对WCG2009总决赛展区有兴趣的话,可以点击查看《六屏游戏惊艳全场!WCG2009展区实拍》。
很巧,发布会上三位远道而来的AMD高层名字同为David,图中从左到右依次是:
- AMD全球高级产品公关经理 David Erskine
- AMD全球绘图产品事业部硅体工程部副总裁 王启尚(David Wang)
- AMD台式产品管理部产品市场总监 David Cummings
- AMD中国高级产品公关经理 刘艳丽(Linda Liu)
在发布会结束之后,笔者有幸对AMD几位高层进行了简短的专访,针对此前产品评测和技术架构方面的疑惑与图形领域的专家们面对面交谈,获益匪浅。现在笔者就将访谈内容整理出来,分享给泡泡网友们。
第一部分:通用计算方面CUDA与Stream
显卡之间的游戏性能之争,通过之前大量的评测,相信大家都已经心里有数了,无论技术、规格还是功耗,HD5000系列赢得毫无悬念。但NVIDIA有大量CUDA通用计算软件撑腰,而AMD方面比较弱势,因此CUDA与Stream之争成为新的关注焦点,无论编辑还是玩家相信都迫切的想知道AMD的看法与策略。
● AMD承认Stream落后于CUDA,但DX11时代CUDA将风光不再
首先AMD坦承,在通用计算方面近年来NVIDIA CUDA的发展速度的确很快,在业界统一标准没有出台之前,CUDA的应用领先与Stream。AMD虽然起步较晚,但也在不断努力,现在很多知名CUDA加速软件的新版本也能支持Stream了,比如PowerDVD和TotalMedia Theatre的GPU倍线技术、PowerDirect视频编辑、MediaShow Espresso视频转码、Adobe的PhotoShop加速和Flash加速都能支持AMD的GPU。
但CUDA毕竟是私有标准,它的威力也仅限于此了,随着微软DirectCompute和苹果主导的OpenCL标准出台后,软件开发商不会固守着CUDA不放,它们都将基于通用型的DirectCompute和OpenCL来开发适用于任何GPU的计算软件,而不是仅支持某一家的GPU,因为这样会损失很多的用户。
不管NVIDIA、AMD还是未来Intel的GPU,在通用计算方面的应用都不会有太大差别,CUDA与Stream之争也不会是比较谁支持的软件多些,而是比实际性能,就像对比游戏性能一样。
● AMD的GPU有很强大的浮点运算能力
王启尚先生指出,AMD的GPU拥有很强大的理论浮点运算能力,HD4870率先突破1TFLOPS,HD5870更是达到了2.7TFLOPS的浮点运算,达到上代产品的两倍以上。
至于效率方面,近年来随着架构的改进与驱动优化也取得了突破,比如目前中国最强的超级计算机(世界最强的CPU+GPU异构超级计算机)“天河一号”所使用的HD4870X2显卡,其实际运算能力达到了理论值的70%左右,这是一个令人非常惊喜的数字。未来AMD GPU的运算效率将会更高,通过一些权威的测试软件可以证明,AMD GPU超强的GFLOPS绝对不是虚标!
● CUDA局限性很大,GPU不可能干任何事情
CUDA的应用虽然很多,但因为NVIDIA自身的策略关系,还是有很大的局限性。由于NVIDIA只有GPU没有CPU,因此它总是一味的将所有任务塞给GPU去做,并强调GPU的重要性,而CPU则处于空闲状态,这样极端的做法不会让电脑性能提高很多,反而会误导消费者。
近年来多核CPU性能倍增,价格也一路走低,逐渐走向普及,用户没有理由让CPU和GPU其中之一闲着而让另一个满负荷工作,从异构计算的效率方面来讲,只有平衡分配任务才能最大化电脑性能。因此AMD将很多精力放在了CPU+GPU协同运算方面,让CPU和GPU负责适合各自架构和指令集的运算,未来Intel也将会这样做,但NVIDIA不会。
第二部分:物理加速方面,AMD如何对抗PhysX
只要是PhysX游戏,A卡都会输得很惨,低端N卡甚至都能秒杀优异A卡,AMD至今没有拿出GPU物理加速方案来对抗PhysX,这也就是国内很多人倾向于购买N卡的主要原因,那么未来AMD有何打算呢?
● 物理加速并不是只有PhysX,还有很多解决方案
PhysX其实属于CUDA的子集,也是GPU在通用计算方面的应用,只是物理加速和游戏结合的比较紧密。这些计算模型设计从前都是CPU在做,现在交给GPU做,会有更高的效率和更好的效果。
有不少游戏支持PhysX,但大都是DX9游戏,DX10游戏都比较少,而到了DX11时代,因为DirectCompute 11和Tessellation的关系,很多游戏不需要PhysX都能获得很好的物理效果。最典型的例子就是即将发布的DX11大作《科林麦克雷:尘埃2》:
DIRT2中的水面和旗帜都是由Tessellation技术动态生成的,尾气和飞扬的灰尘由DirectCompute 11后处理生成,其逼真的效果和任何物理引擎效果相比都有过之而无不及!
● 多核CPU也有不错的物理加速能力
和CUDA一样,NVIDIA的PhysX引擎只支持GPU加速,不支持CPU加速,当使用CPU加速时效率非常低。其实多核CPU也有很强的加速能力,比如Crysis就大量使用了CPU加速的物理破坏效果,所以AMD选择与Intel Havok合作,让多核CPU在游戏中能够发挥更大的功效。
GPU在3D渲染过程中负载已经很大了,如果让一块显卡同时处理复杂的图形渲染和物理加速的话,可能两方面都处理不太好,除非使用单独的物理加速卡。但CPU在游戏中的使用率非常低,四核CPU可能连20%都不到,CPU富裕的资源应该被充分利用起来。
第三部分:Eyefinity(宽域)技术六屏三屏应用方面
HD5000系列除了支持DX11外,最吸引眼球的技术就是Eyefinity六屏三屏输出,关于这个技术虽然已经做过一些测试和效果展示了,但笔者还是有太多的疑问需要专家来进一步解答。
● 只有HD5870特别版支持6DP输出,中低端显卡只支持3屏
Eyefinity技术最多能够输出六个2560x1600分辨率,但只有HD5870 Eyefinety6终极版支持6DP输出,其它普通版本最多都只能支持三个2560x1600分辨率。这是考虑到超高分辨率需要更强的性能、消耗更多的显存,普通显卡可能无法胜任,因此AMD不准备在中低端显卡上开放6头输出支持。
面对六个2560x1600分辨率,HD5870 Eyefinety6单卡可能还是不够用,此时玩家可以通过多种手段来提高帧速,比如关闭抗锯齿,超高分辨率下抗锯齿的效果并不明显但性能下降却非常严重;比如适当降低一些画质;当然如果对游戏画面有苛刻要求的话,还可以使用多块显卡组建交火,比如用一片HD5870 Eyefinety6终极版当主卡,再搭配一至三片普通HD5870当从卡,在成倍提升性能的同时,还能输出六个屏幕(目前的驱动还不行,下一个版本将会支持)。
● 双DVI+HDMI+DP的设计是为了保证所有用户都能即插即用
已经发布的四款HD5000显卡的输出接口完全相同,都是双DVI+HDMI+DP四个接口,这是考虑到兼容性而精心设计的。目前市面上绝大多数液晶显示器都是DVI接口,因此保持传统的双DVI是很有必要的,而且这两个DVI都是双通道的能够支持2560x1600分辨率,HDMI是电视机的标准接口,也有不少显示器使用,DP则是未来的趋势,也是组建3屏的必备接口。
其中HDMI接口和两个DVI之一共享端口,而DP接口是独立的,因此想要组建三屏输出必须使用DP,其他两个接口则可以任选。
这样的设计拿任何显示器过来几乎都可以即插即用,只有D-SUB接口的低端液晶或者CRT也可以用DVI转D-SUB来支持,可以说是相当完美的设计。
● 中低端GPU有能力支持6屏输出,2D专业显卡将会开放支持
其实在GPU设计之初,HD5800、HD5700甚至以后的HD5600、5400这些在显示输出方面都有能力支持6屏输出,只不过目前的显卡尚未开放支持,原因有两方面:一是3D性能不足以支持超高分辨率游戏、二是从兼容性方面考虑设计了两个Dual-Link DVI就无法安置更多的输出接口,而如果都设计成Mini DP的话,光是转接线的成本可能就要比显卡还高。
Mini-DP转接头很贵,尤其是转Dual-Link DVI的版本
因此,AMD不打算为中低端游戏显卡提供六屏输出支持,未来将会推出2D专业显卡,为无需3D渲染、只要多头输出的专业应用提供支持,单GPU六屏双GPU十二屏都很容易实现。
第四部分:DX11和游戏性能方面
DX11方面由于目前游戏还不多,因此现在谈论还为时尚早,不过比起当年DX10游戏来说,DX11游戏的开发进度明显要快很多。
● Tessellation是DX11的专利,AMD前代产品不能支持
AMD从DX10时代开始,HD2000/3000/4000系列全都支持Tessellation细分曲面技术,直至HD5000系列Tessellation被纳入DX11标准之中。但DX10和DX11中的Tessellation技术有很大的区别,DX11为了配合Tessellator模块的工作,新增了Hull和Domain两个新的着色器,而DX9/10中没有。
新的DX11 Tessellation不但效率更高,而且效果更好,因此HD4000/3000/2000显卡将不能支持DX11游戏中的Tessellation技术,除非游戏专门为老显卡设计新的渲染模式。
● NV不敢谈游戏性能,Fermi是纸老虎
NVIDIA公布了很多有关Fermi架构的信息,但只是强调科学计算方面有哪些优势,而对于拥有最多用户群体的游戏方面避而不谈。王启尚先生认为,如果我哪方面是弱点的话,我就会刻意的回避它,所以Fermi就像是一头“纸老虎”。
Fermi有两处最大的改进,一是支持ECC显存,二是双精度浮点运算能力达到了单精度的一半(GT200是1/8,AMD全系列是1/5)。而正好这两大改进对于普通用户和游戏玩家来说是一点用都没有……
本周AMD就会发布双核心的Radeon HD 5900系列(Hemlock),性能将会遥遥领先与对手,因此AMD底气十足……■<