泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

开创DX11宏图霸业!镭HD5870权威评测

第二章 DirectCompute:不止是通用计算

    此前在测试阶段,微软将DirectX 11中包含的GPU通用计算称为Compute Shader或DirectX Compute,而在近期的正式版本中又改名为Direct Compute,一字(X)之差何必呢?显然,微软为了将GPU通用计算和主要是3D应用的DirectX区别开,进一步凸出Direct Compute的重要性并与OpenCL分庭抗力,由此足以见得微软对GPU通用计算的重视程度。

    DirectCompute主要针对GPU计算,但由此可以衍生出一些在图形渲染方面的特殊应用,因此笔者将其单列一章,对一些重要技术进行详细介绍。

第二章/第一节 DirectCompute与Stream/CUDA/OpenCL的关系

    提起GPU通用计算,自然会让人想到NVIDIA的CUDA、ATI的Stream以及开放式的OpenCL标准,再加上微软推出的DirectCompute,四种技术标准令人眼花缭乱,他们之间的竞争与从属关系也比较模糊。

    首先我们来明确一下概念:

  • OpenCL类似于OpenGL,是由整个业界共同制定的开放式标准,能够对硬件底层直接进行操作,相对来说比较灵活,也很强大,但开发难度较高;
  • DirectCompute类似于DirectX,是由微软主导的通用计算API,与Windows集成并偏向于消费领域,在易用性和兼容性方面做得更出色一些;
  • CUDA和Stream更像是图形架构或并行计算架构,NVIDIA和ATI对自己的GPU架构自然最了解,因此会提供相应的驱动、开发包甚至是现成的应用程序,通过半开放的形式授权给程序员使用。


ATI Stream示意图

    其中ATI最先提出GPGPU的概念,Folding@Home和AVIVO是当年的代表作,但在被AMD收购后GPGPU理念搁浅;此后NVIDIA后来者居上,首次将CUDA平台推向市场,在这方面投入了很大的精力,四处寻求合作伙伴的支持,并希望CUDA能够成为通用计算的标准开发平台。


NVIDIA CUDA示意图

    在NVIDIA大力推广CUDA之初,由于OpenCL和DirectCompute标准尚未定型,NVIDIA不得不自己开发一套SDK来为程序员服务,这套基于C语言的开发平台为半开放式标准,只能用于NVIDIA自家GPU,因此并未得到业界的认可,AMD认为CUDA是封闭式标准,不会有多少前途,AMD自家的Stream虽然是完全开放的,但由于资源有限,对程序员帮助不大,因此未能得到大量使用。


OpenCL一经提出就受到业界的大力支持

    于是在去年由苹果牵头,以苹果OpenCL草案为基础,联合业界各大企业共同完成了标准制定工作。随后Khronos Group成立相关工作组,工作组的26个成员来自各行各业,且都是各自领域的领导者,具体包括3DLABS、Activision Blizzard、AMD、苹果、ARM、Barco、博通、Codeplay、EA、爱立信、飞思卡尔、HI、IBM、Intel、Imagination、Kestrel Institute、摩托罗拉、Movidia、诺基亚、NVIDIA、QNX、RapidMind、三星、Seaweed、TAKUMI、德州仪器、瑞典于默奥大学。

    OpenCL标准一经成立,IT三巨头Intel、NVIDIA和AMD都争先恐后的加入支持。AMD由于自家Stream推广不利、支持OpenCL并不意外;Intel即将发布的Larrbee GPU一大卖点就是强大的计算能力,支持OpenCL有百利而无一害;NVIDIA虽然在大力推广CUDA开发平台,但无奈势单力薄,小有所成但前途未卜,OpenCL虽然与CUDA C语言有交集但并不冲突,是相辅相成的互补关系,NVIDIA自然也大力支持。

    OpenCL组织中唯独微软不在其列,微软有自己的如意算盘。经过多年的发展,DirectX凭借快速更新换代策略、相对轻松的开发与移植方式,在与OpenGL的交战中已全面占据上风,OpenGL的传统强项——专业绘图领域也在被DirectX不断的蚕食。因此微软打算用相同的策略来对抗尚未站住根基的OpenCL,于是DirectCompute诞生了。

    就如同GPU能同时支持DirectX与OpenGL那样,NVIDIA和AMD对DirectCompute和OpenCL都提供了无差别支持,真正的GPU通用计算之战,不在CUDA与Stream之间,而是OpenCL与DirectCompute之争,DX11时代才刚刚开始……

0人已赞
第1页:DX10大势已去!首款DX11显卡HD5870发布第2页:DX10.0大革命:画面很完美、但速度很慢第3页:DX10.1小修补:片面追求画面行不通第4页:DX11时代来临:为高效率游戏而生第5页:DX11特性解读:Shader Model 5.0第6页:DX11特性解读:多线程处理第7页:DX11特性解读:两种新的纹理压缩格式第8页:DirectCompute与Stream/CUDA/OpenCL的关系第9页:DirectCompute 10/11版本间的区别第10页:DirectCompute 11新特效:顺序无关透明化第11页:DirectCompute 11新特效:景深第12页:DirectCompute 11新特效:高清晰环境光遮蔽第13页:DX11重要技术:Tessellation前身今世解读第14页:2002年R200:Tessellation的鼻祖TruForm第15页:2005年Xenos:Tessellation登陆XBOX360第16页:2007年R600:孤掌难鸣的Tessellation第17页:2009年RV870:纳入DX11修成正果第18页:DX11版Tessellation的改进第19页:DX11版Tessellation在游戏中的应用实例第20页:DX11游戏并不遥远:第4季度发布4款2第21页:DX11游戏:《异形大战铁血战士》第22页:DX11游戏:《科林麦克雷:尘埃2》第23页:DX11游戏:RTS网游《BattleForge》第24页:DX11游戏引擎:《Frostbite Engine 2》第25页:DX11游戏引擎:《Cry Engine 3》第26页:RV870核心架构图及规格全对比第27页:RV870架构解析:竟然是单芯片“双核心”第28页:RV870架构解析:图形控制引擎第29页:RV870架构解析:流处理器规格特性第30页:RV870架构解析:纹理单元和缓存第31页:RV870架构解析:光栅单元和抗锯齿第32页:RV870架构解析:更高频更节能的第三代GDDR5第33页:ATI Eyefinity三屏/六屏显示技术解析第34页:Matrox三屏环幕技术回顾第35页:ATI的惊人设计 RV870最多支持六屏输出第36页:灵活多变的三屏六屏输出方案一览第37页:三屏/六屏输出玩游戏震撼效果展示第38页:编辑实战HD5870三屏玩游戏实拍图第39页:HD5870三屏/六屏实际应用视频展示第40页:HD5870显卡赏析:AMD官方高清晰美图第41页:HD5870显卡实物:外观赏析第42页:HD5870显卡实物:最轻的高端卡第43页:HD5870显卡拆解:40nm核心与GDDR5显存第44页:HD5870显卡供电:数字式4+1+2相第45页:测试平台:Core i7 975 + X58最强配置第46页:DX9C理论性能测试:3DMark06第47页:DX10理论性能测试:3DMark Vantage第48页:DX10渲染性能测试:填充率和贴图第49页:DX10游戏:《孤岛危机:弹头》第50页:DX10游戏:《冲突世界:苏联进攻》第51页:DX10游戏:《生化危机5》第52页:DX10.1游戏:《汤姆克兰西之鹰击长空》第53页:DX10.1游戏:《潜行者:晴空》第54页:DX10.1游戏:《孤岛惊魂2》第55页:DX9C游戏:《街头霸王4》第56页:DX9C游戏:《极品飞车13:变速》第57页:DX9C物理游戏:《镜之边缘》第58页:OpenGL游戏:《敌占区:雷神战争》第59页:功耗测试:HD5870耗电最少性能最强第60页:测试成绩汇总:HD5870 PK GTX285第61页:测试成绩汇总:HD5870 PK HD4870X2第62页:测试成绩汇总:HD5870 PK GTX295第63页:双卡战四核:HD5870 CF对决GTX295 SLI第64页:编辑测试手记:相当完美的高端卡第65页:全文总结与展望:敢为人先勇于创新的ATI

关注我们

泡泡网

手机扫码关注