开创DX11宏图霸业！镭HD5870权威评测-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

开创DX11宏图霸业！镭HD5870权威评测

2009年12月24日 15:05作者：孙敏杰编辑：孙敏杰文章出处：泡泡网原创

第二章 DirectCompute：不止是通用计算

此前在测试阶段，微软将DirectX 11中包含的GPU通用计算称为Compute Shader或DirectX Compute，而在近期的正式版本中又改名为Direct Compute，一字(X)之差何必呢？显然，微软为了将GPU通用计算和主要是3D应用的DirectX区别开，进一步凸出Direct Compute的重要性并与OpenCL分庭抗力，由此足以见得微软对GPU通用计算的重视程度。

DirectCompute主要针对GPU计算，但由此可以衍生出一些在图形渲染方面的特殊应用，因此笔者将其单列一章，对一些重要技术进行详细介绍。

第二章/第一节 DirectCompute与Stream/CUDA/OpenCL的关系

提起GPU通用计算，自然会让人想到NVIDIA的CUDA、ATI的Stream以及开放式的OpenCL标准，再加上微软推出的DirectCompute，四种技术标准令人眼花缭乱，他们之间的竞争与从属关系也比较模糊。

首先我们来明确一下概念：

OpenCL类似于OpenGL，是由整个业界共同制定的开放式标准，能够对硬件底层直接进行操作，相对来说比较灵活，也很强大，但开发难度较高；
DirectCompute类似于DirectX，是由微软主导的通用计算API，与Windows集成并偏向于消费领域，在易用性和兼容性方面做得更出色一些；
CUDA和Stream更像是图形架构或并行计算架构，NVIDIA和ATI对自己的GPU架构自然最了解，因此会提供相应的驱动、开发包甚至是现成的应用程序，通过半开放的形式授权给程序员使用。

ATI Stream示意图

其中ATI最先提出GPGPU的概念，Folding@Home和AVIVO是当年的代表作，但在被AMD收购后GPGPU理念搁浅；此后NVIDIA后来者居上，首次将CUDA平台推向市场，在这方面投入了很大的精力，四处寻求合作伙伴的支持，并希望CUDA能够成为通用计算的标准开发平台。

NVIDIA CUDA示意图

在NVIDIA大力推广CUDA之初，由于OpenCL和DirectCompute标准尚未定型，NVIDIA不得不自己开发一套SDK来为程序员服务，这套基于C语言的开发平台为半开放式标准，只能用于NVIDIA自家GPU，因此并未得到业界的认可，AMD认为CUDA是封闭式标准，不会有多少前途，AMD自家的Stream虽然是完全开放的，但由于资源有限，对程序员帮助不大，因此未能得到大量使用。

OpenCL一经提出就受到业界的大力支持

于是在去年由苹果牵头，以苹果OpenCL草案为基础，联合业界各大企业共同完成了标准制定工作。随后Khronos Group成立相关工作组，工作组的26个成员来自各行各业，且都是各自领域的领导者，具体包括3DLABS、Activision Blizzard、AMD、苹果、ARM、Barco、博通、Codeplay、EA、爱立信、飞思卡尔、HI、IBM、Intel、Imagination、Kestrel Institute、摩托罗拉、Movidia、诺基亚、NVIDIA、QNX、RapidMind、三星、Seaweed、TAKUMI、德州仪器、瑞典于默奥大学。

OpenCL标准一经成立，IT三巨头Intel、NVIDIA和AMD都争先恐后的加入支持。AMD由于自家Stream推广不利、支持OpenCL并不意外；Intel即将发布的Larrbee GPU一大卖点就是强大的计算能力，支持OpenCL有百利而无一害；NVIDIA虽然在大力推广CUDA开发平台，但无奈势单力薄，小有所成但前途未卜，OpenCL虽然与CUDA C语言有交集但并不冲突，是相辅相成的互补关系，NVIDIA自然也大力支持。

OpenCL组织中唯独微软不在其列，微软有自己的如意算盘。经过多年的发展，DirectX凭借快速更新换代策略、相对轻松的开发与移植方式，在与OpenGL的交战中已全面占据上风，OpenGL的传统强项——专业绘图领域也在被DirectX不断的蚕食。因此微软打算用相同的策略来对抗尚未站住根基的OpenCL，于是DirectCompute诞生了。

就如同GPU能同时支持DirectX与OpenGL那样，NVIDIA和AMD对DirectCompute和OpenCL都提供了无差别支持，真正的GPU通用计算之战，不在CUDA与Stream之间，而是OpenCL与DirectCompute之争，DX11时代才刚刚开始……

0人已赞

第1页：DX10大势已去！首款DX11显卡HD5870发布第2页：DX10.0大革命：画面很完美、但速度很慢第3页：DX10.1小修补：片面追求画面行不通第4页：DX11时代来临：为高效率游戏而生第5页：DX11特性解读：Shader Model 5.0 第6页：DX11特性解读：多线程处理第7页：DX11特性解读：两种新的纹理压缩格式第8页：DirectCompute与Stream/CUDA/OpenCL的关系第9页：DirectCompute 10/11版本间的区别第10页：DirectCompute 11新特效：顺序无关透明化第11页：DirectCompute 11新特效：景深第12页：DirectCompute 11新特效：高清晰环境光遮蔽第13页：DX11重要技术：Tessellation前身今世解读第14页：2002年R200：Tessellation的鼻祖TruForm 第15页：2005年Xenos：Tessellation登陆XBOX360 第16页：2007年R600：孤掌难鸣的Tessellation 第17页：2009年RV870：纳入DX11修成正果第18页：DX11版Tessellation的改进第19页：DX11版Tessellation在游戏中的应用实例第20页：DX11游戏并不遥远：第4季度发布4款2 第21页：DX11游戏：《异形大战铁血战士》第22页：DX11游戏：《科林麦克雷：尘埃2》第23页：DX11游戏：RTS网游《BattleForge》第24页：DX11游戏引擎：《Frostbite Engine 2》第25页：DX11游戏引擎：《Cry Engine 3》第26页：RV870核心架构图及规格全对比第27页：RV870架构解析：竟然是单芯片“双核心”第28页：RV870架构解析：图形控制引擎第29页：RV870架构解析：流处理器规格特性第30页：RV870架构解析：纹理单元和缓存第31页：RV870架构解析：光栅单元和抗锯齿第32页：RV870架构解析：更高频更节能的第三代GDDR5 第33页：ATI Eyefinity三屏/六屏显示技术解析第34页：Matrox三屏环幕技术回顾第35页：ATI的惊人设计 RV870最多支持六屏输出第36页：灵活多变的三屏六屏输出方案一览第37页：三屏/六屏输出玩游戏震撼效果展示第38页：编辑实战HD5870三屏玩游戏实拍图第39页：HD5870三屏/六屏实际应用视频展示第40页：HD5870显卡赏析：AMD官方高清晰美图第41页：HD5870显卡实物：外观赏析第42页：HD5870显卡实物：最轻的高端卡第43页：HD5870显卡拆解：40nm核心与GDDR5显存第44页：HD5870显卡供电：数字式4+1+2相第45页：测试平台：Core i7 975 + X58最强配置第46页：DX9C理论性能测试：3DMark06 第47页：DX10理论性能测试：3DMark Vantage 第48页：DX10渲染性能测试：填充率和贴图第49页：DX10游戏：《孤岛危机：弹头》第50页：DX10游戏：《冲突世界：苏联进攻》第51页：DX10游戏：《生化危机5》第52页：DX10.1游戏：《汤姆克兰西之鹰击长空》第53页：DX10.1游戏：《潜行者：晴空》第54页：DX10.1游戏：《孤岛惊魂2》第55页：DX9C游戏：《街头霸王4》第56页：DX9C游戏：《极品飞车13：变速》第57页：DX9C物理游戏：《镜之边缘》第58页：OpenGL游戏：《敌占区：雷神战争》第59页：功耗测试：HD5870耗电最少性能最强第60页：测试成绩汇总：HD5870 PK GTX285 第61页：测试成绩汇总：HD5870 PK HD4870X2 第62页：测试成绩汇总：HD5870 PK GTX295 第63页：双卡战四核：HD5870 CF对决GTX295 SLI 第64页：编辑测试手记：相当完美的高端卡第65页：全文总结与展望：敢为人先勇于创新的ATI

开创DX11宏图霸业！镭HD5870权威评测

关注我们