泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

革命性DX11架构!GTX480/470权威评测

第五章 Fermi计算架构解析

第五章/第一节 Fermi计算架构解析:GPU并行计算的历史

    自从NVIDIA于1999年发布第一颗GPU(GeForce 256)开始,GPU就已经与并行计算结下了不解之缘,GPU被扩展成为可进行浮点运算的可编程处理器,而不仅仅是图形处理器。GPU无论计算能力还是内存带宽都要远胜于CPU,其性能不应该被限制在游戏和3D渲染之中。

开创视觉计算帝国GTX280/260权威评测

GPU的性能远远超出了CPU的想想

    针对非图形应用程序的GPU编程的探索始于2003年。通过使用高级绘制语言如DirectX、OpenGL和Cg,将多种数据平行算法导入GPU。诸如蛋白质折叠、股票期权定价、SQL查询及MRI重建等问题都能通过GPU获得非凡的加速表现。早期将图形API用于通用计算的努力被称之为GPGPU(GPU通用计算)。

    虽然GPGPU模型展现了不俗的加速性能,但仍然有不少缺陷:

    首先,它要求程序员全面掌握与图形API以及GPU架构相关的知识;
    其次,问题必须以顶点坐标、纹理及着色器程序的形式表达出来,这就大大增加了程序的复杂程度;
    第三,不支持基础的编程特性如面向内存的随机读写,极大地限制了编程模型;
    最后,缺乏双精度支持(直到最近才具备这一特性)意味着有些科学应用程序将不能在GPU上运行。

    为了解决这些问题,NVIDIA采用了两种关键技术——G80统一图形及计算架构和CUDA。CUDA是一种软硬件架构,可以使用多种高级编程语言来针对GPU进行编程。这两种技术代表着一种新的应用GPU的方式。跟以前通过编程将专门的图形单元同图形API结合到一起不同,程序员可以利用CUDA的扩展来编写C语言程序,并面向一个通用的平行处理器。NVIDIA将这种新的GPU编程方式称为“GPU计算”,它意味着更广泛的应用程序支持、更多编程语言的支持以及同早期GPGPU编程模型的彻底分离。

    G80标量流处理器架构的诞生使得全新的GPU计算成为可能,并创造了无数项第一:

    第一款支持C语言的GPU,它让程序员可以利用GPU的运算能力而无需掌握一门新的编程语言;
    第一款以单一的非统一的处理器取代分离式顶点及像素管线的GPU,这种处理器可以执行顶点、几何、像素及计算程序;
    第一款利用标量线程处理器的GPU,从而使得程序员无需手工操控向量寄存器。

    G80还采用了单指令、多线程(SIMT)的执行模型,多个独立线程同时执行单个指令,并针对线程间通信采用了共用存储器和障栅同步。

    之后NVIDIA又对G80架构进行了重大改进,第二代统一架构GT200将流处理器的数量从128增加到了240个。每一个处理器的寄存器数量增倍,使得任何时候都可以在芯片上处理更多的线程。采用了硬件存储器存取合并技术以提高存储器存取的效率。此外,还采用了双精度浮点运算支持以满足那些科学及高性能计算(HPC)应用程序的需求。

    在设计每款新一代GPU时,都必须遵循这样的原则——提高当前应用程序的性能及GPU的可编程性。应用程序的速度提高会立竿见影地带来诸多好处。正是GPU在可编程性方面的不断进步才使得它演变成为当前最通用的并行处理器。也正是基于这样的理念,GT200架构的继任者又被赋予了更多新的功能。

0人已赞
第1页:千呼万唤始出来 GTX480/470终于降临第2页:DX10.0大革命:画面很完美、但速度很慢第3页:DX10.1小修补:片面追求画面行不通第4页:DX11时代来临:为高效率游戏而生第5页:DX11特性解读:Shader Model 5.0第6页:DX11特性解读:多线程处理第7页:DX11特性解读:两种新的纹理压缩格式第8页:Tessellation:ATI原创技术但孤掌难鸣第9页:Tessellation:细分曲面的原理第10页:Tessellation:DX11中的改进第11页:Tessellation的妙用:虚假贴图终结者第12页:Tessellation的妙用:随风飘扬的旗帜第13页:Tessellation的妙用:波澜壮阔的水面第14页:Tessellation的妙用:不可思议的长发第15页:DirectCompute与Stream/CUDA/OpenCL第16页:DirectCompute 10/11版本间的区别第17页:DirectCompute11的妙用:顺序无关透明第18页:DirectCompute11的妙用:电影级景深第19页:DirectCompute11的妙用:高清晰环境光第20页:GF100图形架构:绝非新品装旧酒第21页:GF100图形架构:芯片图与架构图第22页:GF100图形架构:居然是四核心GPU第23页:GF100图形架构:强大的多形体引擎第24页:GF100图形架构:第三代流处理器第25页:GF100图形架构:纹理单元不升反降?第26页:GF100图形架构:一级缓存与二级缓存第27页:GF100图形架构:光栅单元与高倍抗锯齿第28页:Fermi计算架构:GPU并行计算历史第29页:Fermi计算架构:完全按照客户需求设计第30页:Fermi计算架构:恐怖的双精度性能第31页:Fermi计算架构:首次支持C++编程第32页:Fermi计算架构:首次支持显存ECC第33页:Fermi计算架构:NVIDIA Nexus开发平台第34页:附加功能增强:PhysX物理加速第35页:增强附加功能:3D立体3屏技术第36页:增强附加功能:光线追踪第37页:GTX400实物对比:造型一点都不夸张第38页:GTX480实物:官方艺术照赏析第39页:GTX470实物:官方艺术照赏析第40页:GTX480实物:外观和散热器实拍图第41页:GTX480实物:全裸拆解与显存解析第42页:GTX480实物:供电模块全解析第43页:GTX470实物:外观与散热器赏析第44页:GTX470实物:全裸拆解与供电解析第45页:首批上市显卡:七彩虹GTX470第46页:Demo解析:8800/GTX200 Demo回顾第47页:Demo解析:Supersonic Sled寓教于乐第48页:Demo解析:Supersonic Sled物理效果第49页:Demo解析:RagingRapidsRide第50页:Demo解析:Island11震撼的水面第51页:Demo解析:Hair不可思议的长发第52页:Demo解析:Design Garage实时光线追踪第53页:测试平台:Core i7 975 + X58豪华配置第54页:DX10理论测试:《3DMark Vantage》第55页:DX11理论测试:《Heaven Benchmark》第56页:DX11游戏:《BattleForge》第57页:DX11游戏:《STALKER:COP》第58页:DX11游戏:《尘埃2》第59页:DX11游戏:《异形大战铁血战士》第60页:DX11游戏:《战地:叛逆联队2》第61页:DX11游戏:《地铁2033》第62页:DX10.1游戏:《孤岛惊魂2》第63页:DX10.1游戏:《鹰击长空》第64页:DX10游戏:《孤岛危机:弹头》第65页:DX9C游戏:《使命召唤:现代战争2》第66页:PhysX游戏:《蝙蝠侠》第67页:微软DX11 SDK:SUBD11第68页:微软DX11 SDK:PN Triangles第69页:NVIDIA Demo:Island11第70页:NVIDIA Demo:Hair第71页:视频转码测试:Badaboom第72页:科学计算测试:Folding Home第73页:温度测试:风扇温控90度开始加速第74页:功耗测试:先准备600W电源吧第75页:测试成绩汇总:GTX480比GTX470强多少第76页:测试成绩汇总:GTX480 PK HD5870第77页:测试成绩汇总:GTX470 PK HD5850第78页:GTX480双卡SLI效率测试第79页:全文总结与展望:DX11争霸赛才刚开始第80页:首批上市GTX480/470显卡及有奖互动

关注我们

泡泡网

手机扫码关注