安逸or进取？从显卡进行探窥企业之道-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 新闻 / 正文

安逸or进取？从显卡进行探窥企业之道

2011年05月09日 01:49作者：李晓晟编辑：李晓晟文章出处：泡泡网原创

掐指算来，DX10引发的图形技术革命已经过去了5个年头，当年风光无限的G80与R600的子孙们已经繁衍到了DX11时代，然后骨子里还是流淌着从祖辈延续下来的基因，或进取或安逸。

G80和R600只是图形核心的设计代号，而我们更熟悉的名字也许是GeForce 8800GTX和Radeon HD2900XT。两者作为各自公司的第一代DX10级别产品，有着许多共同之处，也同样拥有着许多不同。共同之处在于它们都尊续了DX10的API规范，提供了对DX10特效的完整支持；而且都引入了被称为Unified Shader的统一渲染架构；另外就是它们自身的架构设计，都极大的影响到了后世的更新产品，让自己的一些特性成为了家族脸谱。不同之处在于，NVIDIA将G80定义为全面革新的一个新开始，完全脱离了传统的图形核心设计概念，采用了MIMD的高效架构，而AMD在希望延续R580开始获得好评的架构命脉，R600更像是一个适当修正并扩展运算单元的超级版R580；NVIDIA采用了效率更高，但设计较为复杂的CrossBar内存总线，和传统的GDDR3显存，而AMD在R600上才用了具备极高理论带宽但设计较为简单的RingBus内存总线和GDDR4显存。

从这张G80与G71的架构对比图上我们不难看出，G80的架构几乎完全推翻了上一代的设计，可见NVIDIA锐意革新的姿态。其中最为重要的变化就是MIMD结构的流处理单元（Stream Processer）和GigaThread中央控制模块。MIMD（Multiple Instruction Stream Multiple DataStream）全称为多指令流多数据流，这种架构具备的最大优势就是拥有极强的指令适应能力，天然获得超高的执行效率。

传统的图形运算中，无论是色彩信息还是位置信息，都包含至少3到4组甚至5组变量，我们习惯称之为3D、4D、5D指令，理论上说，运算单元一次性处理3D、4D或者5D指令将会获得非常好的表现。但G80的架构确是1D的，这似乎有悖常理，但如果认真分析G80将要面对的运算环境，即针对DX10图形运算环境，我们就发现这样的设计实际上是最符合需求的。其原因是DX10（实际上从DX9时代就开始了这种趋势）运算中，大量增强图形效果的运算都是以不规则的指令执行，其中包括大量的1D和2D指令，或者其它搭配的指令组合，这时候硬件架构中除了1D结构的运算单元可以让运算核心保持满档的运算排期外，其它的任何矢量结构都不会出现运算资源闲置的问题，只不过是多还是少而已。G80将任意的指令组合拆分为1D指令，在GigaThread的强大分配机能下，让整个图形核心保持满负荷运算状态，从而获得了极大的性能优势。

这里，我们也又引入了GigaThread概念。如果说SP单元是工人，那GT就是工头，它负责将任务分解成成百上千个细小的动作，并安排给几百个SP去运算获得结果，GT负责侦测每个SP的负载状况，让运算更加平衡有序。对于你我而言，碰到这样的领导可能会有怨言，但如果它出现在你的显卡中，你应该觉得庆幸才是。此外，GT还有一个强大的优势，就是通过强大的线程调度，掩盖延迟。虽然现代显卡都拥有庞大的板载显存系统，但游戏对于存储空间的需求永不满足，会不断的向速度更慢的系统内存甚至硬盘读取数据，而显存带宽和系统存储系统带宽之间几近数量级的差异，使得在读取数据时必然导致大量运算单元处于代工状态。而GT通过侦测SP的状态，将Threading的各种控制现况冻结并保存在Register file里，然后立刻将另外的新Threading提交给这个SP执行，直到数据读取完成为止，从而保证了整个流水线的效率不受系统存储系统延迟的影响。上图则对比了拥有GigaThread的G80和没有同类模块的G71在处理过程中的不同表现，和好的说明了GT对于G80的重要性和革新性。

我们再来看看AMD的R600架构。以上是R580与R600的架构对比图，从图本身的布局上似乎差异很大，但如果稍微研究下各部分的链接方式和作用，实际上这两个架构的差异很小。AMD之所以这么做，其原因在于R580的架构在最后的DX9C产品对抗中表现出来优异的性能，而且获得多方认可，R600在这个曾经成功的架构上修改支持DX10是最简单现实的方法。其中最重要的改变就是将Pixel Shader和Vertex Shader变革成了Unified Shader，但其它的变化就乏善可陈了。

R600拥有令人恐怖的320个流处理器，但实际上是由64组5D运算单元构成，也就是我们说的SIMD（Single Instruction Multiple Data）单指令多数据流。这样的结构设计，前面已经讲过，虽然拥有很高的理论运算效能，但效率不容乐观，当然AMD也有对策，就是通过驱动层面对指令重新编译以适应硬件架构。但历史告诉我们，面对硬件架构的巨大落差，以及自身软件层面的不给力，甚至512bit的GDDR4显存系统也因为RingBus的低效率而未能表现出任何优势，这一切R600惨败在了G80面前。

回到从产品看企业之道的话题，G80的架构设计是在分析了未来应用趋势的前提下的全新突破，虽然承担了巨大的风险，但结果是全新的架构带来了巨大的性能提升和未来升级的潜力。G80的巨大变革凸显出了NVIDIA的一贯企业性格，从与3D巨人3DFX的对抗中一直延续下来的自我超越。AMD同样是一家优秀的公司，但在R600上的表现上，我们看到了更多的安逸性格，躺在功劳簿上是吃不出老本的，因为IT行业的变化太大太快了。

0人已赞

第1页：从显卡看探窥企业之道第2页：锐意革新的G80 VS 成功翻版的R600 第3页：NVIDIA这次祭出了GT200架构第4页：图形的变革大幕再次拉开

安逸or进取？从显卡进行探窥企业之道

关注我们