泡泡网显卡频道 PCPOP首页      /      显卡     /      新闻    /    正文

安逸or进取?从显卡进行探窥企业之道

    掐指算来,DX10引发的图形技术革命已经过去了5个年头,当年风光无限的G80与R600的子孙们已经繁衍到了DX11时代,然后骨子里还是流淌着从祖辈延续下来的基因,或进取或安逸。

安逸or进取?从显卡看探窥企业之道

    G80和R600只是图形核心的设计代号,而我们更熟悉的名字也许是GeForce 8800GTX和Radeon HD2900XT。两者作为各自公司的第一代DX10级别产品,有着许多共同之处,也同样拥有着许多不同。共同之处在于它们都尊续了DX10的API规范,提供了对DX10特效的完整支持;而且都引入了被称为Unified Shader的统一渲染架构;另外就是它们自身的架构设计,都极大的影响到了后世的更新产品,让自己的一些特性成为了家族脸谱。不同之处在于,NVIDIA将G80定义为全面革新的一个新开始,完全脱离了传统的图形核心设计概念,采用了MIMD的高效架构,而AMD在希望延续R580开始获得好评的架构命脉,R600更像是一个适当修正并扩展运算单元的超级版R580;NVIDIA采用了效率更高,但设计较为复杂的CrossBar内存总线,和传统的GDDR3显存,而AMD在R600上才用了具备极高理论带宽但设计较为简单的RingBus内存总线和GDDR4显存。

安逸or进取?从显卡看探窥企业之道

    从这张G80与G71的架构对比图上我们不难看出,G80的架构几乎完全推翻了上一代的设计,可见NVIDIA锐意革新的姿态。其中最为重要的变化就是MIMD结构的流处理单元(Stream Processer)和GigaThread中央控制模块。MIMD(Multiple Instruction Stream Multiple DataStream)全称为多指令流多数据流,这种架构具备的最大优势就是拥有极强的指令适应能力,天然获得超高的执行效率。

安逸or进取?从显卡看探窥企业之道

    传统的图形运算中,无论是色彩信息还是位置信息,都包含至少3到4组甚至5组变量,我们习惯称之为3D、4D、5D指令,理论上说,运算单元一次性处理3D、4D或者5D指令将会获得非常好的表现。但G80的架构确是1D的,这似乎有悖常理,但如果认真分析G80将要面对的运算环境,即针对DX10图形运算环境,我们就发现这样的设计实际上是最符合需求的。其原因是DX10(实际上从DX9时代就开始了这种趋势)运算中,大量增强图形效果的运算都是以不规则的指令执行,其中包括大量的1D和2D指令,或者其它搭配的指令组合,这时候硬件架构中除了1D结构的运算单元可以让运算核心保持满档的运算排期外,其它的任何矢量结构都不会出现运算资源闲置的问题,只不过是多还是少而已。G80将任意的指令组合拆分为1D指令,在GigaThread的强大分配机能下,让整个图形核心保持满负荷运算状态,从而获得了极大的性能优势。

安逸or进取?从显卡看探窥企业之道

    这里,我们也又引入了GigaThread概念。如果说SP单元是工人,那GT就是工头,它负责将任务分解成成百上千个细小的动作,并安排给几百个SP去运算获得结果,GT负责侦测每个SP的负载状况,让运算更加平衡有序。对于你我而言,碰到这样的领导可能会有怨言,但如果它出现在你的显卡中,你应该觉得庆幸才是。此外,GT还有一个强大的优势,就是通过强大的线程调度,掩盖延迟。虽然现代显卡都拥有庞大的板载显存系统,但游戏对于存储空间的需求永不满足,会不断的向速度更慢的系统内存甚至硬盘读取数据,而显存带宽和系统存储系统带宽之间几近数量级的差异,使得在读取数据时必然导致大量运算单元处于代工状态。而GT通过侦测SP的状态,将Threading的各种控制现况冻结并保存在Register file里,然后立刻将另外的新Threading提交给这个SP执行,直到数据读取完成为止,从而保证了整个流水线的效率不受系统存储系统延迟的影响。上图则对比了拥有GigaThread的G80和没有同类模块的G71在处理过程中的不同表现,和好的说明了GT对于G80的重要性和革新性。

安逸or进取?从显卡看探窥企业之道

    我们再来看看AMD的R600架构。以上是R580与R600的架构对比图,从图本身的布局上似乎差异很大,但如果稍微研究下各部分的链接方式和作用,实际上这两个架构的差异很小。AMD之所以这么做,其原因在于R580的架构在最后的DX9C产品对抗中表现出来优异的性能,而且获得多方认可,R600在这个曾经成功的架构上修改支持DX10是最简单现实的方法。其中最重要的改变就是将Pixel Shader和Vertex Shader变革成了Unified Shader,但其它的变化就乏善可陈了。

安逸or进取?从显卡看探窥企业之道

    R600拥有令人恐怖的320个流处理器,但实际上是由64组5D运算单元构成,也就是我们说的SIMD(Single Instruction Multiple Data)单指令多数据流。这样的结构设计,前面已经讲过,虽然拥有很高的理论运算效能,但效率不容乐观,当然AMD也有对策,就是通过驱动层面对指令重新编译以适应硬件架构。但历史告诉我们,面对硬件架构的巨大落差,以及自身软件层面的不给力,甚至512bit的GDDR4显存系统也因为RingBus的低效率而未能表现出任何优势,这一切R600惨败在了G80面前。

    回到从产品看企业之道的话题,G80的架构设计是在分析了未来应用趋势的前提下的全新突破,虽然承担了巨大的风险,但结果是全新的架构带来了巨大的性能提升和未来升级的潜力。G80的巨大变革凸显出了NVIDIA的一贯企业性格,从与3D巨人3DFX的对抗中一直延续下来的自我超越。AMD同样是一家优秀的公司,但在R600上的表现上,我们看到了更多的安逸性格,躺在功劳簿上是吃不出老本的,因为IT行业的变化太大太快了。

0人已赞

关注我们

泡泡网

手机扫码关注