成就3D图形霸业!NVIDIA历代显卡回顾
分享
2006年无疑是NVIDIA的历史中非常成功的一年,凭借90nm GeForce 7系列产品的优异表现,NVIDIA在桌面独立核心的占有率(Q3)达到57%,尤其是在移动独立图形核心方面达到了53%的占有率,这对NVIDIA无疑是具有历史意义的,因为在移动独立图形核心一直是ATI最据优势的领域,是ATI多年来唯一没有失守的部分。而且和桌面独立核心市场已经出现萎缩的情况相反,移动核心的市场却大幅度增长。NVIDIA在移动平台的出色表现,也说明90nm G7X核心的功耗、发热控制的非常出色。
2006年NVIDIA总收入为30.7亿美元,创公司年度营收新高,比上一年度的23.8亿美元,增长高达29%。其中净利润为4.488亿美元,也比上一年度的3.012亿美元增长幅度接近50%。
面对非常有利的局面,NVIDIA还是保持了非常清醒的头脑,在产品研发上也没有丝毫懈怠。并于2006年11月09日发布了全新一代的GeForce 8800GTX显卡,将PC显示核心正式引入DirectX 10时代。
● DX10提前降临!8800领先ATI长达半年
GeForce 8800GTX带来的不仅仅是令人惊叹的效能,更在于它所采用的统一渲染架构以及DirectX 10支持,同时强大的通用计算性能使其超强的物理加速能力,可以给三维游戏带来最真实的画面、互动效果。所以NVIDIA也把GeForce 8定调为“真实重新定义”的主题。
GeForce 8800GTX
GeForce 8800GTX的核心研发代号为G80,是PC平台上首颗采用统一渲染架构的GPU,同时也是首款支持DirectX 10、Shader Mode 4.0的GPU,极具历史意义。G80图形核心基于TSMC的90nm工艺生产,核心集成集
成6.8亿个晶体管,核心频率为575MHz,其中Unified Shader的运行频率为1350MHz。
虽然80纳米工艺在已经被引入实际生产,但是对于晶体管数量庞大G80来说,台积电80纳米工艺还无法提供必需的良品率。而且新工艺生产的核心工作频率不总是比旧的高,像130纳米的R480和110纳米的R430就是一个很好的例子,所以采用90纳米工艺无疑更保险。
在架构方面,G80的统一渲染架构中Vertex Shader(顶点)和Pixel Shader(像素)的区别已经不复存在,取而代之的是8组并行的阵列,每组阵列中有16个Stream Processor(流处理器)和8个Texture Filtering Unit(纹理单元),这样G80总共拥有128个流处理器和64个纹理单元。
G80的统一渲染架构基于庞大规模的流处理器(Stream processor)来动态分配给各种操作。可以让每个处理单元都参与运算,每个流处理器均能够处理顶点、像素和几何操作,从而达到提高GPU的利用效率。
Streaming Processors
过去,自从NV40以后,GPU核心中Shader单元中的每个ALU都有能力单周期完成一个3D+1D(也就是3D矢量+1D标量指令,它们如果并行,被称做co-issue)或者2D+2D总共4D这样的指令操作。而G80核心中,采用了采用完全的标量化设计,将3D+1D或者2D+2D这样执行能力为4D的“大”ALU拆分为1D的“小”ALU,然后将这些ALU组成8个阵列(TCP),每个TCP拥有16个ALU,它们被称做1D Scalar Streaming Processors。每个1D ALU都有各自的指令发射端口和控制资源,相对于4D ALU的浪费现象被杜绝,可以保证100%的执行效率。通过独特的内部分频技术,这些流处理器以超过时钟频率2倍多的频率(1.35GHz)运行,所以GeForce 8800 GTX的128个标量流处理器性能和64个4D SIMD的性能差距不是很大。当然也必须看到,在3D图形的着色程序中,3D+1D操作使用的更为广泛,所以传统“3D+1D”设计有一定的优势。但是,1D ALU的设计分配更加灵活、效率更高,更适合通用计算领域的应用。
G80的核心架构
G80图形核心引入了Thread Control Unit单元,负责整个流水线的仲裁和控制,最大可以支持4096个1D 线程,比R520的(Ultra-Threading Dispatch Processor)512个4D 线程要大的多。G80在进行分支处理时的Batch Size(可以理解为分支工作的区域)为4x4x2,虽然不是很小,但与对Batch Size大小更为依赖传统SIMD架构来说相比,G80仍然具较更高的动态分支能性能。
Thread Control Unit
由于 SM4.0中提供了全新纹理阵列(Texture arrays)的支持,NVIDIA继续保持了2:1的比例,纹理单元数目也提高到了空前的64个。
ROP方面,G80拥有6组ROP(Raster Operation Partitions),比G71多了2组,既有24个ROPs单元,每组连接64bit显存控制器,这样G80就总共拥有规模空前的384bit的显存位宽,能够支持GDDR1、GDDR2、GDDR3和GDDR4显存。
由于在G80身上GPU架构发生较大的变化,因此NVIDIA放弃了传统的CineFX命名,将其架构命名为Lumenex Engine(流明引擎),这里也简单介绍下流明引擎的新特性:
1. Coverage Sampling Anti-Aliasing (CSAA),引入多种全新抗锯齿模式:8xAA、16xAA和16xQ AA,单颗GPU就能实现高达16倍抗锯齿;
2. Lumenex Texture Filtering Engine,流明纹理过滤引擎,各项异性过滤图像质量大幅提高;
3. 支持128bit HDR,配合CSAA完美实现高倍HDR+AA;
4. 10bit Display Pipeline,64倍于上代产品的输出颜色数;
5. Quantum Effects,GPU物理加速技术。
● 产品简介 :
GeForce 8800系列规格对比
GeForce 8800GTX作为新一代的旗舰产品,拥有拥有迄今为止最强大的硬件规格、最强悍的3D渲染效能。
GeForce 8800GTX
由于GeForce 8800GTX的最高功耗为145瓦,整卡的长度达到32厘米,都是历史上PC显卡的最高纪录,显卡被一块体积硕大的散热器所覆盖,不过风扇噪音控制的比较好,即便在全速运行状态下也是非常安静。同时显卡上集成了两个6Pin接口,比单个接头+12V的电流输入的方式更加安全。显卡上也集成了两个SLI金手指,可以组建更为强大的GeForce 8800GTX SLI双卡互连。
GeForce 8800GTX配备了PC显卡上最高的768MB GDDR3显存,显存为384bit位宽,频率为900MHz带宽更达到空前的86GB/s。
GeForce 8800GTX零售价为599美元,非常具有竞争力,于2006年11月8日正式发布迄今已出货40万块,不仅叫好而且叫座。
GeForce 8800GTS
GeForce 8800GTS是GeForce 8800GTX的简化版,也是GeForce 8800系列的普及版,默认频率500/1600MHz ,Stream Processor精简了2组,从128个减至96个,另外ROP单元减少了1组共4个,纹理单元为48个,显存减少了320MB 320Bit的规格。相对上一代优异显卡来说,这样的规格仍然十分强大。
8800GTS采用10颗8M×32Bit的显存就组成了320MB 320Bit的规格,显存的速度为1.2ns,默认显存频率为1600MHz。
8800GTS散热器和8800GTX的结构完全相同,体积上要比GTX小一号,不过8800GTX的频率有所下降、部分管线也被屏蔽,所以功耗和发热都小得多。同时,8800GTS由于功耗的降低,只提供了一个6Pin接口供电,另外,显卡上的SLI接口也只保留了一个。
Geforce 8800GTS 320MB的售价为299美元,非常具有竞争力,国内目前甚至已经打出了1999元的超值价格,比ATI的X1950XTX价格便宜很多,但性能却反而高出不少,所以Geforce 8800GTS 320MB无疑是目前性价比高的准高端显卡。
2人已赞
第1页:3D加速时代,NVIDIA称雄第2页:NVIDIA首款产品——声显卡NV1第3页:Windows横空出世,NVIDIA走向正途第4页:雷管引爆TNT——TNT、TNT2打败3DFX第5页:GeForce横空出世,GPU时代来临第6页:GeForce 2代,您知道GTS的含义吗第7页:高端低端泾渭分明,GeForce 2 Ti/MX诞生第8页:两强相争,DX8时代的较量第9页:打垮8500!GeForce 4诞生第10页:不能磨灭的经典,GeForce 4 MX系列第11页:最失败的作品——GeForce FX系列第12页:最失败的作品——GeForce FX系列第13页:FX5900系列诞生第14页:FX时代的经典产品也不少第15页:GeForce 6系列问世,NVIDIA一雪前耻!第16页:6800经典产品介绍第17页:又是一代经典——GeForce 6600第18页:6600 6200第19页:GeForce 7大举攻占市场份额第20页:90nm来临,新GF7系列演绎性价比第21页:DX9末期的决战,7950GX2第22页:什么决定显卡的发展?未来游戏特点介绍第23页:DX10来了,领先对手半年,G80充分满足未来游戏需要第24页:总结与展望