泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

成就3D图形霸业!NVIDIA历代显卡回顾


    2006年无疑是NVIDIA的历史中非常成功的一年,凭借90nm GeForce 7系列产品的优异表现,NVIDIA在桌面独立核心的占有率(Q3)达到57%,尤其是在移动独立图形核心方面达到了53%的占有率,这对NVIDIA无疑是具有历史意义的,因为在移动独立图形核心一直是ATI最据优势的领域,是ATI多年来唯一没有失守的部分。而且和桌面独立核心市场已经出现萎缩的情况相反,移动核心的市场却大幅度增长。NVIDIA在移动平台的出色表现,也说明90nm G7X核心的功耗、发热控制的非常出色。
 
    2006年NVIDIA总收入为30.7亿美元,创公司年度营收新高,比上一年度的23.8亿美元,增长高达29%。其中净利润为4.488亿美元,也比上一年度的3.012亿美元增长幅度接近50%。
 
{imageTitle}

    面对非常有利的局面,NVIDIA还是保持了非常清醒的头脑,在产品研发上也没有丝毫懈怠。并于2006年11月09日发布了全新一代的GeForce 8800GTX显卡,将PC显示核心正式引入DirectX 10时代。
 
DX10提前降临!8800领先ATI长达半年

为王位而生 GeForce8800全面解析测试

    GeForce 8800GTX带来的不仅仅是令人惊叹的效能,更在于它所采用的统一渲染架构以及DirectX 10支持,同时强大的通用计算性能使其超强的物理加速能力,可以给三维游戏带来最真实的画面、互动效果。所以NVIDIA也把GeForce 8定调为“真实重新定义”的主题。

{imageTitle}   {imageTitle}
 
  GeForce 8800GTX

    GeForce 8800GTX的核心研发代号为G80,是PC平台上首颗采用统一渲染架构的GPU,同时也是首款支持DirectX 10、Shader Mode 4.0的GPU,极具历史意义。G80图形核心基于TSMC的90nm工艺生产,核心集成集
成6.8亿个晶体管,核心频率为575MHz,其中Unified Shader的运行频率为1350MHz。
 
    虽然80纳米工艺在已经被引入实际生产,但是对于晶体管数量庞大G80来说,台积电80纳米工艺还无法提供必需的良品率。而且新工艺生产的核心工作频率不总是比旧的高,像130纳米的R480和110纳米的R430就是一个很好的例子,所以采用90纳米工艺无疑更保险。
 
{imageTitle}

 
    在架构方面,G80的统一渲染架构中Vertex Shader(顶点)和Pixel Shader(像素)的区别已经不复存在,取而代之的是8组并行的阵列,每组阵列中有16个Stream Processor(流处理器)和8个Texture Filtering Unit(纹理单元),这样G80总共拥有128个流处理器和64个纹理单元。
 
    G80的统一渲染架构基于庞大规模的流处理器(Stream processor)来动态分配给各种操作。可以让每个处理单元都参与运算,每个流处理器均能够处理顶点、像素和几何操作,从而达到提高GPU的利用效率。
 
{imageTitle}
 
Streaming Processors

    过去,自从NV40以后,GPU核心中Shader单元中的每个ALU都有能力单周期完成一个3D+1D(也就是3D矢量+1D标量指令,它们如果并行,被称做co-issue)或者2D+2D总共4D这样的指令操作。而G80核心中,采用了采用完全的标量化设计,将3D+1D或者2D+2D这样执行能力为4D的“大”ALU拆分为1D的“小”ALU,然后将这些ALU组成8个阵列(TCP),每个TCP拥有16个ALU,它们被称做1D Scalar Streaming Processors。每个1D ALU都有各自的指令发射端口和控制资源,相对于4D ALU的浪费现象被杜绝,可以保证100%的执行效率。通过独特的内部分频技术,这些流处理器以超过时钟频率2倍多的频率(1.35GHz)运行,所以GeForce 8800 GTX的128个标量流处理器性能和64个4D SIMD的性能差距不是很大。当然也必须看到,在3D图形的着色程序中,3D+1D操作使用的更为广泛,所以传统“3D+1D”设计有一定的优势。但是,1D ALU的设计分配更加灵活、效率更高,更适合通用计算领域的应用。
 
为王位而生 GeForce8800全面解析测试
 
G80的核心架构
 
    G80图形核心引入了Thread Control Unit单元,负责整个流水线的仲裁和控制,最大可以支持4096个1D 线程,比R520的(Ultra-Threading Dispatch Processor)512个4D 线程要大的多。G80在进行分支处理时的Batch Size(可以理解为分支工作的区域)为4x4x2,虽然不是很小,但与对Batch Size大小更为依赖传统SIMD架构来说相比,G80仍然具较更高的动态分支能性能。
 
{imageTitle}
 
Thread Control Unit

    由于 SM4.0中提供了全新纹理阵列(Texture arrays)的支持,NVIDIA继续保持了2:1的比例,纹理单元数目也提高到了空前的64个。
 
{imageTitle}

    ROP方面,G80拥有6组ROP(Raster Operation Partitions),比G71多了2组,既有24个ROPs单元,每组连接64bit显存控制器,这样G80就总共拥有规模空前的384bit的显存位宽,能够支持GDDR1、GDDR2、GDDR3和GDDR4显存。

    由于在G80身上GPU架构发生较大的变化,因此NVIDIA放弃了传统的CineFX命名,将其架构命名为Lumenex Engine(流明引擎),这里也简单介绍下流明引擎的新特性:
 
1. Coverage Sampling Anti-Aliasing (CSAA),引入多种全新抗锯齿模式:8xAA、16xAA和16xQ AA,单颗GPU就能实现高达16倍抗锯齿;
 
2. Lumenex Texture Filtering Engine,流明纹理过滤引擎,各项异性过滤图像质量大幅提高;
 
3. 支持128bit HDR,配合CSAA完美实现高倍HDR+AA;
 
4. 10bit Display Pipeline,64倍于上代产品的输出颜色数;
 
5. Quantum Effects,GPU物理加速技术。
 
 产品简介 :
 
{imageTitle}
 
 GeForce 8800系列规格对比
 
    GeForce 8800GTX作为新一代的旗舰产品,拥有拥有迄今为止最强大的硬件规格、最强悍的3D渲染效能。
 
{imageTitle}   {imageTitle}
 
GeForce 8800GTX

    由于GeForce 8800GTX的最高功耗为145瓦,整卡的长度达到32厘米,都是历史上PC显卡的最高纪录,显卡被一块体积硕大的散热器所覆盖,不过风扇噪音控制的比较好,即便在全速运行状态下也是非常安静。同时显卡上集成了两个6Pin接口,比单个接头+12V的电流输入的方式更加安全。显卡上也集成了两个SLI金手指,可以组建更为强大的GeForce 8800GTX SLI双卡互连。
 
   GeForce 8800GTX配备了PC显卡上最高的768MB GDDR3显存,显存为384bit位宽,频率为900MHz带宽更达到空前的86GB/s。
 
    GeForce 8800GTX零售价为599美元,非常具有竞争力,于2006年11月8日正式发布迄今已出货40万块,不仅叫好而且叫座。
 
{imageTitle}   {imageTitle}
 
GeForce 8800GTS

    GeForce 8800GTS是GeForce 8800GTX的简化版,也是GeForce 8800系列的普及版,默认频率500/1600MHz ,Stream Processor精简了2组,从128个减至96个,另外ROP单元减少了1组共4个,纹理单元为48个,显存减少了320MB 320Bit的规格。相对上一代优异显卡来说,这样的规格仍然十分强大。
 
    8800GTS采用10颗8M×32Bit的显存就组成了320MB 320Bit的规格,显存的速度为1.2ns,默认显存频率为1600MHz。
 
    8800GTS散热器和8800GTX的结构完全相同,体积上要比GTX小一号,不过8800GTX的频率有所下降、部分管线也被屏蔽,所以功耗和发热都小得多。同时,8800GTS由于功耗的降低,只提供了一个6Pin接口供电,另外,显卡上的SLI接口也只保留了一个。
 
    Geforce 8800GTS 320MB的售价为299美元,非常具有竞争力,国内目前甚至已经打出了1999元的超值价格,比ATI的X1950XTX价格便宜很多,但性能却反而高出不少,所以Geforce 8800GTS 320MB无疑是目前性价比高的准高端显卡。
2人已赞

关注我们

泡泡网

手机扫码关注