泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

NV最给力显卡!27款非公版GTX460横评

    GTX460是NVIDIA目前位置最出色的一款DX11显卡,其老大哥GTX480/470都要逊色三分,主要原因就是GTX460在性能、功耗、发热、成本等各方面都做得非常均衡,这些都源于NVIDIA对于GF104核心的精心优化设计。

从GF100(GTX480)到GF104(GTX460):尽最大努力加强规格

    按理说,NVIDIA也应该会把GF100核心的主要规格全部减半,从而制造出一颗拥有256SP 256Bit的主流核心。事实上之前国内外的媒体都是这样猜测的,因为GF100模块化四核心的设计,很容易将其“拆分为”规模大小不一的中低端核心:

DX11性价比之王!GTX460

    如上图所示,GF100为四核心设计,将它变为1/2、1/4就能轻而易举的获得中端和低端GPU,但NVIDIA却没有这样做,最终GF104核心的规模出乎所有人的预料!

    乍一看,GF104就是GF100被一刀切成两半的规模,但请大家仔细看看到底有何不同?这里提醒大家一下:完整的GF100核心拥有512个CUDA核心,完整的GF104核心拥有384个CUDA核心,显然GF104核心并非是GF100一半的规格,NVIDIA在微观架构方面做了不小的改动,那NVIDIA为什么要这样做呢?

● GF104核心的改进:CUDA增50%纹理增100%

    相信细心的读者已经看出来了,GF104相比GF100,最主要改变就是GPC(图形处理器集群)从4个减至2个,显存控制器从6个64bit(共384bit)减至4个64bit(共256bit),而最最重要的改变就是——每组SM当中的CUDA核心数量从32个增至48个。

    按照常理来说,对于SM(流处理器簇)这一级的模块,已经没必要再重新设计或者进行调整了,直接保留GF100的设计,然后根据需要复制出一定的规模,新的核心就诞生了。但是在规格直接减半之后,虽然晶体管数和核心面积都会减半(参照Cypress与Juniper),但性能也会损失近50%,NVIDIA认为这并不是非常好的的方案。

    那该怎么办呢?我们知道,对GPU性能影响最大的模块就是流处理器(CUDA核心),如果能在GPU内部尽可能多的塞入CUDA核心的话,性能方面就会有很大的提升。但是CUDA核心也会消耗不少的晶体管,如果晶体管数太过庞大的话,GPU制造成本、良品率、功耗、发热也会受到较大影响。

DX11性价比之王!GTX460

    那有没有两全其美的方法呢?大家可以注意看GF100芯片透视图,其中间位置有1/3的面积,这些是GF100一体式的二级缓存。NVIDIA为了提升GPU并行计算的效率,像CPU那样不惜成本的设计了大容量L2。L2对于性能的贡献主要集中在密集型计算任务当中,而对于普通的图形渲染来说,贡献就非常小了。那么如果将这些L2的容量进一步压缩,把节约出来的晶体管都变成CUDA核心的话,那么图形渲染性能将会得到显著提升。

DX11性价比之王!GTX460

GF104的SM要比GF100“胖”一些,CUDA核心横向扩张

    于是,拥有较小L2、较多CUDA核心的GF104就诞生了,新核心每组SM中包含CUDA核心的数量从32个增至48个,增加了50%,流处理器总数达到了384个。NVIDIA在晶体管数一定的情况下,通过优化核心与缓存的配比,制造出了一颗实力超乎预期的核心。

● 每组SM当中的纹理单元数量从4个增至8个

    当然,NVIDIA也没有单纯增加CUDA核心的数量,针对GF100核心的不足之处也做了较大的改进——纹理单元数量加倍!

DX11性价比之王!GTX460

纹理单元数量加倍

    GF100核心的每组SM当中拥有32个CUDA核心,还包括了4个纹理单元,这样GF100总共就拥有64个纹理单元(GTX480屏蔽了一组是60个),远少于Cypress的80个纹理单元。较少的纹理单元使得GTX400系列在大量使用了纹理贴图的游戏中表现不佳,最有代表性的游戏就是《孤岛危机》。

    GF104核心只有8组SM,如果还是保持GF100的设计不变,那么纹理单元将只有32个,还没有HD5770多(40个)。所以NVIDIA对纹理单元部分也做了改良,每组SM中的数量直接加倍,最终GF104拥有64个纹理单元,与GF100相等!

    CUDA核心数量增加了50%,而纹理单元增加了100%,改进意图显而易见。这些改进都使得GTX460的性能大大高于此前的预期。

1人已赞

关注我们

泡泡网

手机扫码关注