超越公版!铭鑫GTX460中国玩家版解析
GTX480/GTX470使NVIDIA再次夺回了单核心性能王者的宝座,不过NVIDIA似乎并不满足于此,在6月1日又发布基于GF100核心的第三款产品——GTX465。这款产品在性能上略低于GTX470,但凭借较高的性价比依然获得了不少玩家的亲睐。
今天,NVIDIA再次发布了支持DX11的第四款产品——GTX460。与之前产品不同的是GTX460基于全新的GF104核心。这款核心不仅仅只是GF100的低规格版这么简单,而是在GF100的基础上进行了大幅改进,在保证产品性能优势的同时,使功耗及发热量大幅下降,从而也提升了产品的超频能力。下面小编就为大家详细介绍一下GF104核心以及采用GF104核心的产品GTX460,究竟都有哪些特点!
按理说,NVIDIA也应该会把GF100核心的主要规格全部减半,从而制造出一颗拥有256SP 256Bit的主流核心。事实上之前国内外的媒体都是这样猜测的,因为GF100模块化四核心的设计,很容易将其“拆分为”规模大小不一的中低端核心:
如上图所示,GF100为四核心设计,将它变为1/2、1/4就能轻而易举的获得中端和低端GPU,但NVIDIA却没有这样做,最终GF104核心的规模出乎所有人的预料:
乍一看,GF104就是GF100被一刀切成两半的规模,但请大家仔细看看到底有何不同?这里提醒大家一下:完整的GF100核心拥有512个CUDA核心,完整的GF104核心拥有384个CUDA核心,显然GF104核心并非是GF100一半的规格,NVIDIA在微观架构方面做了不小的改动。
● 每组SM当中的CUDA核心数量从32个增至48个
按照常理来说,对于SM(流处理器簇)这一级的模块,已经没必要再重新设计或者进行调整了,直接保留GF100的设计,然后根据需要复制出一定的规模,新的核心就诞生了。但是在规格直接减半之后,虽然晶体管数和核心面积都会减半(参照Cypress与Juniper),但性能也会损失近50%,NVIDIA认为这并不是非常好的的方案。
那该怎么办呢?我们知道,对GPU性能影响最大的模块就是流处理器(CUDA核心),如果能在GPU内部尽可能多的塞入CUDA核心的话,性能方面就会有很大的提升。但是CUDA核心也会消耗不少的晶体管,如果晶体管数太过庞大的话,GPU制造成本、良品率、功耗、发热也会受到较大影响。
GF100核心透视图,二级缓存消耗了太多的晶体管
那有没有两全其美的方法呢?大家可以注意看GF100芯片透视图,其中间位置有1/3的面积,这些是GF100一体式的二级缓存。NVIDIA为了提升GPU并行计算的效率,像CPU那样不惜成本的设计了大容量L2。L2对于性能的贡献主要集中在密集型计算任务当中,而对于普通的图形渲染来说,贡献就非常小了。那么如果将这些L2的容量进一步压缩,把节约出来的晶体管都变成CUDA核心的话,那么图形渲染性能将会得到显著提升。
于是,拥有较小L2、较多CUDA核心的GF104就诞生了,新核心每组SM中包含CUDA核心的数量从32个增至48个,增加了50%,流处理器总数达到了384个。NVIDIA在晶体管数保持不变的情况下,通过优化核心与缓存的配比,制造出了一颗实力超乎预期的核心。