泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

开普勒秒杀GCN 新卡皇GTX680首发评测

    全新的Kepler相比上代的Fermi架构改变了什么,看架构图就很清楚了:

Fermi GF100/GF110核心架构图

GTX680架构解析:GPU版开普勒三大定律

Kepler GK104核心架构图

    GK104相比GF110,整体架构没有大的改变,GPU(图形处理器集群)维持4个,显存控制器从6个64bit(384bit)减至4个64bit(256bit),总线接口升级至PCIE 3.0。剩下的就是SM方面的改变了:

GTX680架构解析:GPU版开普勒三大定律

GF100和GF104的SM架构图

    这里之所以要把GF104这颗中端核心的SM架构图也列出来,是因为GF104相比高端的GF100核心做了一些细小的改动,这些改动也被沿用到了GK104当中。另外从核心代号上来看,GK104其实就是用来取代GF104的,而取代GF100的核心另有他人。

GTX680架构解析:GPU版开普勒三大定律

GK104的SMX架构图

    NVIDIA把GK104的SM(不可分割的流处理器集群)称为SMX,原因就是暴增的CUDA核心数量。但实际上其结构与上代的SM没有本质区别,不同的只是各部分单元的数量和比例而已。具体的区别逐个列出来进行对比:

GTX680架构解析:GPU版开普勒三大定律

1. NVIDIA现在把流处理器称为CUDA核心;

2. SFU(Special Function Units,特殊功能单元)是比CUDA核心更强的额外运算单元,可用于执行抽象的指令,例如正弦、余弦、倒数和平方根,图形插值指令也在SFU上执行;

3. Warp是并行线程调度器,每一个Warp都可以调度SM内部的所有CUDA核心或者SFU;

4. Dispatch Unit是指令分派单元,分则将Warp线程中的指令按照顺序和相关性分配给不同的CUDA核心或SFU处理;

5. LD/ST就是载入/存储单元,可以为每个线程存储运算源地址与路径,方便随时随地的从缓存或显存中存取数据;

6. TMU是纹理单元,用来处理纹理和阴影贴图、屏幕空间环境光遮蔽等图形后期处理;

    通过以上数据对比不难看出,GK104暴力增加CUDA核心数量的同时,SFU和TMU这两个与图形或计算息息相关处理单元也同比增加,但是指令分配单元和线程调度器还有载入/存储单元的占比都减半了。这也就是前文中提到过的削减逻辑控制单元的策略,此时如何保证把指令和线程填满一个CUDA核心,将是一个难题。

0人已赞
第1页:终于来了:NVIDIA新旗舰显卡GTX680第2页:突破1GHz,GTX680参数规格一览第3页:GPU图形架构:改革还是革命?第4页:GPU图形架构的阴阳之争第5页:AMD的方向:SIMD的另一种形式第6页:NVIDIA之路:从MIMD到SIMT第7页:开普勒之架构:流处理器暴增之谜第8页:开普勒之核心:SMX与SM的改动细节第9页:开普勒之频率:CUDA频率不再是双倍第10页:开普勒之显存:频率全面超越对手第11页:开普勒之其它:多形体引擎和缓存设计第12页:开普勒与南方群岛谁更先进?第13页:GPU Boost:让显卡自动超频第14页:新功能:平滑自适应垂直同步第15页:更具效能的抗锯齿技术:FXAA和TXAA第16页:新功能:单卡四屏显示第17页:新加入模块:NVENC解码单元第18页:招牌技术:PhysX物理加速第19页:一睹真容:公版GTX680实拍照片欣赏第20页:做工用料揭秘:GTX680彻底拆解第21页:首批上市显卡曝光:影驰GEFORCE GTX680第22页:首批上市显卡曝光:七彩虹GTX680-GD5 CH版 2048M第23页:首批上市显卡曝光:索泰GTX680-2GD5极速版第24页:首批上市显卡曝光:映众GTX680游戏至尊版第25页:测试平台说明:最顶级发烧配置第26页:基准测试:3DMark/Heaven/石巨人/SubD11第27页:DX9C游戏测试:星际2/街霸4/使命召唤第28页:DX10游戏测试:孤岛危机/孤岛惊魂2第29页:DX11游戏测试:异形/蝙蝠侠/战地3第30页:DX11游戏测试:潜行者/孤岛危机2/文明5第31页:DX11游戏测试:尘埃3/失落星球2/地铁2033第32页:DX11游戏测试:幕府将军2/魔兽世界第33页:温度/功耗测试:性能强却更省电第34页:测试成绩汇总:比HD7970强10%第35页:超频测试:默电可上1150MHz第36页:全文总结:速度最快的显卡诞生

关注我们

泡泡网

手机扫码关注