开普勒秒杀GCN 新卡皇GTX680首发评测-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

开普勒秒杀GCN 新卡皇GTX680首发评测

2012年03月22日 21:00作者：陈骋编辑：陈骋文章出处：泡泡网原创

全新的Kepler相比上代的Fermi架构改变了什么，看架构图就很清楚了：

Fermi GF100/GF110核心架构图

Kepler GK104核心架构图

GK104相比GF110，整体架构没有大的改变，GPU（图形处理器集群）维持4个，显存控制器从6个64bit（384bit）减至4个64bit（256bit），总线接口升级至PCIE 3.0。剩下的就是SM方面的改变了：

GF100和GF104的SM架构图

这里之所以要把GF104这颗中端核心的SM架构图也列出来，是因为GF104相比高端的GF100核心做了一些细小的改动，这些改动也被沿用到了GK104当中。另外从核心代号上来看，GK104其实就是用来取代GF104的，而取代GF100的核心另有他人。

GK104的SMX架构图

NVIDIA把GK104的SM（不可分割的流处理器集群）称为SMX，原因就是暴增的CUDA核心数量。但实际上其结构与上代的SM没有本质区别，不同的只是各部分单元的数量和比例而已。具体的区别逐个列出来进行对比：

GTX680架构解析：GPU版开普勒三大定律

1. NVIDIA现在把流处理器称为CUDA核心；

2. SFU（Special Function Units，特殊功能单元）是比CUDA核心更强的额外运算单元，可用于执行抽象的指令，例如正弦、余弦、倒数和平方根，图形插值指令也在SFU上执行；

3. Warp是并行线程调度器，每一个Warp都可以调度SM内部的所有CUDA核心或者SFU；

4. Dispatch Unit是指令分派单元，分则将Warp线程中的指令按照顺序和相关性分配给不同的CUDA核心或SFU处理；

5. LD/ST就是载入/存储单元，可以为每个线程存储运算源地址与路径，方便随时随地的从缓存或显存中存取数据；

6. TMU是纹理单元，用来处理纹理和阴影贴图、屏幕空间环境光遮蔽等图形后期处理；

通过以上数据对比不难看出，GK104暴力增加CUDA核心数量的同时，SFU和TMU这两个与图形或计算息息相关处理单元也同比增加，但是指令分配单元和线程调度器还有载入/存储单元的占比都减半了。这也就是前文中提到过的削减逻辑控制单元的策略，此时如何保证把指令和线程填满一个CUDA核心，将是一个难题。

0人已赞

第1页：终于来了：NVIDIA新旗舰显卡GTX680 第2页：突破1GHz，GTX680参数规格一览第3页：GPU图形架构：改革还是革命？第4页：GPU图形架构的阴阳之争第5页：AMD的方向：SIMD的另一种形式第6页：NVIDIA之路：从MIMD到SIMT 第7页：开普勒之架构：流处理器暴增之谜第8页：开普勒之核心：SMX与SM的改动细节第9页：开普勒之频率：CUDA频率不再是双倍第10页：开普勒之显存：频率全面超越对手第11页：开普勒之其它：多形体引擎和缓存设计第12页：开普勒与南方群岛谁更先进？第13页：GPU Boost：让显卡自动超频第14页：新功能：平滑自适应垂直同步第15页：更具效能的抗锯齿技术：FXAA和TXAA 第16页：新功能：单卡四屏显示第17页：新加入模块：NVENC解码单元第18页：招牌技术：PhysX物理加速第19页：一睹真容：公版GTX680实拍照片欣赏第20页：做工用料揭秘：GTX680彻底拆解第21页：首批上市显卡曝光：影驰GEFORCE GTX680 第22页：首批上市显卡曝光：七彩虹GTX680-GD5 CH版 2048M 第23页：首批上市显卡曝光：索泰GTX680-2GD5极速版第24页：首批上市显卡曝光：映众GTX680游戏至尊版第25页：测试平台说明：最顶级发烧配置第26页：基准测试：3DMark/Heaven/石巨人/SubD11 第27页：DX9C游戏测试：星际2/街霸4/使命召唤第28页：DX10游戏测试：孤岛危机/孤岛惊魂2 第29页：DX11游戏测试：异形/蝙蝠侠/战地3 第30页：DX11游戏测试：潜行者/孤岛危机2/文明5 第31页：DX11游戏测试：尘埃3/失落星球2/地铁2033 第32页：DX11游戏测试：幕府将军2/魔兽世界第33页：温度/功耗测试：性能强却更省电第34页：测试成绩汇总：比HD7970强10%第35页：超频测试：默电可上1150MHz 第36页：全文总结：速度最快的显卡诞生

开普勒秒杀GCN 新卡皇GTX680首发评测

关注我们