开普勒秒杀GCN 新卡皇GTX680首发评测-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

开普勒秒杀GCN 新卡皇GTX680首发评测

2012年03月22日 21:00作者：陈骋编辑：陈骋文章出处：泡泡网原创

基于效能和计算能力方面的考虑，NVIDIA与AMD不约而同的改变了架构，NVIDIA虽然还是采用SIMT架构，但也借鉴了AMD“较老”的SIMD架构之作法，降低控制逻辑单元和指令发射器的比例，用较少的逻辑单元去控制更多的CUDA核心。于是一组SM当中容纳了192个核心的壮举就变成了现实！

通过上面这个示意图就看的很清楚了，CUDA核心的缩小主要归功于28nm工艺的使用，而如此之多的CUDA核心，与之搭配的控制逻辑单元面积反而缩小了，NVIDIA强化运算单元削减控制单元的意图就很明显了。

Fermi的硬件相关性检查变为Kepler的软件预解码

此时相信有人会问，降低控制单元的比例那是不是意味着NVIDIA赖以成名的高效率架构将会一去不复返了？理论上来说效率肯定会有损失，但实际上并没有想象中的那么严重。NVIDIA发现线程的调度有一定的规律性，编译器所发出的条件指令可以被预测到，此前这部分工作是由专门的硬件单元来完成的，而现在可以用简单的程序来取代，这样就能节约不少的晶体管。

随意在开普勒中NVIDIA将一大部分指令派发和控制的操作交给了软件（驱动）来处理。而且GPU的架构并没有本质上的改变，只是结构和规模以及控制方式发生了变化，只要驱动支持到位，与游戏开发商保持紧密的合作，效率损失必然会降到最低——事实上NVIDIA著名的The Way策略就是干这一行的！

The Way（游戏之道）计划可以保证NVIDA的GPU架构与游戏完美兼容

这方面NVIDIA与AMD的思路和目的是相同的，但最终体现在架构上还是有所区别。NVIDIA的架构被称为SIMT（Single Instruction Multiple Threads，单指令多线程），NVIDIA并不像AMD那样把多少个运算单元捆绑为一组，而是以线程为单位自由分配，控制逻辑单元会根据线程的任务量和SM内部CUDA运算单元的负载来决定调动多少个CUDA核心进行计算，这一过程完全是动态的。

但不可忽视的是，软件预解码虽然大大节约了GPU的晶体管开销，让流处理器数量和运算能力大增，但对驱动和游戏优化提出了更高的要求，这种情况伴随着AMD度过了好多年，现在NVIDIA也要面对相同的问题了，希望他能做得更好一些。

0人已赞

第1页：终于来了：NVIDIA新旗舰显卡GTX680 第2页：突破1GHz，GTX680参数规格一览第3页：GPU图形架构：改革还是革命？第4页：GPU图形架构的阴阳之争第5页：AMD的方向：SIMD的另一种形式第6页：NVIDIA之路：从MIMD到SIMT 第7页：开普勒之架构：流处理器暴增之谜第8页：开普勒之核心：SMX与SM的改动细节第9页：开普勒之频率：CUDA频率不再是双倍第10页：开普勒之显存：频率全面超越对手第11页：开普勒之其它：多形体引擎和缓存设计第12页：开普勒与南方群岛谁更先进？第13页：GPU Boost：让显卡自动超频第14页：新功能：平滑自适应垂直同步第15页：更具效能的抗锯齿技术：FXAA和TXAA 第16页：新功能：单卡四屏显示第17页：新加入模块：NVENC解码单元第18页：招牌技术：PhysX物理加速第19页：一睹真容：公版GTX680实拍照片欣赏第20页：做工用料揭秘：GTX680彻底拆解第21页：首批上市显卡曝光：影驰GEFORCE GTX680 第22页：首批上市显卡曝光：七彩虹GTX680-GD5 CH版 2048M 第23页：首批上市显卡曝光：索泰GTX680-2GD5极速版第24页：首批上市显卡曝光：映众GTX680游戏至尊版第25页：测试平台说明：最顶级发烧配置第26页：基准测试：3DMark/Heaven/石巨人/SubD11 第27页：DX9C游戏测试：星际2/街霸4/使命召唤第28页：DX10游戏测试：孤岛危机/孤岛惊魂2 第29页：DX11游戏测试：异形/蝙蝠侠/战地3 第30页：DX11游戏测试：潜行者/孤岛危机2/文明5 第31页：DX11游戏测试：尘埃3/失落星球2/地铁2033 第32页：DX11游戏测试：幕府将军2/魔兽世界第33页：温度/功耗测试：性能强却更省电第34页：测试成绩汇总：比HD7970强10%第35页：超频测试：默电可上1150MHz 第36页：全文总结：速度最快的显卡诞生

开普勒秒杀GCN 新卡皇GTX680首发评测

关注我们