泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

开普勒秒杀GCN 新卡皇GTX680首发评测

    尽管AMD的架构在向NVIDIA靠拢,但双方还是有明显区别,而且NVIDIA也在不断的改变。至于NVIDIA和AMD历代产品架构上的变化,之前多篇文章中都已经交代过了,这里就不再重复,我们通过这个简单的数字变化,来了解一下:

GTX680架构解析:GPU版开普勒三大定律

    先看看AMD方面,从R600一直到Cypress,可以说一直在堆SIMD,动辄翻倍,架构没有任何变化;从Cypress到Cayman变化也不大,只是把矢量单元从5D改为4D;从Cayman到Tahiti可以说是质变,SIMD被GCN取代,4D矢量运算单元改为1D标量运算单元。

    而NVIDIA方面,则是不停的对GPU的GPC、SM、CUDA核心等配比进行微调,在微调的过程中经历了两次突变:第一次是GT200到GF100,首次引出了GPC(图形处理器集群)的概念,GPC数量减少但SM数以及流处理器数量增加不少;第二次就是现在了,从GF100到GK104,SM数量减少,但流处理器数量暴增!

    改变是为了适应形式的变化,解决此前出现的一些问题,那NVIDIA的架构有什么问题呢?此前我们多次提到过,虽然NVIDIA的GPU在效能方面占尽优势,但也不是完美无缺的——NVIDIA最大的劣势就是流处理器数量较少,导致理论浮点运算能力较低。当然这只是表面现象,其背后的本质则是MIMD(多指令多数据流)的架构,相当一部分比例的晶体管消耗在了指令发射端和控制逻辑单元上面,所以流处理器数量始终低于对手。

GTX680架构解析:GPU版开普勒三大定律

GF110和GK104芯片对比图

    为了保证GPU性能持续增长,NVIDIA必须耗费更多的晶体管、制造出更大的GPU核心,而这些都需要先进的、成熟的半导体制造工艺的支持。NVIDIA之所以在GF100(GTX480)时代落败,并非架构或者研发端出了什么问题(GF110/GTX580的成功可以证明),而是核心太大导致40nm工艺无法支撑,良率低下漏电流难以控制,最终导致核心不完整且功耗巨大。如此一来,NVIDIA原有的架构严重受制于制造工艺,并非可持续发展之路。

    为此,NVIDIA将芯片架构逐步转向了SIMT的模式,即Single Instruction Multiple Threads(单指令多线程),SIMT有别与AMD的SIMD,SIMT的好处就是无需开发者费力把数据凑成合适的矢量长度,并且SIMT允许每个线程有不同的分支。 纯粹使用SIMD不能并行的执行有条件跳转的函数,很显然条件跳转会根据输入数据不同在不同的线程中有不同表现,这个只有利用SIMT才能做到。

    SIMT在硬件部分的结构还是要比SIMD复杂一些,NVIDIA还是更注重效率一些,所以NVIDIA的流处理器数量还是要比AMD少,但差距已经没以前那么夸张了。

0人已赞
第1页:终于来了:NVIDIA新旗舰显卡GTX680第2页:突破1GHz,GTX680参数规格一览第3页:GPU图形架构:改革还是革命?第4页:GPU图形架构的阴阳之争第5页:AMD的方向:SIMD的另一种形式第6页:NVIDIA之路:从MIMD到SIMT第7页:开普勒之架构:流处理器暴增之谜第8页:开普勒之核心:SMX与SM的改动细节第9页:开普勒之频率:CUDA频率不再是双倍第10页:开普勒之显存:频率全面超越对手第11页:开普勒之其它:多形体引擎和缓存设计第12页:开普勒与南方群岛谁更先进?第13页:GPU Boost:让显卡自动超频第14页:新功能:平滑自适应垂直同步第15页:更具效能的抗锯齿技术:FXAA和TXAA第16页:新功能:单卡四屏显示第17页:新加入模块:NVENC解码单元第18页:招牌技术:PhysX物理加速第19页:一睹真容:公版GTX680实拍照片欣赏第20页:做工用料揭秘:GTX680彻底拆解第21页:首批上市显卡曝光:影驰GEFORCE GTX680第22页:首批上市显卡曝光:七彩虹GTX680-GD5 CH版 2048M第23页:首批上市显卡曝光:索泰GTX680-2GD5极速版第24页:首批上市显卡曝光:映众GTX680游戏至尊版第25页:测试平台说明:最顶级发烧配置第26页:基准测试:3DMark/Heaven/石巨人/SubD11第27页:DX9C游戏测试:星际2/街霸4/使命召唤第28页:DX10游戏测试:孤岛危机/孤岛惊魂2第29页:DX11游戏测试:异形/蝙蝠侠/战地3第30页:DX11游戏测试:潜行者/孤岛危机2/文明5第31页:DX11游戏测试:尘埃3/失落星球2/地铁2033第32页:DX11游戏测试:幕府将军2/魔兽世界第33页:温度/功耗测试:性能强却更省电第34页:测试成绩汇总:比HD7970强10%第35页:超频测试:默电可上1150MHz第36页:全文总结:速度最快的显卡诞生

关注我们

泡泡网

手机扫码关注