性能傲视群雄！映众GTX750Ti冰龙评测-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

性能傲视群雄！映众GTX750Ti冰龙评测

2014年08月19日 00:00作者：蒋尚文编辑：蒋尚文文章出处：泡泡网原创

在这里我们不难看出，Maxwell内部所有单元和横梁结构均得到了重新设计，数据流得到了优化，功率管理实现了大幅改变。

虽然从图形特性的视角来看，第一代Maxwell GPU可提供与Kepler GPU相同的API功能，但从深层来上，Maxwell还在单个GPC(图形处理簇)内实现了多个SM单元，每个SM包含一个多形体引擎(Polymorph Engine)和纹理单元，而每个GPC包含一个光栅引擎(Raster Engine)。ROP依然与二级高速缓存片(L2 Cache Slice)以及显存控制器联系在一起。

GM107全芯片框图

GM 107 GPU包含一个GPC、五个Maxwell流式多处理器(SMM)以及两个64位显存控制器(共128位)。这就是这一芯片的完整实现形式，与GeForce GTX 750Ti中的芯片配置相同。

GK107全芯片框图

NVIDIA在Maxwell 更改了 SM 的组织方式。每个 SM 分为四个独立的处理块，每个处理块具备自己的指令缓冲区、调度器以及 32 个 CUDA 核心。 Kepler 的方法是划分为非2幂 (non-power-of-two) 数量的 CUDA 核心，其中一些是共享核心，这种方法现已弃用。新的划分方法简化了设计与调度逻辑、节省了面积与功耗、降低了计算延迟。

SMX: 192个单精度CUDA核、64个双精度单元、32个特殊功能单元(SFU)和32 个加载/存储单元(LD/ST)。

每个SMX单元具有192单精度CUDA核，每个核完全由浮点和整数算术逻辑单元组成。Kepler完全保留Fermi引入的IEEE 754-2008 标准的单精度和双精度算术，包括积和熔加(FMA)运算。

成对的处理块共享四个纹理过滤单元和一个纹理高速缓存。计算一级高速缓存的功能现在也与纹理高速缓存功能相结合，而共享显存是一个独立的单元(类似首款CUDAGPU——G80中所使用的方法)，被全部四个块共享。

SMM 处理核架构

Maxwell SM框图

而现在每个SM分为四个独立的处理块，每个处理块具备自己的指令缓冲区、调度器以及32个CUDA核心。新的划分方法简化了设计与调度逻辑、节省了晶体管与功耗、降低了计算延迟。

总体而言，在这一全新设计上，每个“SM”的尺寸得到大幅缩减，而性能却能够达到一个KeplerSM的90%。更小的晶体管消耗让NVIDIA能够在每颗GPU中实现更多数量的SM。通过对比GK107和GM107 SM总数的相关指标可发现，GM107有五个SM，而前者只有两个。GM107的峰值纹理性能比前者高25%，CUDA核心数量多1.7倍，着色器性能大约高2.3倍。

● SMM架构显存系统的改进

对GM107来说，要在显存位宽与GK107相同的情况下实现性能大幅提升的目标，增强显存系统也同样重要。内部显存系统带宽实现了提升，另外这一设计的效率也得到了改善。此外，2MB大容量二级高速缓存配置(比之前的任何GPU设计都大)十分有效地降低了显存带宽需求，确保了DRAM带宽不成为瓶颈。

其他关于Maxwell架构的基本信息，例如通过Giga Thread引擎的主PCI Express接口数据流、Polymorph与Raster单元的基本操作等等过于晦涩的知识这里就不再赘述了。

0人已赞

第1页：性能傲视群雄！映众GTX750Ti冰龙第2页：深入了解Maxwell架构：揭开SMM的秘密第3页：映众GTX750Ti冰龙显卡规格和外观介绍第4页：测试说明和平台介绍第5页：DX11基准测试：《3DMark11》第6页：最新3D性能基准：《3DMARK》第7页：DX11游戏：《古墓丽影9》第8页：DX11游戏性能测试：《战地3》第9页：DX11游戏：《地铁 2033》第10页：DX11基准测试：《Unigine Valley》第11页：温度功耗噪音性能测试及总结

性能傲视群雄！映众GTX750Ti冰龙评测

关注我们