泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

Maxwell超节能!GTX750Ti/750首发评测

    在这里我们不难看出,Maxwell内部所有单元和横梁结构均得到了重新设计,数据流得到了优化,功率管理实现了大幅改变。

    虽然从图形特性的视角来看,第一代Maxwell GPU可提供与Kepler GPU相同的API功能,但从深层来上,Maxwell还在单个GPC(图形处理簇)内实现了多个SM单元,每个SM包含一个多形体引擎(Polymorph Engine)和纹理单元,而每个GPC包含一个光栅引擎(Raster Engine)。ROP依然与二级高速缓存片(L2 Cache Slice)以及显存控制器联系在一起。

1

GM107全芯片框图

    GM 107 GPU包含一个GPC、五个Maxwell流式多处理器(SMM)以及两个64位显存控制器(共128位)。这就是这一芯片的完整实现形式,与GeForce GTX 750Ti中的芯片配置相同。

1

GK107全芯片框图

   NVIDIA在Maxwell 更改了 SM 的组织方式。 每个 SM 分为四个独立的处理块,每个处理块具备自己的指令缓冲区、调度器以及 32 个 CUDA 核心。 Kepler 的方法是划分为非2幂 (non-power-of-two) 数量的 CUDA 核心,其中一些是共享核心,这种方法现已弃用。新的划分方法简化了设计与调度逻辑、节省了面积与功耗、降低了计算延迟。

1

    SMX: 192个单精度CUDA核、64个双精度单元、32个特殊功能单元(SFU)和32 个加载/存储单元(LD/ST)。

    每个SMX单元具有192单精度CUDA核,每个核完全由浮点和整数算术逻辑单元组成。Kepler完全保留Fermi引入的IEEE 754-2008 标准的单精度和双精度算术,包括积和熔加(FMA)运算。

    成对的处理块共享四个纹理过滤单元和一个纹理高速缓存。计算一级高速缓存的功能现在也与纹理高速缓存功能相结合,而共享显存是一个独立的单元(类似首款CUDAGPU——G80中所使用的方法),被全部四个块共享。

SMM 处理核架构

1

Maxwell SM框图

    而现在每个SM分为四个独立的处理块,每个处理块具备自己的指令缓冲区、调度器以及32个CUDA核心。新的划分方法简化了设计与调度逻辑、节省了晶体管与功耗、降低了计算延迟。

    总体而言,在这一全新设计上,每个“SM”的尺寸得到大幅缩减,而性能却能够达到一个KeplerSM的90%。更小的晶体管消耗让NVIDIA能够在每颗GPU中实现更多数量的SM。通过对比GK107和GM107 SM总数的相关指标可发现,GM107有五个SM,而前者只有两个。GM107的峰值纹理性能比前者高25%,CUDA核心数量多1.7倍,着色器性能大约高2.3倍。

● SMM架构显存系统的改进

    对GM107来说,要在显存位宽与GK107相同的情况下实现性能大幅提升的目标,增强显存系统也同样重要。内部显存系统带宽实现了提升,另外这一设计的效率也得到了改善。此外,2MB大容量二级高速缓存配置(比之前的任何GPU设计都大)十分有效地降低了显存带宽需求,确保了DRAM带宽不成为瓶颈。

    其他关于Maxwell架构的基本信息,例如通过Giga Thread引擎的主PCI Express接口数据流、Polymorph与Raster单元的基本操作等等过于晦涩的知识这里就不再赘述了。

1人已赞
第1页:四年前的约定:Maxwell终极能效突破第2页:Maxwell的灵魂: 每瓦特性能质的飞跃第3页:深入了解Maxwell架构:揭开SMM的秘密第4页:智能游戏设置:GeForce Experlence第5页:Maxwell更优化的ShadowPlay性能第6页:游戏显示灾难的救星:G-SYNC第7页:NVIDIA GTX750Ti公版曝光第8页:首发产品曝光:七彩虹GTX750Ti第9页:首发产品曝光:七彩虹GTX750第10页:首发产品曝光:影驰GTX750第11页:首发产品曝光:影驰GTX750Ti第12页:首发产品曝光:索泰GTX750Ti第13页:首发产品曝光:索泰GTX750第14页:首发产品曝光:映众GTX750/750Ti第15页:首发产品曝光:微星GTX750Ti第16页:首发产品曝光:微星GTX750第17页:首发产品曝光:耕升GTX750Ti/750第18页:首发产品曝光:翔升GTX750第19页:首发产品曝光:盈通GTX750Ti/750第20页:测试说明和平台介绍第21页:最新3D性能基准:《3DMARK》第22页:DX11基准测试:《3DMark11》第23页:DX11基准测试:《Unigine Valley》第24页:DX11游戏:《孤岛危机3》第25页:DX11游戏:《古墓丽影9》第26页:DX11游戏:《战地3》第27页:DX11游戏:《地铁 2033》第28页:DX11测试:《石巨人》第29页:DX11游戏:《异形大战铁血战士》第30页:DX11游戏:《光荣使命》第31页:DX11游戏:《失落星球2》第32页:PPAS精确功耗采集系统介绍第33页:GTX 750Ti/750空闲、满载功耗测试第34页:GTX750Ti/GTX750超频测试第35页:全文总结:Maxwell开创节能显卡新时代

关注我们

泡泡网

手机扫码关注