泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

开创视觉计算帝国GTX280/260权威评测

第二章/第五节 GTX200核心大幅扩充流处理器

    首先来看看GTX200核心的细节部分,和上代的G80/G92相比,几乎所有的微架构都作了调整,并大幅扩充规模:

{imageTitle}

    G80/G92拥有128个流处理器,这些流处理器分为8组TPC(线程处理器簇),每组16个SP(流处理器),这16个SP又分为两组SM(多核流处理器),SM是不可拆分的最小单元,是8核心设计。因此G8X系列规格最低的显卡就是8个流处理器的8400GS和8400M G(笔记本显卡)。

{imageTitle}

    GTX200将TPC数量从8个扩充至10个,而且在每个TPC内部,SM从2个增加到3个,SM依然是8核心设计。如此一来,GTX200核心的流处理器数量就是,8×3×10=240个,几乎是G80的两倍!

    纹理单元部分,GTX200的每个TPC内部拥有8个TF,这样总共就是8×10=80个纹理单元。这里GTX200的纹理过滤单元和定址单元的数量是相等的,而G80的纹理定址单元只有纹理过滤单元的一半(事实上G92核心中TA和TF数量就相等了)。

● GTX200核心微架构改进

    GTX200核心在流处理器、纹理单元数量上的扩充是很容易理解的,其实除了扩充规模之外,在架构的细微之处还有不少的改进,这些都有助于提高新核心在未来游戏或通用计算中的执行效能:

1. 每个SM可执行线程上限提升:G80/G92核心每个SM(即不可拆分的8核心流处理器)最多可执行768条线程,而GTX200核心的每个SM提升至1024条,而且GTX200拥有更多的SM,芯片实力达到原来的2.5倍!

{imageTitle}

2. 每个SM的指令寄存器翻倍:GTX200与G80核心在SM结构上基本相同的,但功能有所提升,在执行线程数增多的同时,NVIDIA还将每个SM中间的Local Memory容量翻倍(从16K到32K)。Local Memory用于存储SM即将执行的上千条指令,容量增大意味着可以存储更多的指令、超长的指令、或是各种复杂的混合式指令,这对于提高SM的执行效能大有裨益。

{imageTitle}
双倍寄存器的优势:代表DX10性能的3DMarkVantage得分直接提升15%

    当前和未来的DX10游戏,越来越多的使用复杂的混合式Shader指令,一旦排队中的超长指令溢出或者在N个周期内都排不上队,那么就会造成效率下降的情况,此时双倍寄存器容量的优势就体现出来了。由于Local Memory并不会消耗太多晶体管,因此将其容量翻倍是很合算的。

2人已赞
第1页:目录:开创视觉帝国!GTX280/260权威评测第2页:前言:3D性能原地踏步19个月业界呼唤新王者第3页:回顾:DX10时代NVIDIA三款旗舰显卡第4页:回顾:DX10时代AMD两款旗舰显卡第5页:第一代统一架构:统一像素/顶点/几何/物理第6页:第二代统一架构:统一并行计算和图形处理第7页:标量流处理器架构:G80微架构的革命性第8页:GTX200芯片透视图、架构图、规格总表第9页:GTX200核心架构解析:大幅扩充流处理器第10页:GTX200核心架构解析:512Bit显存消除瓶颈第11页:GTX200图形架构解析:优化几何/纹理/光栅第12页:GTX200并行架构解析:支持双指令/双精度第13页:GTX200特殊功能解析:完美芯片级节能技术第14页:CUDA概念:并行计算相对串行计算的优势第15页:CUDA目的:一个以GPU为中心的运算平台第16页:CUDA应用:视频加速、期货风险分析系统第17页:CUDA应用:医疗行业、地理信息系统第18页:CUDA应用:生命科学、CAD设计、MATLAB第19页:CUDA应用:GPU的先天优势和后天发展第20页:物理加速:Intel搅局GPU物理加速受阻第21页:被逼无奈,NVIDIA重金收购AGEIA第22页:兵贵神速:仅1月时间PhysX引擎就支持N卡第23页:实物赏析:GTX280是8800GTX的真正接班人第24页:G200核心:14亿晶体管怪兽+NVIO2代输出第25页:1GB 512Bit显存,现代0.8ns GDDR3颗粒第26页:供电模块:N卡史上最豪华的数字供电模块第27页:大家来找碴:GTX280和GTX260外观上有何异同第28页:GTX260解析:精简了2颗显存和2相供电第29页:七彩虹GTX280/260,大陆独家供货充足第30页:索泰GTX280高频版,浮点运算历史性突破1TFLOPS第31页:GeForce 6/7/8三款经典DEMO回顾第32页:GTX200演示Demo Medusa赏析(一)第33页:GTX200演示Demo Medusa赏析(二)第34页:Medusa的特色:集上代Demo特色与一身第35页:Medusa的特色:模拟未来游戏场景第36页:性能测试:顶级测试平台介绍第37页:DX9C理论性能测试:3DMark06第38页:DX10理论性能测试:3DMark Vantage第39页:DX9C游戏测试:《超级房车:起点》第40页:DX9C游戏测试:《使命召唤4》第41页:DX9C游戏测试:《帝国3:亚洲王朝》第42页:DX9C游戏测试:《半条命2:第二章》第43页:DX9C游戏测试:《极品飞车11》第44页:DX9C游戏测试:《虚幻竞技场3》第45页:OpenGL游戏测试:《雷神战争》第46页:DX10游戏测试:《孤岛危机》第47页:DX10游戏测试:《失落星球》第48页:DX10游戏测试:《英雄连》第49页:DX10游戏测试:《刺客信条》第50页:DX10游戏测试:《冲突世界》第51页:DX10游戏测试:《生化奇兵》第52页:DX10游戏测试:《地狱门:伦敦》第53页:性能对比:GTX280 VS GTX260第54页:性能对比:GTX280 VS 9800GX2第55页:性能对比:GTX280 VS 9800GTX第56页:性能对比:GTX280 VS 8800Ultra第57页:性能对比:GTX280 VS 8800GTX第58页:性能对比:GTX280 VS HD3870X2第59页:多卡系统:GTX280 SLI效率测试第60页:多卡系统:GTX280三路SLI效率测试第61页:功耗测试:GTX200系列显卡全平台功耗测试第62页:视频解码:高清CPU占用率测试第63页:CUDA应用测试:BadaBOOM视频编码第64页:CUDA应用测试:Folding@home第65页:专访饭田庆太:GTX280给游戏更多机会第66页:专访邓培智:性能翻倍 DirectX 10.1非主流第67页:全文总结:迎接视觉计算时代来临

关注我们

泡泡网

手机扫码关注