泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

开创视觉计算帝国GTX280/260权威评测

第二章/第六节 GTX200核心不惜成本启用512Bit显存

    无论CPU还是GPU,在核心处理能力大幅增强的同时,对于外部总线的带宽也提出了更高要求,512Bit显存控制器被启用。

● AMD的512Bit环形总线显存控制器

    首颗使用512Bit显存的GPU是AMD的R600,可惜这颗GPU的效能太差,根本用不到512Bit显存的海量带宽,通过其后续产品RV670核心的性能来看,512Bit相对256Bit的优势微乎其微,以至于AMD在下一代GPU中都放弃使用512Bit设计。

完美DX10!ATI新王者HD2900XT权威评测
R600的内部1024Bit、外部512Bit环形总线架构

    AMD使用的是环形总线(Ring Bus),显存控制器并不会直接从显存颗粒中读写数据,而是只把数据放在环形总线之中,然后程序自行通过环站取回所需数据包,从而减轻控制器复杂度和压力。但这种结构会使单个的存取操作的延迟变大,但总体来说能够提高大规模数据读取的命中率。

    环形总线有很多优势,位宽扩充相对容易、PCB布线相对容易、显存频率可以轻松达到很高,但却又不得不面对延迟增加和效率降低的问题,位宽越大效率就越低,至少我们没有在R600身上看出512Bit环形总线能比256Bit强多少。

● NVIDIA的512Bit交叉总线显存控制器

    NVIDIA方面,大家都知道G92核心未能超越G80,原因主要就出在显存位宽上面,G92虽然拥有更高的频率、更强的纹理单元,但是256Bit无论如何都无法超越384Bit,9800GTX只是勉强接近于8800GTX的性能,高带宽在DX10游戏和开高倍AA的情况下有着决定性作用!

完美DX10!ATI新王者HD2900XT权威评测
G80的6个ROPs和6个64Bit显存控制器

    而NVIDIA则是沿用了传统的交叉式总线(Crossbar),每组显存控制器都与光栅单元(ROP)和纹理缓存(L2)绑定,从G70到G80增加了两个64Bit控制器,这就构成了64×6=384Bit位宽。

{imageTitle}
GTX200核心的8个ROPs和8个64Bit显存控制器

    现在从G80到GTX200,NVIDIA又增添了2个64Bit控制器,这就组成了64×8=512Bit位宽。Crossbar相比RingBus的优势就是数据存取延迟低,但是遇到大规模数据传输时,为了提高命中率就必须把控制器设计的相当复杂,由此导致晶体管开销很大:

{imageTitle}
显存控制器在GTX200核心中所占据的芯片面积仅次于流处理器

    NVIDIA从G70的256Bit、到G80的384Bit、再到GTX200的512Bit,是一个循序渐进的过程,位宽越高设计难度和晶体管开销就越大,因此必须权衡付出的成本代价及性能收益、根据现有的制作工艺来决定是否使用512Bit控制器。

    现在随着DX10游戏对带宽的要求日益苛刻,高位宽所获得的性能提升也很显著,因此在新一代GPU设计时,NVIDIA不惜成本启用了512Bit显存控制器,用以消除性能瓶颈。

2人已赞
第1页:目录:开创视觉帝国!GTX280/260权威评测第2页:前言:3D性能原地踏步19个月业界呼唤新王者第3页:回顾:DX10时代NVIDIA三款旗舰显卡第4页:回顾:DX10时代AMD两款旗舰显卡第5页:第一代统一架构:统一像素/顶点/几何/物理第6页:第二代统一架构:统一并行计算和图形处理第7页:标量流处理器架构:G80微架构的革命性第8页:GTX200芯片透视图、架构图、规格总表第9页:GTX200核心架构解析:大幅扩充流处理器第10页:GTX200核心架构解析:512Bit显存消除瓶颈第11页:GTX200图形架构解析:优化几何/纹理/光栅第12页:GTX200并行架构解析:支持双指令/双精度第13页:GTX200特殊功能解析:完美芯片级节能技术第14页:CUDA概念:并行计算相对串行计算的优势第15页:CUDA目的:一个以GPU为中心的运算平台第16页:CUDA应用:视频加速、期货风险分析系统第17页:CUDA应用:医疗行业、地理信息系统第18页:CUDA应用:生命科学、CAD设计、MATLAB第19页:CUDA应用:GPU的先天优势和后天发展第20页:物理加速:Intel搅局GPU物理加速受阻第21页:被逼无奈,NVIDIA重金收购AGEIA第22页:兵贵神速:仅1月时间PhysX引擎就支持N卡第23页:实物赏析:GTX280是8800GTX的真正接班人第24页:G200核心:14亿晶体管怪兽+NVIO2代输出第25页:1GB 512Bit显存,现代0.8ns GDDR3颗粒第26页:供电模块:N卡史上最豪华的数字供电模块第27页:大家来找碴:GTX280和GTX260外观上有何异同第28页:GTX260解析:精简了2颗显存和2相供电第29页:七彩虹GTX280/260,大陆独家供货充足第30页:索泰GTX280高频版,浮点运算历史性突破1TFLOPS第31页:GeForce 6/7/8三款经典DEMO回顾第32页:GTX200演示Demo Medusa赏析(一)第33页:GTX200演示Demo Medusa赏析(二)第34页:Medusa的特色:集上代Demo特色与一身第35页:Medusa的特色:模拟未来游戏场景第36页:性能测试:顶级测试平台介绍第37页:DX9C理论性能测试:3DMark06第38页:DX10理论性能测试:3DMark Vantage第39页:DX9C游戏测试:《超级房车:起点》第40页:DX9C游戏测试:《使命召唤4》第41页:DX9C游戏测试:《帝国3:亚洲王朝》第42页:DX9C游戏测试:《半条命2:第二章》第43页:DX9C游戏测试:《极品飞车11》第44页:DX9C游戏测试:《虚幻竞技场3》第45页:OpenGL游戏测试:《雷神战争》第46页:DX10游戏测试:《孤岛危机》第47页:DX10游戏测试:《失落星球》第48页:DX10游戏测试:《英雄连》第49页:DX10游戏测试:《刺客信条》第50页:DX10游戏测试:《冲突世界》第51页:DX10游戏测试:《生化奇兵》第52页:DX10游戏测试:《地狱门:伦敦》第53页:性能对比:GTX280 VS GTX260第54页:性能对比:GTX280 VS 9800GX2第55页:性能对比:GTX280 VS 9800GTX第56页:性能对比:GTX280 VS 8800Ultra第57页:性能对比:GTX280 VS 8800GTX第58页:性能对比:GTX280 VS HD3870X2第59页:多卡系统:GTX280 SLI效率测试第60页:多卡系统:GTX280三路SLI效率测试第61页:功耗测试:GTX200系列显卡全平台功耗测试第62页:视频解码:高清CPU占用率测试第63页:CUDA应用测试:BadaBOOM视频编码第64页:CUDA应用测试:Folding@home第65页:专访饭田庆太:GTX280给游戏更多机会第66页:专访邓培智:性能翻倍 DirectX 10.1非主流第67页:全文总结:迎接视觉计算时代来临

关注我们

泡泡网

手机扫码关注