开创视觉计算帝国GTX280/260权威评测-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

开创视觉计算帝国GTX280/260权威评测

2008年06月17日 00:01作者：泡泡网评测室编辑：孙敏杰文章出处：泡泡网原创

数量和规格上的扩充是一目了然的，不过GTX200核心不止是堆积晶体管和扩充规模而已，在一些技术细节部分，GTX200的改进也很明显。

第二章/第七节 GTX200图形架构细节方面的改进

为了能够更加胜任于未来的DX10游戏，NVIDIA针对图形渲染的三大重要环节进行了改良：几何着色、纹理单元和光栅单元。

● 改进几何着色性能

几何着色（Geometry Shader）是DX10的新增的着色器，它允许GPU来动态的生成和销毁几何图元数据，通过和新的数据流输出功能配合使用，许多以前无法实时使用的算法现在都可以在GPU中使用了。相比以往由CPU来处理简单的几何坐标变换，现在DX10渲染的效能增加不少（相同画质下DX10的效率高与DX9C），而且图形变换也可以做的更加复杂。

G8X相对于R6XX系列有着绝对的性能优势，但是它有个致命的缺点就是几何着色效能一般，这也成为ATI攻击NVIDIA的重要把柄，记得当时ATI在其内部演示PPT中指出，R600的理论几何着色性能可达G80的好几倍！

由于第一批DX10游戏对于几何着色的使用还不够广泛，因此G8X的弱点并没有体现出来，不过NVIDIA官方还是承认自己在几何着色方面确实不如ATI做的好。通过Rightmark 3D理论测试可以看出，HD3870的几何着色性能就要比8800GTX强不少，HD3870X2则更加强大。

在GTX200核心中，NVIDIA主要通过改进数据流输出（Stream Output）及帧缓冲（Frame Buffer Memory）的方式，有效地提高了几何着色器的效能。数据流输出也是DX10新增的特性，它允许数据从顶点着色器或几何着色器中直接被传入帧缓冲，这种输出可以被传回渲染流水线重新处理，当几何着色器与数据流输出结合使用时，GPU不仅可以处理新的图形算法，还可以提高一般运算和物理运算的效率。GTX200的帧缓冲达到了G80的6倍之多，由此可以允许更多的数据往返于着色器之间，避免重复性的数据处理，提升执行效能。

● 纹理单元进一步增强，但所占比率下降

G92核心总共拥有64个TA和64个TF（G80是32TA、64TF），而GTX200拥有80个TA和80个TF，数量上的增加只是表象，实际上最关键之处就是流处理器与纹理单元的比率：

{imageTitle}

G92与GTX200核心每个TPC拥有的纹理单元数目相同，但每个TPC所包括的流处理器数量增加了50%，如此一来流处理器与纹理单元的比率直接从2:1上升至3:1。这与ATI前两年所鼓吹的“3:1架构”不谋而合，虽然两家产品的架构相差十万八千里，但针对游戏的渲染模式作出调整的方针是一致的。

虽然纹理单元比例下降了，但GTX200核心的每个纹理单元的效能却增加了，通过优化指令执行的调度机制，在实际游戏中打开高倍各向异性纹理过滤时，GTX200的效率要比G9X高22%左右。

● 光栅单元规模增大，高倍抗锯齿成为可能

G8X/G9X的ROP单元可以说是革命性的，它首次对8xMSAA（多重采样抗锯齿）提供支持，当然还支持最高精度的SSAA（超级采样抗锯齿）和TSAA（透明抗锯齿），此外NVIDIA独创的CSAA（覆盖采样抗锯齿）让人眼前一亮，它能够以接近4xMSAA效能实现8xCSAA甚至16xCSAA的精度，让游戏画质得到了近乎免费的提升。

失落星球、冲突世界、英雄连等许多游戏都直接支持高倍CSAA

近两年时间过去了，现在我们可以发现绝大多数新出的游戏（尤其是DX10游戏）都内置了对CSAA技术的支持，玩家可以在普通MSAA的基础上选择性能损失很小、但精度提升很大的CSAA。相比之下对手ATI所倡导的CFAA（可编程过滤抗锯齿）由于自身问题（边缘模糊）几乎被玩家所无视，也没有任何游戏对CFAA提供内置支持。

不过G8X/G9X存在的问题就是8xMSAA的效率不高，在8xMSAA基础上衍生出来的两种CSAA（8xQAA和16xQAA）效率自然更差，在很多复杂游戏中几乎没有实用性。为此在GTX200这一代GPU中，NVIDIA将ROP规模从24个扩充至32个，单个ROP在执行8xMSAA Z轴取样操作时的速度可达上代的两倍，由此使得高倍AA的效能得到了明显改善，加之显存容量的带宽增加不少，现在的旗舰显卡可以在很多主流DX10游戏中开启8xMSAA（或8xQAA、16xQAA）流畅运行！

2人已赞

第1页：目录：开创视觉帝国！GTX280/260权威评测第2页：前言：3D性能原地踏步19个月业界呼唤新王者第3页：回顾：DX10时代NVIDIA三款旗舰显卡第4页：回顾：DX10时代AMD两款旗舰显卡第5页：第一代统一架构：统一像素/顶点/几何/物理第6页：第二代统一架构：统一并行计算和图形处理第7页：标量流处理器架构：G80微架构的革命性第8页：GTX200芯片透视图、架构图、规格总表第9页：GTX200核心架构解析：大幅扩充流处理器第10页：GTX200核心架构解析：512Bit显存消除瓶颈第11页：GTX200图形架构解析：优化几何/纹理/光栅第12页：GTX200并行架构解析：支持双指令/双精度第13页：GTX200特殊功能解析：完美芯片级节能技术第14页：CUDA概念：并行计算相对串行计算的优势第15页：CUDA目的：一个以GPU为中心的运算平台第16页：CUDA应用：视频加速、期货风险分析系统第17页：CUDA应用：医疗行业、地理信息系统第18页：CUDA应用：生命科学、CAD设计、MATLAB 第19页：CUDA应用：GPU的先天优势和后天发展第20页：物理加速：Intel搅局GPU物理加速受阻第21页：被逼无奈，NVIDIA重金收购AGEIA 第22页：兵贵神速：仅1月时间PhysX引擎就支持N卡第23页：实物赏析：GTX280是8800GTX的真正接班人第24页：G200核心：14亿晶体管怪兽+NVIO2代输出第25页：1GB 512Bit显存，现代0.8ns GDDR3颗粒第26页：供电模块：N卡史上最豪华的数字供电模块第27页：大家来找碴：GTX280和GTX260外观上有何异同第28页：GTX260解析：精简了2颗显存和2相供电第29页：七彩虹GTX280/260，大陆独家供货充足第30页：索泰GTX280高频版，浮点运算历史性突破1TFLOPS 第31页：GeForce 6/7/8三款经典DEMO回顾第32页：GTX200演示Demo Medusa赏析（一）第33页：GTX200演示Demo Medusa赏析（二）第34页：Medusa的特色：集上代Demo特色与一身第35页：Medusa的特色：模拟未来游戏场景第36页：性能测试：顶级测试平台介绍第37页：DX9C理论性能测试：3DMark06 第38页：DX10理论性能测试：3DMark Vantage 第39页：DX9C游戏测试：《超级房车：起点》第40页：DX9C游戏测试：《使命召唤4》第41页：DX9C游戏测试：《帝国3：亚洲王朝》第42页：DX9C游戏测试：《半条命2：第二章》第43页：DX9C游戏测试：《极品飞车11》第44页：DX9C游戏测试：《虚幻竞技场3》第45页：OpenGL游戏测试：《雷神战争》第46页：DX10游戏测试：《孤岛危机》第47页：DX10游戏测试：《失落星球》第48页：DX10游戏测试：《英雄连》第49页：DX10游戏测试：《刺客信条》第50页：DX10游戏测试：《冲突世界》第51页：DX10游戏测试：《生化奇兵》第52页：DX10游戏测试：《地狱门：伦敦》第53页：性能对比：GTX280 VS GTX260 第54页：性能对比：GTX280 VS 9800GX2 第55页：性能对比：GTX280 VS 9800GTX 第56页：性能对比：GTX280 VS 8800Ultra 第57页：性能对比：GTX280 VS 8800GTX 第58页：性能对比：GTX280 VS HD3870X2 第59页：多卡系统：GTX280 SLI效率测试第60页：多卡系统：GTX280三路SLI效率测试第61页：功耗测试：GTX200系列显卡全平台功耗测试第62页：视频解码：高清CPU占用率测试第63页：CUDA应用测试：BadaBOOM视频编码第64页：CUDA应用测试：Folding@home 第65页：专访饭田庆太：GTX280给游戏更多机会第66页：专访邓培智:性能翻倍 DirectX 10.1非主流第67页：全文总结：迎接视觉计算时代来临

开创视觉计算帝国GTX280/260权威评测

关注我们