开创视觉计算帝国GTX280/260权威评测-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

开创视觉计算帝国GTX280/260权威评测

2008年06月17日 00:01作者：泡泡网评测室编辑：孙敏杰文章出处：泡泡网原创

第二章/第八节 GTX200并行计算架构方面的改进

● 提高双指令执行（Dual-Issue）效率

在每个SM（多核流处理器）内部，除了包括8个流处理器之外，还有包括1个SFU（Special Function Unit，特殊功能单元），这个处理单元可以用来辅助SP处理特殊的函数运算、插值属性的顶点+像素着色、执行浮点乘法运算指令（MUL）。

GTX200核心的每个流处理器都能够单独的执行一条乘加指令（Multiplu-Add，也就是同时执行一条乘法和一条加法指令），与此同时SFU还能够在相同的时钟周期执行另外一条乘法指令，相当于每个流处理器都能同时执行3条指令！

如此一来，GTX200的浮点运算能力计算公式为：流处理器数×指令数×频率＝240×3×1296=933GFLOPS。我们知道，G80/G92刚发布时并不支持Dual-Issue，所以其浮点运算能力仅为128×2×1350=346GFLOPS，后来NVIDIA为其追加了Dual-Issue支持，理论浮点运算能力就达到了518GFLOPS。

不过Dual-Issue对于3D游戏的贡献非常微小，只是在特殊条件下比如通用计算时才会有显著的改善。此次NVIDIA将GTX200核心设计成为图形渲染架构和并行计算架构的统一体，对于Dual-Issue的效率进一步优化，达到了93%-94%之高，这样的双指令执行效率可以让GTX200的实际性能无限接近于理论值！

● 支持双精度64Bit浮点运算

IEEE754标准硬性要求支持单精度32Bit浮点，双精度64Bit浮点也是标准之一但只是可选，但双精度64Bit浮点运算正是高精度科学计算（如工程分析、财政计算、计算机模拟）梦寐以求的功能。GTX200提供了对双精度的支持，显然更有利于进军通用计算领域，向传统集群式CPU超级计算机发起挑战！

GTX200核心的每一个SM都包括了一个双精度64Bit浮点运算单元，这样GTX200就相当于一个30核心的双精度64Bit处理器，但GPU的频率要比CPU低很多，因此GTX200的理论64Bit浮点运算能力大概与Intel优异八核心至强处理器相当。

双精度的运算量是单精度的八倍，因此理论浮点运算能力只有原来的1/8，GTX280的双精度64Bit浮点运算能力大概在90GFLOPS左右。

2人已赞

第1页：目录：开创视觉帝国！GTX280/260权威评测第2页：前言：3D性能原地踏步19个月业界呼唤新王者第3页：回顾：DX10时代NVIDIA三款旗舰显卡第4页：回顾：DX10时代AMD两款旗舰显卡第5页：第一代统一架构：统一像素/顶点/几何/物理第6页：第二代统一架构：统一并行计算和图形处理第7页：标量流处理器架构：G80微架构的革命性第8页：GTX200芯片透视图、架构图、规格总表第9页：GTX200核心架构解析：大幅扩充流处理器第10页：GTX200核心架构解析：512Bit显存消除瓶颈第11页：GTX200图形架构解析：优化几何/纹理/光栅第12页：GTX200并行架构解析：支持双指令/双精度第13页：GTX200特殊功能解析：完美芯片级节能技术第14页：CUDA概念：并行计算相对串行计算的优势第15页：CUDA目的：一个以GPU为中心的运算平台第16页：CUDA应用：视频加速、期货风险分析系统第17页：CUDA应用：医疗行业、地理信息系统第18页：CUDA应用：生命科学、CAD设计、MATLAB 第19页：CUDA应用：GPU的先天优势和后天发展第20页：物理加速：Intel搅局GPU物理加速受阻第21页：被逼无奈，NVIDIA重金收购AGEIA 第22页：兵贵神速：仅1月时间PhysX引擎就支持N卡第23页：实物赏析：GTX280是8800GTX的真正接班人第24页：G200核心：14亿晶体管怪兽+NVIO2代输出第25页：1GB 512Bit显存，现代0.8ns GDDR3颗粒第26页：供电模块：N卡史上最豪华的数字供电模块第27页：大家来找碴：GTX280和GTX260外观上有何异同第28页：GTX260解析：精简了2颗显存和2相供电第29页：七彩虹GTX280/260，大陆独家供货充足第30页：索泰GTX280高频版，浮点运算历史性突破1TFLOPS 第31页：GeForce 6/7/8三款经典DEMO回顾第32页：GTX200演示Demo Medusa赏析（一）第33页：GTX200演示Demo Medusa赏析（二）第34页：Medusa的特色：集上代Demo特色与一身第35页：Medusa的特色：模拟未来游戏场景第36页：性能测试：顶级测试平台介绍第37页：DX9C理论性能测试：3DMark06 第38页：DX10理论性能测试：3DMark Vantage 第39页：DX9C游戏测试：《超级房车：起点》第40页：DX9C游戏测试：《使命召唤4》第41页：DX9C游戏测试：《帝国3：亚洲王朝》第42页：DX9C游戏测试：《半条命2：第二章》第43页：DX9C游戏测试：《极品飞车11》第44页：DX9C游戏测试：《虚幻竞技场3》第45页：OpenGL游戏测试：《雷神战争》第46页：DX10游戏测试：《孤岛危机》第47页：DX10游戏测试：《失落星球》第48页：DX10游戏测试：《英雄连》第49页：DX10游戏测试：《刺客信条》第50页：DX10游戏测试：《冲突世界》第51页：DX10游戏测试：《生化奇兵》第52页：DX10游戏测试：《地狱门：伦敦》第53页：性能对比：GTX280 VS GTX260 第54页：性能对比：GTX280 VS 9800GX2 第55页：性能对比：GTX280 VS 9800GTX 第56页：性能对比：GTX280 VS 8800Ultra 第57页：性能对比：GTX280 VS 8800GTX 第58页：性能对比：GTX280 VS HD3870X2 第59页：多卡系统：GTX280 SLI效率测试第60页：多卡系统：GTX280三路SLI效率测试第61页：功耗测试：GTX200系列显卡全平台功耗测试第62页：视频解码：高清CPU占用率测试第63页：CUDA应用测试：BadaBOOM视频编码第64页：CUDA应用测试：Folding@home 第65页：专访饭田庆太：GTX280给游戏更多机会第66页：专访邓培智:性能翻倍 DirectX 10.1非主流第67页：全文总结：迎接视觉计算时代来临

开创视觉计算帝国GTX280/260权威评测

关注我们