决战性能之巅！NV双芯旗舰GTX590评测-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

决战性能之巅！NV双芯旗舰GTX590评测

2011年03月25日 00:00作者：蒋尚文编辑：蒋尚文文章出处：泡泡网原创

GF100的每个SM都拥有4个纹理单元，这样整颗核心总共就是4x16=64个纹理单元，数量居然仅与G92处在同一水平。要知道GTX480被屏蔽了一组SM之后纹理单元只剩下60个，而自家上代GTX285和对手HD5870都拥有80个纹理单元。难道说NVIDIA认为DX11时代纹理贴图并不重要，因此在扩充流处理器规模的同时忽略了纹理？

9.5 精兵简政的纹理单元

GT200的流处理器与纹理

G92的流处理器与纹理

在以往的GT200架构中，是三个SM共享一个纹理引擎，该引擎含有八个纹理定址单元和过滤单元。更早的G92则是两个SM共享一个纹理引擎。

GF100的纹理单元确实是少了，但NVIDIA重新设计了纹理单元，通过改进效率来提升纹理性能，而不是以暴力扩充规模的方式实现，因为NVIDIA发现庞大规模的纹理单元也存在瓶颈，而且会浪费很多晶体管。

GF100的每组SM内部包含4个纹理单元

NVIDIA的方法听起来很简单，但做起来很复杂——就是将纹理单元从外围模块搬入到了SM之中，从而提升了纹理高速缓存的利用率、并达到了更高的时钟频率。道理就类似于AMD和Intel把内存控制器整合在了CPU内部，从而大幅提升了内存带宽和延迟。

我们知道，N卡的流处理器工作频率非常高，达到了核心频率的两倍甚至更高，而其包括纹理单元、光栅单元及周边控制模块在内的其它部分工作频率比较低。现在NVIDIA将纹理单元转移到了SM内部之后，大幅提高了工作频率，全新的一级缓存将以1200-1400MHz的全速运行，纹理单元虽然还是以半速工作但也受益匪浅。

在GF100架构中，每个SM都拥有自己专用的纹理单元并共享一级纹理高速缓存，GF100专用的1级纹理高速缓存经过重新设计，可实现更高的效率。而且，通过配备统一的2级高速缓存，纹理可用的最大高速缓存容量达到了GT200的三倍，为纹理密集的着色器提升了命中率。

每个纹理单元在一个时钟周期内能够计算一个纹理地址并获取四个纹理采样。返回的结果可以是经过过滤的也可以是未过滤的。支持的模式包括双线性、三线性以及各向异性过滤模式。

而且，纹理单元的内部架构还得到了大幅增强。在阴影贴图、屏幕空间环境光遮蔽等实际使用情况中，净效应就是所实现的纹理性能得到了大幅提升。

GF100的纹理单元还新增了对DirectX 11中BC6H与BC7纹理压缩格式的支持，从而减少了HDR纹理与渲染器目标的存储器占用。

纹理单元通过DirectX 11的Gather4特性，还支持抖动采样。这样一来，单一纹理指令就能够从一个128×128的像素网格中获取四个纹理像素。GF100在硬件上采用了DirectX 11四偏置点Gather4，大大加快了阴影贴图、环境光遮蔽以及后期处理算法的速度。凭借抖动采样，游戏就能够高效地执行更加平滑的软阴影或定制纹理过滤器。

4人已赞

第1页：不可思议的存在：GTX590发布第2页：第一章：NVIDIA GTX590产品解析第3页：首发产品：华硕GTX590 第4页：首发产品：索泰GTX590极速版第5页：首发产品：映众GTX590 第6页：首发产品：七彩虹iGame590 第7页：首发产品：铭瑄GTX590 第8页：首发产品：盈通GTX590 第9页：三大双芯卡皇实物对比第10页：第二章：GTX590游戏3D性能测试第11页：DX10理论测试：《3DMark Vantage》第12页：DX11理论测试：《3DMark 11》第13页：Tessellation测试：《Heaven 2.1》第14页：DX11理论测试：《石巨人》第15页：DX11游戏测试：《尘埃2》第16页：DX11游戏测试：《异形大战铁血战士》第17页：DX11游戏测试：《地铁2033》第18页：DX11游戏：《失落星球2》第19页：DX11游戏：《H.A.W.X.2》第20页：DX10.1游戏测试：《孤岛惊魂2》第21页：DX10游戏测试：《孤岛危机：弹头》第22页：DX10游戏测试：《冲突世界》第23页：DX9游戏测试：《街头霸王IV》第24页：PhysX测试：《黑手党II》第25页：CUDA视频转码测试第26页：温度、功耗、噪音全面领先对手第27页：性能测试总结第28页：第三章：NVIDIA附加图形技术之灵活应用第29页：特色技术应用：NV 3D Vison Srround 第30页：虚拟现实必经之路：CUDA光线追踪第31页：第四章：最强游戏即时渲染画面赏析第32页：DX10基准：《3DMark Vantage》画面赏析第33页：DX11游戏：《HAWX2》画面赏析第34页：DX11游戏：《地铁2033》画面赏析第35页：Tessellation软件：《Heaven》画面赏析第36页：Tessellation软件：《石巨人》画面赏析第37页：DX11基准：《3DMark11》画面赏析第38页：第五章：令人兴奋的DirectX API发展历程第39页：号称实现“一切图形特效”的DX9C 第40页：不应备受冷遇的DX10 第41页：第六章：揭秘DX11技术革新第42页：DX11五大革新之：Shader Model 5.0 第43页：DX11五大革新之：Multi-Threading 第44页：DX11五大革新之：Texture Compression 第45页：第七章争论漩涡中心的Tessellation 第46页：Tessellation（曲面细分）的前世今生第47页：Tessellation不仅仅会“细分曲面第48页：当Tessellation遭遇“法线贴图”第49页：曲面细分究极奥义动起来更精彩第50页：当Tessellation遭遇“物理运算”第51页：第八章：DX11核心技术：DirectCompute11 第52页：CUDA和Stream之争的内幕第53页：DirectCompute 10/11版本间的区别第54页：DirectCompute11的妙用：顺序无关透明第55页：DirectCompute11的妙用：电影级景深第56页：DirectCompute11的妙用：高清晰环境光第57页：第九章：GF100/110图形架构深入解析第58页：GF100构架八倍于上代旗舰的几何性能第59页：GF100/110和Cayman图形架构对比第60页：GF100/110图形架构：强大的多形体引擎第61页：GF100/110图形架构：第三代流处理器第62页：GF100/110图形架构：精兵简政的纹理单元第63页：GF100/110图形架构：一级缓存与二级缓存第64页：GF100/110图形架构：光栅单元高倍抗锯齿第65页：第十章：适合并行计算的Fermi架构第66页：Fermi计算架构：GPU的未来是并行计算第67页：Fermi计算架构：高效的双精度性能第68页：Fermi计算架构：首次支持C++编程第69页：Fermi计算架构：首次支持显存ECC 第70页：Fermi计算架构：NVIDIA Nexus开发平台第71页：全文总结：该胜不胜与当败不败第72页：附录：追寻那些曾经的双核卡皇第73页：Rage Fury Maxx——曙光女神第74页：昙花一现的挑战者——XGI Volari V8/V5 第75页：不为人知的经典——双核心9800Pro 第76页：普及双核心——影驰双核7600GT 第77页：GeForce 7950GX2——双拳出击誓夺王位第78页：ATI双核心——Gemini技术第79页：双G92核心的怒吼——GeForce 9800GX2 第80页：55nm王者——GeForce GTX 295

决战性能之巅！NV双芯旗舰GTX590评测

关注我们