泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

革命性DX11架构!GTX480/470权威评测

第四章/第六节 GF100图形架构:纹理单元贵在精而不再多

    GF100的每个SM都拥有4个纹理单元,这样整颗核心总共就是4x16=64个纹理单元,数量居然仅与G92处在同一水平。要知道GTX480被屏蔽了一组SM之后纹理单元只剩下60个,而自家上代GTX285和对手HD5870都拥有80个纹理单元。难道说NVIDIA认为DX11时代纹理贴图并不重要,因此在扩充流处理器规模的同时忽略了纹理?

开创视觉计算帝国GTX280/260权威评测

GT200的流处理器与纹理

G92的流处理器与纹理

    在以往的GT200架构中,是三个SM共享一个纹理引擎,该引擎含有八个纹理定址单元和过滤单元。更早的G92则是两个SM共享一个纹理引擎。

    GF100的纹理单元确实是少了,但NVIDIA重新设计了纹理单元,通过改进效率来提升纹理性能,而不是以暴力扩充规模的方式实现,因为NVIDIA发现庞大规模的纹理单元也存在瓶颈,而且会浪费很多晶体管。

GF100的每组SM内部包含4个纹理单元

    NVIDIA的方法听起来很简单,但做起来很复杂——就是将纹理单元从外围模块搬入到了SM之中,从而提升了纹理高速缓存的利用率、并达到了更高的时钟频率。道理就类似于AMD和Intel把内存控制器整合在了CPU内部,从而大幅提升了内存带宽和延迟。

    我们知道,N卡的流处理器工作频率非常高,达到了核心频率的两倍甚至更高,而其包括纹理单元、光栅单元及周边控制模块在内的其它部分工作频率比较低。现在NVIDIA将纹理单元转移到了SM内部之后,大幅提高了工作频率,全新的一级缓存将以1200-1400MHz的全速运行,纹理单元虽然还是以半速工作但也受益匪浅。

    在GF100架构中,每个SM都拥有自己专用的纹理单元并共享一级纹理高速缓存,GF100专用的1级纹理高速缓存经过重新设计,可实现更高的效率。而且,通过配备统一的2级高速缓存,纹理可用的最大高速缓存容量达到了GT200的三倍,为纹理密集的着色器提升了命中率。

    每个纹理单元在一个时钟周期内能够计算一个纹理地址并获取四个纹理采样。返回的结果可以是经过过滤的也可以是未过滤的。支持的模式包括双线性、三线性以及各向异性过滤模式。

    而且,纹理单元的内部架构还得到了大幅增强。在阴影贴图、屏幕空间环境光遮蔽等实际使用情况中,净效应就是所实现的纹理性能得到了大幅提升。

    GF100的纹理单元还新增了对DirectX 11中BC6H与BC7纹理压缩格式的支持,从而减少了HDR纹理与渲染器目标的存储器占用。

    纹理单元通过DirectX 11的Gather4特性,还支持抖动采样。这样一来,单一纹理指令就能够从一个128×128的像素网格中获取四个纹理像素。GF100在硬件上采用了DirectX 11四偏置点Gather4,大大加快了阴影贴图、环境光遮蔽以及后期处理算法的速度。凭借抖动采样,游戏就能够高效地执行更加平滑的软阴影或定制纹理过滤器。

0人已赞
第1页:千呼万唤始出来 GTX480/470终于降临第2页:DX10.0大革命:画面很完美、但速度很慢第3页:DX10.1小修补:片面追求画面行不通第4页:DX11时代来临:为高效率游戏而生第5页:DX11特性解读:Shader Model 5.0第6页:DX11特性解读:多线程处理第7页:DX11特性解读:两种新的纹理压缩格式第8页:Tessellation:ATI原创技术但孤掌难鸣第9页:Tessellation:细分曲面的原理第10页:Tessellation:DX11中的改进第11页:Tessellation的妙用:虚假贴图终结者第12页:Tessellation的妙用:随风飘扬的旗帜第13页:Tessellation的妙用:波澜壮阔的水面第14页:Tessellation的妙用:不可思议的长发第15页:DirectCompute与Stream/CUDA/OpenCL第16页:DirectCompute 10/11版本间的区别第17页:DirectCompute11的妙用:顺序无关透明第18页:DirectCompute11的妙用:电影级景深第19页:DirectCompute11的妙用:高清晰环境光第20页:GF100图形架构:绝非新品装旧酒第21页:GF100图形架构:芯片图与架构图第22页:GF100图形架构:居然是四核心GPU第23页:GF100图形架构:强大的多形体引擎第24页:GF100图形架构:第三代流处理器第25页:GF100图形架构:纹理单元不升反降?第26页:GF100图形架构:一级缓存与二级缓存第27页:GF100图形架构:光栅单元与高倍抗锯齿第28页:Fermi计算架构:GPU并行计算历史第29页:Fermi计算架构:完全按照客户需求设计第30页:Fermi计算架构:恐怖的双精度性能第31页:Fermi计算架构:首次支持C++编程第32页:Fermi计算架构:首次支持显存ECC第33页:Fermi计算架构:NVIDIA Nexus开发平台第34页:附加功能增强:PhysX物理加速第35页:增强附加功能:3D立体3屏技术第36页:增强附加功能:光线追踪第37页:GTX400实物对比:造型一点都不夸张第38页:GTX480实物:官方艺术照赏析第39页:GTX470实物:官方艺术照赏析第40页:GTX480实物:外观和散热器实拍图第41页:GTX480实物:全裸拆解与显存解析第42页:GTX480实物:供电模块全解析第43页:GTX470实物:外观与散热器赏析第44页:GTX470实物:全裸拆解与供电解析第45页:首批上市显卡:七彩虹GTX470第46页:Demo解析:8800/GTX200 Demo回顾第47页:Demo解析:Supersonic Sled寓教于乐第48页:Demo解析:Supersonic Sled物理效果第49页:Demo解析:RagingRapidsRide第50页:Demo解析:Island11震撼的水面第51页:Demo解析:Hair不可思议的长发第52页:Demo解析:Design Garage实时光线追踪第53页:测试平台:Core i7 975 + X58豪华配置第54页:DX10理论测试:《3DMark Vantage》第55页:DX11理论测试:《Heaven Benchmark》第56页:DX11游戏:《BattleForge》第57页:DX11游戏:《STALKER:COP》第58页:DX11游戏:《尘埃2》第59页:DX11游戏:《异形大战铁血战士》第60页:DX11游戏:《战地:叛逆联队2》第61页:DX11游戏:《地铁2033》第62页:DX10.1游戏:《孤岛惊魂2》第63页:DX10.1游戏:《鹰击长空》第64页:DX10游戏:《孤岛危机:弹头》第65页:DX9C游戏:《使命召唤:现代战争2》第66页:PhysX游戏:《蝙蝠侠》第67页:微软DX11 SDK:SUBD11第68页:微软DX11 SDK:PN Triangles第69页:NVIDIA Demo:Island11第70页:NVIDIA Demo:Hair第71页:视频转码测试:Badaboom第72页:科学计算测试:Folding Home第73页:温度测试:风扇温控90度开始加速第74页:功耗测试:先准备600W电源吧第75页:测试成绩汇总:GTX480比GTX470强多少第76页:测试成绩汇总:GTX480 PK HD5870第77页:测试成绩汇总:GTX470 PK HD5850第78页:GTX480双卡SLI效率测试第79页:全文总结与展望:DX11争霸赛才刚开始第80页:首批上市GTX480/470显卡及有奖互动

关注我们

泡泡网

手机扫码关注