泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

决战性能之巅!NV双芯旗舰GTX590评测

    从HD4000时代开始,AMD改进ROP单元设计之后抗锯齿效能大增,在标准的4xMSAA模式下已经与N卡不相上下,而在最高的8xMSAA模式下大幅领先于N卡。NVIDIA虽然提供了比较巧妙的高精度CSAA模式,但画质方面还是比不上正统的MSAA,基于8xMSAA的更高级别8xQ AA与16xQ AA也毫无用武之地,因为N卡的8xMSAA效能偏低。

    为了一雪前耻,NVIDIA在GF100当中重新设计了ROP单元(后端渲染单元,俗称光栅单元)。主要是大幅提升了数据吞吐量与效率,上页介绍过GF100的L2已经不再与ROP及显存控制器绑定在一起,而且是全局共享的,因此存取效能与带宽大幅提升。

9.7 光栅单元与32倍抗锯齿

    GF100的每个ROPs包括8个ROP单元,比GT200翻了一倍。这8个ROP单元可在一个时钟周期类输出8个32bit整数像素、4个16bit浮点像素或2个32bit浮点像素。原子指令性能也得到了大幅提升,相同地址的原子操作执行速度最高可达GT200的20倍,邻近存储区的操作执行速度最高可达7.5倍。

    在GF100上,由于压缩效率的提升以及更多ROP单元能够更有效地渲染这些无法被压缩的较小基元,因此8倍速多重采样抗锯齿(8xMSAA)的性能得到了大幅提升。

    在上代架构中,由于ROP资源有限,在进行高倍抗锯齿采样的同时还执行渲染后端处理任务时(如SSAO、运动模糊、景深等),效率会非常低下。典型的比如《鹰击长空》、《晴空》等等。

    GF100不仅ROP资源非常丰富,而且可以在DirectCompute 11的帮助下减轻ROP部分的负载,提高执行效率,此时开启高倍抗锯齿就没什么压力了。

将CSAA精度提升至32倍,并优化算法实现更高画质

    解决了8xMSAA效率抵消的问题之后,NVIDIA在此基础上更上一层楼,开放了更高级别的32x CSAA抗锯齿模式,上代精品只能提供16xQ CSAA而且实用性并不高。同时新的抗锯齿模式还优化了“透明覆盖”(Alpha-to-Coverage)采样的算法,实现更高的画质:

    受到API与GPU计算能力的限制,当今的游戏能够渲染的几何图形数量还很有限。树叶的渲染是一个尤其突出的难题。针对叶子的一种常用技术就是创建一个包含许多树叶的透明纹理模版,利用“透明覆盖”来除去树叶之间的缝隙。覆盖采样的数量决定了边缘的画质。如果只有四个覆盖或八个采样,那么将会出现非常糟糕的锯齿以及镶边现象,尤其是在纹理靠近屏幕的时候。采用32倍速覆盖采样抗锯齿(CSAA),GPU共有32个覆盖采样,从而最大限度减少了镶边效果。

32x CSAA相比8x MSAA性能损失并不大,非常值得一试

    透明多重采样(TMAA)也能够从CSAA中获益匪浅。由于“透明覆盖”不在DirectX 9 API当中,所以DirectX 9游戏无法直接使用“透明至覆盖”。而TMAA恰恰对这样的游戏有所帮助。取而代之的是,它们采用了一种叫做“透明测试”的技术,该技术能够为透明纹理产生硬边缘。TMAA能够转换DirectX 9应用程序中旧的着色器代码,使其能够使用“透明覆盖”。而“透明覆盖”与CSAA相结合,能够生成大幅提升的图像质量。

4人已赞
第1页:不可思议的存在:GTX590发布第2页:第一章:NVIDIA GTX590产品解析第3页:首发产品:华硕GTX590第4页:首发产品:索泰GTX590极速版第5页:首发产品:映众GTX590第6页:首发产品:七彩虹iGame590第7页:首发产品:铭瑄GTX590第8页:首发产品:盈通GTX590第9页:三大双芯卡皇实物对比第10页:第二章:GTX590游戏3D性能测试第11页:DX10理论测试:《3DMark Vantage》第12页:DX11理论测试:《3DMark 11》第13页:Tessellation测试:《Heaven 2.1》第14页:DX11理论测试:《石巨人》第15页:DX11游戏测试:《尘埃2》第16页:DX11游戏测试:《异形大战铁血战士》第17页:DX11游戏测试:《地铁2033》第18页:DX11游戏:《失落星球2》第19页:DX11游戏:《H.A.W.X.2》第20页:DX10.1游戏测试:《孤岛惊魂2》第21页:DX10游戏测试:《孤岛危机:弹头》第22页:DX10游戏测试:《冲突世界》第23页:DX9游戏测试:《街头霸王IV》第24页:PhysX测试:《黑手党II》第25页:CUDA视频转码测试第26页:温度、功耗、噪音全面领先对手第27页:性能测试总结第28页:第三章:NVIDIA附加图形技术之灵活应用第29页:特色技术应用:NV 3D Vison Srround第30页:虚拟现实必经之路:CUDA光线追踪第31页:第四章:最强游戏即时渲染画面赏析第32页:DX10基准:《3DMark Vantage》画面赏析第33页:DX11游戏:《HAWX2》画面赏析第34页:DX11游戏:《地铁2033》画面赏析第35页:Tessellation软件:《Heaven》 画面赏析第36页:Tessellation软件:《石巨人》画面赏析第37页:DX11基准:《3DMark11》画面赏析第38页:第五章:令人兴奋的DirectX API发展历程第39页:号称实现“一切图形特效”的DX9C第40页:不应备受冷遇的DX10第41页:第六章:揭秘DX11技术革新第42页:DX11五大革新之:Shader Model 5.0第43页:DX11五大革新之:Multi-Threading第44页:DX11五大革新之:Texture Compression第45页:第七章 争论漩涡中心的Tessellation第46页:Tessellation(曲面细分)的前世今生第47页:Tessellation不仅仅会“细分曲面第48页:当Tessellation遭遇“法线贴图”第49页:曲面细分究极奥义 动起来更精彩第50页:当Tessellation遭遇“物理运算”第51页:第八章:DX11核心技术:DirectCompute11第52页:CUDA和Stream之争的内幕第53页:DirectCompute 10/11版本间的区别第54页:DirectCompute11的妙用:顺序无关透明第55页:DirectCompute11的妙用:电影级景深第56页:DirectCompute11的妙用:高清晰环境光第57页:第九章:GF100/110图形架构深入解析第58页:GF100构架八倍于上代旗舰的几何性能第59页:GF100/110和Cayman图形架构对比第60页:GF100/110图形架构:强大的多形体引擎第61页:GF100/110图形架构:第三代流处理器第62页:GF100/110图形架构:精兵简政的纹理单元第63页:GF100/110图形架构:一级缓存与二级缓存第64页:GF100/110图形架构:光栅单元高倍抗锯齿第65页:第十章:适合并行计算的Fermi架构第66页:Fermi计算架构:GPU的未来是并行计算第67页:Fermi计算架构:高效的双精度性能第68页:Fermi计算架构:首次支持C++编程第69页:Fermi计算架构:首次支持显存ECC第70页:Fermi计算架构:NVIDIA Nexus开发平台第71页:全文总结:该胜不胜与当败不败第72页:附录:追寻那些曾经的双核卡皇第73页:Rage Fury Maxx——曙光女神第74页:昙花一现的挑战者——XGI Volari V8/V5第75页:不为人知的经典——双核心9800Pro第76页:普及双核心——影驰双核7600GT第77页:GeForce 7950GX2——双拳出击誓夺王位第78页:ATI双核心——Gemini技术第79页:双G92核心的怒吼——GeForce 9800GX2第80页:55nm王者——GeForce GTX 295

关注我们

泡泡网

手机扫码关注