引爆游戏视觉革命!NV助力游戏业发展
七个月之后,NVIDIA发布了GF100核心的改进版本——GF110,直接对应的零售产品就是GTX580。大家已经知道,GTX580从某种角度上来说是GTX480的改进版本,首先是弥补了GTX480在流处理器数量上的遗憾,从GTX480的480个流处理器提升到了512个流处理器,这样在显卡的3D性能上就有进一步的提升。
GTX480是通过在GF100核心上屏蔽了一组SM流处理器簇将原本的512个流处理器降到480个的。而在这个架构中,一个SM并不只是有32个流处理器,还包含16/48KB的动态分配缓存、4个纹理单元和一个多形体引擎。所以,GTX580相对于GTX480从硬件规格上来看并不仅仅是提升了32个流处理器,准确的说是提升了一个SM。看过我们之前的GTX480架构解析的朋友应该知道,GTX480是通过在GF100核心上屏蔽了一组SM(流处理器簇)将原本的512个流处理器降到480个的。而在这个架构中,一个SM并不只是有32个流处理器,还包含16/48KB的动态分配缓存、4个纹理单元和一个多形体引擎。所以,GTX580相对于GTX480从硬件规格上来看并不仅仅是提升了32个流处理器,准确的说是提升了一个SM。
● 16/48KB动态分配缓存
GF100/GF110核心的缓存设计非常有意思,采用的是L1和共享缓存动态分配总容量为64KB缓存的设计,这部分缓存可配置为16KB的一级缓存+48KB共享缓存,或者是48KB一级缓存+16KB共享缓存。这种划分方式完全是动态执行的,一个时钟周期之后可自动根据任务需要即时切换而不需要程序主动干预。
一级缓存与共享缓存是互补的,共享缓存能够为明确界定存取数据的算法提升存取速度,而一级缓存则能够为一些不规则的算法提升存储器存取速度。在这些不规则算法中,事先并不知道数据地址。
● 4个纹理单元
顾名思义,纹理单元就是专门用于渲染3D物体表面纹理的模块,在图形纹理越来越复杂的今天,纹理单元的重要性不言而喻。GTX580因为相对于GTX480增加了一组SM,所以纹理单元数量也得到了相应的增加。
在GF100/110架构中,每一组SM中包含4个纹理单元,完整版的核心中一共有16个SM,所以GTX580一共拥有64个纹理单元,而GTX480由于屏蔽了一组SM,所以只有60个纹理单元。
值得一提的是,GF100/110架构中的纹理单元直接集成到了SM内部,且每组SM中拥有独立的纹理缓存(4个纹理单元共享这部分独立的纹理缓存),这样的设计打破了之前纹理单元一直被设计在SM外围的传统,有效的提升了纹理效率。虽然从纹理单元的数量方面来说看起来比GT200架构还少,但实际效率却高很多。