续写“逢6必火”传奇 GTX 1060首发评测
NVIDIA在经历了四年基于28nm FinFET制造工艺制造GPU的漫长历史以后,基于Pascal GP104的GeForce GTX 1080首次迎来了16nm FinFET制造工艺升级。更高精度的“光刻”工艺允许GPU在单位面积的芯片上集成更多数量的晶体管,在同样的核心架构中,更加庞大的核心规模就意味着更强大的处理性能。所以16nm FinFET制造工艺能够给NVIDIA新显卡带来的能效提升是可以预见的,但是一直在超越自己的NVIDIA并没有被动享受制程进步的红利,反而在新一代的显卡中使用了更为先进的技术。这其中就包括GTX 1060使用的GP106核心。
GP106核心逻辑架构图
GTX 1060的GP106核心内建2组GPC和6个显存控制器,每个GPC包含5个SM,1个SM中集成了128个C UDA单元、8个纹理单元、256KB的二级缓存、96KB的共享储存空间以及48KB的一级缓存。从规格上来看,GP106更像是GTX 1080所使用的GP104核心在除显存控制器之外其它多数规格 砍掉一半而成的。
SM流式多处理器能够高度协调其中的CUDA核心以及其他功能元件的工作,这20个SM会参与到几乎所有GPU执行的所有命令中。GeForce GTX 1080拥有8个位宽为32bit的显存控制器,每一个显存控制器配有八个ROP单元和256 KB二级缓存。所以,完整GTX 1080的GP104核心共有2560个CUDA单元、256bit显存位宽、64个ROP、160个TMU以及2MB二级缓存。
GP106的核心晶体管数量为44亿,核心面积为200 mm2,略小于麦克斯韦家族GM206的227mm2,得益于16nm FinFET工艺的应用,每平方毫米的晶体管数量达到了22.9m,远远高于GM200。这也是GP106以及其它Pascal架构显卡能耗比如此高效的主要原因之一。此外,CUDA数量1280个,ROPs数量48个,TMUs数量80个。
NVIDIA将GPU开发工作的重点放在了设计Pascal核心架构的每一个细节中。Pascal之所有能够成为有史以来能效最高的GPU,原因不仅仅是16nm FinFET带来的制造工艺精进,更得益于持续提高的核心效率。NVIDIA工程团队的一大精力投入重点是GPU核心运行频率,橡木桶定律那样,GPU核心运行频率是由数以百万计的设计电路中速度最慢的那一路径决定的,所以这一最慢路径的优化对于GPU核心运行频率的提高是至关重要的。经过NVIDIA工程团队在这一领域的不断钻研,Pascal架构GPU相比前代有着40% 的运行效率提升。单靠16nm FinFET的制造工艺,是不能够带来如此高比例的核心频率提升的。