彻底征服4K游戏 GTX 1080Ti首发评测
去年5月7日NVIDIA发布了新一代Pascal架构显卡GTX 1080,曾经叱咤风云的上代旗舰GTX 980Ti黯然退位。298天后,在旧金山的发布会上黄仁勋再一次让以”Ti“为名的显卡回归到了“卡皇”宝座。这就是我们今天的主角——NVIDIA GeForce GTX 1080Ti。
“10系”显卡收官之作
NVIDIA用298天完成了“10系”显卡从旗舰到入门的全覆盖,GTX 1080Ti不出意外也将是这一系列的最后一位成员。是的,这次GTX 1080Ti并没有在芯片的底层架构上进行本质上的调整,依然是一脉相承的16nm Pascal架构核心。
除GTX 1050和GTX 1050Ti采用三星14nm FinFET工艺之外,其它“10系”显卡均使用台积电的16nm FinFET工艺制造。两者相比前代Maxwell核心的28nm工艺可以在更小的芯片面积上集成更多的晶体管,核心面积减小也就使得功耗水平之大幅下降,大幅改善的电气性能使得核心频率得以显著提高。再加上NVIDIA全新的Pascal架构,这一代产品在制程架构双双升级的助推下,“10系”显卡成为了史上效能最高的一代产品,性能提升达到了空前的程度。GTX 1080在CUDA数量和TDP均少于GTX 980Ti的情况下,获得了高达20%以上的性能优势。
这将近一年的时间里,NVIDIA在老对手AMD高端产品缺席的状态下凭借性能强大GTX 1080和GTX 1070彻底占领了高端显卡市场。而中端的GTX 1060两个版本在与对手的RX 480厮杀之后取得了性能和市场的明显优势。唯一稍有遗憾的是系列中仅有的采用14nm工艺GP107核心的两款千元级显卡——GTX 1050和GTX 1050Ti,在桌面产品竞争中性能上没有战胜降价后的RX470。
移动显卡迎来性能爆发
但墙内开花墙外香,GP107核心的GTX 1050Ti、GTX1050与其他“10系”移动显卡一起一举将游戏本的性能水平提升到了桌面水平,填平了以往游戏本和桌面平台的性能鸿沟。但这还不是“10系显卡”和Pascal架构的全部征程。
NVIDIA Jetson TX2也使用了Pascal架构
除了在传统的图形行业发力外,NVIDIA把Pascal架构延伸到了更多的领域。深度学习、自动驾驶、超级计算、人工智能等等行业都有着Pascal架构的身影。以至于第一款Pascal架构的产品并不是用于游戏,而是面向各种高性能通用运算的Tesla P100。而我们今天的主角GTX 1080Ti所使用的就是与Tesla P100有着千丝万缕联系的GP102核心。
GTX 1080Ti 规格参数
从规格上来看,虽然名为“GTX 1080Ti”但事实上和GTX 1080在规格上基本上没有关系,反而与之前发布的NVIDIA TITAN X使用了规格几乎相同的GP102核心,仅屏蔽了8个ROPs。同时显存从12GB减少到了11GB,由于显存颗粒减少一颗,显存位宽也减少到了352bit。阉割的同时NVIDIA选择了用频率来弥补性能损失,最高频率从1531MHz提升到了1582MHz,后续推出的非公版产品频率会更高一些。
GP102-350核心解析
GP102-300核心逻辑架构图
GTX 1080Ti的GP102-350核心内建6组GPC和11个显存控制器,其中4个完整的GPC包含5个SM,另外两个GPC只有4个SM,每个SM中集成了128个CUDA单元、8个纹理单元、256KB的二级缓存、96KB的共享储存空间以及48KB的一级缓存。
SM架构图
新一代GDDR5X显存
NVIDIA在GTX 1080Ti上使用l了与美光联合研发的新一代GDDR5X显存,通过一系列努力在减少了信号串扰并且在通道、翻译等方面进行了优化,从而使频率从GTX 1080的10GHz提高到了11GHz,同时有效控制了功耗水平。
显存平铺Tiled Caching技术
传统的缓存架构与TILED缓存架构对比
另外,GTX 1080Ti还支持了显存平铺(Tiled Caching)技术,可以进一步提升渲染效率和显存性能,提升显存带宽利用率,再加上显存压缩,理论上可以让等效带宽达到1200GB/s的恐怖水平。
Tiled Caching技术和普通显存带宽对比<