轮番拷问！专访NVIDIA GPU事业部经理-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 新闻 / 正文

轮番拷问！专访NVIDIA GPU事业部经理

2010年04月13日 00:02作者：孙敏杰编辑：孙敏杰文章出处：泡泡网原创

★ 泡泡网

问题一：从GTX285到GTX480，NVIDIA优异GPU内部的CUDA核心数目翻了一倍（从240到480个）甚至更多（完整规格应该是512个），但显存带宽却没有增加多少，即便它使用了最新的GDDR5显存，那么是不是显存带宽一定程度上限制了GTX480的性能发挥？

GTX480的显存带宽并不比GTX285和HD5870高多少

问题二：GTX480所使用的显存颗粒与对手HD5870完全相同，这种GDDR5理论运行频率可达5000MHz，HD5870的默认显存频率是4800MHz，而GTX480的频率仅为3700MHz，为什么两者的差距如此之大？是NVIDIA的显存控制器设计有BUG呢？还是NVIDIA对于GDDR5的特性尚未完全掌握？

左：GTX480的显存右：HD5870的显存

Drew Henry：NVIDIA拥有世界上最优秀的GPU工程师，而我们的Fermi架构以及基于Fermi架构的GTX480/470产品也是由这些最好的工程师们所设计的。所以我不觉得在产品设计上他们遇到了什么问题，应该说他们成功的完成了当初所制订的设计目标。

Fermi是一种全新的架构，显存管理方式完全不同于上代产品，跟竞争对手的产品更不具可比性。

在GF100 GPU内部，一级、二级缓存都经过了重新设计。一级缓存方面，除了保留传统的一级纹理缓存外，NVIDIA还设计了全新的一级数据缓存和一级共享缓存，可动态的在16K或48K之间切换。二级缓存则是一整块768KB容量的缓存，让所有的SM和CUDA核心都可以共享使用，而GTX285和HD5870都是分离式的缓存，不但容量小而且利用率较低。

GF100的缓存架构让各流水线之间可以高效地通信

在一级二级缓存利用效率提高的同时，大大减少了显存读写操作，也提高了显存空间利用率，强化了多线程密集型数据处理能力。正因为改良的多层级缓存架构，使得GF100对于显存带宽的依赖程度大大降低，因此GTX480没必要使用高位宽、高频率的显存，即便带宽维持在与上代产品相同的水平，也能提供非常强悍的性能。

所以，你要看整个架构有多快，而不是单独看访问内存的速度，更不能单纯的比较NVIDIA和AMD的显存带宽，因为两者的架构差异实在是太大了。

许哲铭：我补充一下，GF100是近年来架构变化最大的一款GPU，因此单纯在某些局部技术和设计方面与上代产品或竞争对手的产品做对比是没有意义的，我们应该从全局考察一款产品的性能，比如游戏性能、计算性能、Tessellation性能等等，GTX480领先GTX285的幅度都在1.8倍以上，这足以说明显存不但不是瓶颈，而且效率更好。

0人已赞

第1页：NGF2010召开，NVIDIA高层接受专访第2页：PCPOP：GTX480的GDDR5显存是瓶颈？第3页：IT168：GTX480如何对抗双核HD5970 第4页：ZOL：Fermi架构有什么遗憾吗？第5页：INPAI：CPU整合GPU对独立显卡有何影响第6页：其他媒体：GF100刚上市就开放非公版第7页：台湾电子时报：XFX退出AIC有无影响

轮番拷问！专访NVIDIA GPU事业部经理

关注我们