角逐图形领域的王者之位,GeForce
面对ATi去年夏天突然袭来的Radeon9700 Pro,nVIDIA并没有选择已经成熟的0.15微米工艺来生产GeForce FX,而是选择了更为超前的0.13微米生产工艺,并且首次在图形卡上采用DDR-II内存解决方案。很显然nVIDIA寄希望于GeForce FX无论在技术上还是在性能上彻底打垮对手,从而捍卫显示芯片霸主的地位。
与以往不同的是,nVIDIA这次选择了显示芯片的发布与上市分离的策略。从11月18日的GeForce FX的发布直至两个多月后才提供了可测试的样品。今天我们迎来的“GeForce FX”是否真的是我们期盼的“GeForce FX”呢?nVIDIA能否依靠它击败对手呢?
革命性的0.13微米生产工艺:
与ATi的300选择的0.15微米生产工艺不同,nVIDIA毅然选择采用TSMC(台积电)的0.13微米生产线来生产GeForce FX GPU。要知道当时TSMC(台积电)的0.13微米生产还不成熟,做出这样的选择具有很大的风险性。
GPU同CPU一样,频率和效能提高靠的是更先进的生产工艺和更复杂的流水线,所以依靠0.13微米铜互联工艺使得GeForce FX核心频率可以到达500MHz,而0.15微米工艺制成的Radeon 9700 Pro核心频率则只能达到300MHz左右。其次,0.13和0.15微米生产工艺相比在使用同样数量的晶体管时芯片面积更小,拥有更低的生产成本,而且0.13微米生产工艺为GeForce FX减小了三分之一的功率消耗,发热量方面也减小甚多。
当然,nVIDIA为选择0.13微米生产工艺也付出了一定代价,在推出时间上较0.15微米工艺制成的Radeon 9700 Pro落后了近半年之久,其中的主要原因就是nVIDIA在等待TSMC(台积电)0.13微米技术的成熟和新生产线的量产。当然这些担心对于现在来说都是多余的,因为在去年12月16日TSMC(台积电)已正式宣布0.13微米生产线投入量产,而GeForce FX GPU则是这条生产线的处女之作。
相比之下,ATi更倾向于继续使用成熟的0.15微米生产工艺,包括不久将推出的R350、RV280等显示芯片也都仍沿用的0.15微米生产工艺。我们暂且不去评论选择哪种生产工艺更合适,起码来说nVIDIA选择0.13微米生产工艺更具更前瞻性。未来即将推出的NV31和NV34都将一并采用0.13微米生产工艺,新的工艺带来的低成本、低功耗都会使消费者直接受益,同时,nVIDIA表示5个月之内GeForce FX的下一代产品NV35就会推出,研发速度之快得益于GeFore FX打下的良好基础。反观ATi方面,R300的推出一年后采用0.13微米工艺生产的R400才能有望推出,而面向中低端市场的0.13微米产品RV350的推出也已经是今年第三季度以后的事情了。不过依靠成熟的0.15微米研发的R300,动作之快、性能之优秀似乎也实在出乎了当时nVIDIA的预料吧,nVIDIA失去了长达半年的显卡性能的宝座。
具有挑战性的DDR-II显存:
提高显存带宽对于Radeon 9700 Pro和GeForce FX这些新一代显卡来说显得尤为重要,否则拥有处理能力强大的GPU,而没有搭配合适的显存,就是好像是一把好枪而没有子弹可以射击一样,因此ATi和nVIDIA都格外注意产品在显存架构的设计。
目前,提高显存带宽主要有两种途径,一是直接提高显存的运行频率,二是增加显存位宽,nVIDIA与ATi却恰恰分别选择了这两种不同的方式。GeForce FX搭配了速度高达1GHz DDR-II显存,其速度远远超过了目前广为采用的DDR显存,而Radeon 9700 Pro上则没有搭配高速的DDR-II显存,但是其通过设计更多的内存总线来提高总的显存带宽,256bit显存总线的Radeon 9700 Pro相对于128bit显存总线设计的GeForce FX来说,在频率一致的情况下前者显存带宽就要大一倍。
虽然GeForce FX的显存运行频率很高,但是相对于Radeon 9700 Pro来说还是略微吃亏,从下面显存带宽的对比表中我们看到,高位宽为Radeon 9700 Pro带来了非常高的显存带宽,而高的显存带宽在性能上则直接反映在高分辨率抗以及锯齿时更好的性能表现,下面让我们来举一个简单的例子:
如果现在有一组128bit数据需要传递至显存,那么在GeForce FX上需要的时间大约是1ms,而在Radeon9700 Pro上大约是需要1.6ms,这也是在非常好的的状况下GeForce FX领先的幅度了,即使数据包再小也不可能突破这个领先的优势。那么如果现在有一组256bit的数据包的话,那么情况会怎么样呢?GeForce FX大约需要2ms才能传完,而Radeon 9700 Pro同样只需要1.6ms即可完成,让我们把一组数据包的容量增大到512bit,Radeon9700 Pro每1.6ms可以传完一组128bit,两组的话需要3.2ms,而此时GeForce FX需要4ms。可以看出如果数据包越大的话,GeForce FX显存位宽的压力就越大,这就不难解释为什么在越高分辨率下若开启了各项异性抗失真或者全屏反锯齿之后,GeForce FX的下降幅度要比Radeon9700 Pro更大一些的原因。<