为王位而生 GeForce8800全面解析测试
● 第九章 第二节 耐人寻味8800GTX显卡设计
- 保守的设计,G80核心依然采用90nm工艺:
10月到11月间,NVIDIA和ATI竞相发布了多款采用80nm先进工艺的显卡产品,不由得让人感慨新工艺时代已经来临了。80nm工艺的优势已经在7600GT和X1950Pro显卡身上得到了完全体现,更小的核心面积意味着更低的功耗和发热量,量产之后成本可以降低20%,新工艺能够提高GPU频率上限,性能同比提升!更多80nm的优越性大家可以查看80nm的五大优势,既然80nm工艺有这么多优势,为什么NVIDIA还要使用较早的90nm工艺生产呢?
这是因为80nm工艺最近才开始量产,所谓的成熟也只是相对而言,简单具个例子台积电数月前已经宣布其65nm工艺开始投产,但是只能生产一些简单的数码、手机类芯片,对于动辄上亿个晶体管的GPU无能为力!而G80核心拥有恐怖的6.81亿个晶体管,是G71的2.5倍,在80nm制程良品率尚未达到非常好的值之前,NVIDIA为了保证产能和产品质量决不会冒险动用新工艺。成熟的90nm工艺虽然功耗大、发热大,但是良品率要高很多,而且产能充足,可以迅速投产快速占领市场!
其实回顾历史我们就可以发现G80的情形与去年G70惊人的相似:G70核心采用了成熟的110nm工艺,快速投产的7800GTX稳坐了将近半年的王者之位,ATI 90nm的X1800XT才对其造成了威胁,之后NVIDIA发布了更高频率的7800GTX 512MB成功的抵挡ATI攻势,暗中却在密谋90nm新工艺的G71核心——更高的频率、更低的发热、功耗和成本,这才是GeForce 7的真正实力!
竞争激烈的显卡市场永远都是先入为主,GPU采用何种先进工艺反而退居次要,想当年9700(150nm)战胜5800(130nm)、7800(110nm)战胜X1800(90nm)就是很好的例子。G80采用成熟的90nm工艺先发制人快速上市才是最明智的选择。等到明年80nm工艺成熟之后,再推出G81核心,进一步提高频率、降低功耗、发热和成本,NVIDIA在把握业界局势和市场形势方面显然要高明很多!
- 折衷的选择,768MB 384Bit GDDR3显存:
GPU的发展同CPU非常相似,性能越强就需要更高内存/显存带宽的支持,近年来显存频率节节攀升,从GDDR1到GDDR2再到GDDR3,如今采用GDDR4的显卡已经出货(ATI X1950XTX),同时显存控制器也从128Bit升级到了256Bit。所以很多人都认为下一代显卡将会采用512Bit显存控制器,然后搭配1GB以上容量的GDDR4显存。
然而G80的显存规格却令人出乎意料,NVIDIA为8800GTX配备了768MB 384Bit的GDDR3显存,8800GTS的显存更加奇怪640MB 320Bit!为什么NVIDA不使用先进的GDDR4显存,并且采用更改带宽的512Bit显存控制器呢?
其实512Bit显存控制器对于GPU来说不难实现,关键就在于PCB设计变得十分困难,512bit显存控制器就意味着光是信号线就需要在PCB上布出512条等长线路连接各片显存,这样必须采用14层以上的PCB才能良好的降低信号之间的相互干扰,显卡的制造成本成倍增加!
目前规格不凡的显存颗粒为16M×32Bit,组成512Bit的规格需要多达16颗显存,这样就对显卡PCB以及散热造成了沉重的负担,显存方面的成本也居高不下!至于GDDR4显存目前还不够成熟,0.9ns的GDDR4显存频率没有比GDDR3提高太多,反而是延迟变得更大,高延迟就意味着吞吐效率的下降。而且高电压的GDDR4显存在功耗控制方面并不理想,以现在的情形来看GDDR4的处境和当年首批GDDR2非常相似,如果不控制电压、提高存储密度、降低延迟,那么对显卡来说是一种负担!
可以说此次NVIDIA在显存的采用上非常谨慎,显存位宽使用了介于256Bit和512Bit之间的384Bit这种折衷的方案,如此一来需要12颗16M×32Bit规格的显存就能实现768MB 384Bit的方案,12颗显存都可以安置在PCB正面,一体式的散热器就能解决显存散热!而8800GTS的显存就更加灵活了,只要10颗显存就可以组成640MB 320Bit的规格。
8800GTX显卡768MB 384Bit的规格,容量和位宽都比7900GTX增加了50%,在成本与性能之间取得了平衡。而且显存也采用了三星目前最快的1.0ns GDDR3颗粒,理论运行速度可达2000MHz(默认1800MHz),带宽进一步提升,完全能够满足G80核心的需求!实际上G80的显存控制器已经能够支持GDDR4显存,只需对显卡PCB稍作改动即可,或许未来的“G81/8900GTX”显卡会使用GDDR4显存!?
- 独立的RAMDAC与TMDS整合芯片:
在8800GTX显卡的输出部分我们可以看到一个特殊的小芯片,乍看之下还以为是一个小型GPU,其实这是NVIDIA的一颗IO(输入输出)芯片:
由于G80的流处理器部分的工作频率高达1.35GHz,如果此时再将模拟部分的RAMDAC整合在GPU芯片内部,不仅在成本上无法控制,在输出质量上更是强差人意。为此NVIDIA将G80的模拟部分独立出来,做成单独芯片独立安装在显卡上。
独立的RAMDAC由于远离了GPU内部,使得电磁干扰显著降低。与此同时,NVIDIA还在NV10芯片中放入了TMDS和G80的视频输入输出部分。这样一来,G80不仅可以实现双头Dual-Link DVI的输出,还能够保持极高的输出质量。除此以外,NV10芯片还带来了真正10bit每通道的色彩输出能力,这要比ATI R580内部10bit色彩通道的设计明显更具优势!
所以说这颗NV10芯片其实就相当于是以往VIVO芯片的增强版,NV在7900系列中抛弃的VIVO功能被大幅增强,而且在安装ForceWare驱动时将会同步安装一体式的WDM驱动,使用起来非常方便!