最后的莫希干人!全球最大显卡诞生记
POP编者注:万大善人,男,本文作者。喜爱军事、古典音乐、名牌服装、舞蹈,当然还有显卡和电容。金融业出身,但是最狂热的DIY玩家,早年曾为《电脑报》特约作者,后因爱好放弃金融业加入IT业,参与了耕升品牌在大陆的诞生、崛起的全过程。在耕升被同德收购后离开耕升,现就职于AMD公司,负责ATI显卡业务。从2001年以来万鹏除其本职工作外,业余一直为泡泡网撰稿,曾先后发表XXXXXX。本文完成于本周,是沉默数年后的万大善人第一篇重出江湖之作。未来是否会再有新作?我们不得而知。
相关作品:
蓝宝石(SAPPHIRE)X1950PRO DUAL研发代号是GODFATHER(教父)
2007年1月在拉斯维加斯CES2007上首次展出
2007年3月在德国CeBit2007上展示全球首个Quad CrossFire四核心交火系统
R600发布之前性能最强的ATI单卡,PCB面积、体积创民用显卡之最
● 引言:承其利而不知其惠者——愚也
2006年夏天一款厚重的显卡横空出世,它就是NVIDIA公司的GeForce 7950GX2。它的出现代表着现代高端显卡崭新的设计思路:一片显卡使用两颗低规格芯片并联,从而取代过去单颗高频高性能的板卡,追根朔源它与双核心CPU的概念是一致的。
此前两大显示巨头的GPU设计都遇到了一个瓶颈:即单颗GPU的性能受到成本、生产工艺、频率的限制而无法提升太高,如X1950XTX、7900GTX等显卡为了达到尽可能高的性能,不惜工本的提升运行频率,核心都达到650MHz,导致板卡周边成本非常高,两者的PCB都是12层,供电模块都使用了优异产品以便提供超过100安培的峰值电流,外加巨大的铜风扇,光这些零件的总成本接近100美元。
7950GX2的出现让很多显卡厂商有种峰回路转柳暗花明的感觉,实际上7950GX2就相当于是由两片廉价的7950GT显卡组成,核心频率只有500MHz,周边零件的成本大为降低,只要使用2片普通8层PCB组合在一起即可,供电模块的价格不超过5美元(个人评估7950GX2除芯片、显存外的总成本可能低于60美元,7950GX2双PCB的成本大概是7900GTX单PCB的一半)!
可是7950GX2的性能却超越了优异产品7900GTX,而且两片PCB显卡带给一般用户的印象都很震撼,庞大、厚重的显卡使很多发烧友都认为物超所值,因此形象非常好。看到双芯片显卡带来的优势,ATI当然不甘示弱,双核心显卡研发计划也在筹备中。不过由于R600的开发任务繁重,因此其把双芯片显卡的重心放到了R6XX系列上。实际上80nm的RV570性能很好,组成双核心显卡性能足以超越7950GX2,看到此商机一些有强大研发能力的厂商决定自己出手,自己设计一片双RV570核心的显卡,如华硕和蓝宝都推出了自己品牌的X1950PRO DUAL,本文谈论的主角就是蓝宝X1950PRO Dual。
● 双核心显卡研发思路:
双X1950PRO显卡的设计难度无疑远高于7950GX2,因为G71的工作频率只有500MHz,单核心的峰值功耗在50W左右,整卡的峰值功率大概在140W左右。而X1950PRO的频率高达575MHz,单颗芯片功耗大概70W,整卡峰值功率大概是180W左右,又没有现成的开发套件,因此能设计出双核X1950PRO显卡的厂商寥寥无几,目前只有华硕和蓝宝石。
将华硕和蓝宝石的两片X1950PRO Dual显卡放在一起做对比,前者厚重、庞大,双PCB设计看起来质感十足,如果单纯以貌取人的话,可能有很多发烧友会认为其“做工”更好,成本更高。而蓝宝的X1950PRO Dual则单薄许多,好像前者毫不费力就能战胜后者,果真如此么?
华硕双核心X1950Pro,仿7950GX2的设计
华硕的设计实力是非常强大的,从开始设计到拿出样卡前后可能不超过2个月时间,其样卡由两片重新设计供电的6层PCB构成,给很多消费者物有所值的感觉,其设计思路直接源自于7950GX2,开发难度小,进度空前的快,其研发过程堪称典范。当笔者带着巨大的问号询问蓝宝石的设计团队为什么不遵照华硕的思路进行时,其开发人员的回答简单的让人吃惊:因为我们想有的发烧友可能需要此卡能够Quad CrossFire!
从研发角度来看,华硕X1950PRO Dual其实相对简单,容易实现。因为有充裕的PCB面积摆放各种电子元件,采用低价大型电源即可满足设计要求,不过两片PCB组合的X1950PRO Dual加上大型散热风扇后将占用3个PCI插槽的位置,基本无法实现CrossFire功能,因此华硕干脆省掉了X1950PRO Dual的交火金手指。
而蓝宝则不同为了实现X1950PRO Dual的交火功能,控制显卡系统的厚度,必须使用单PCB双GPU方案,不同的战略导致不同的战术,整个蓝宝的研发团队都是围绕单PCB方案展开设计。复杂的问题往往有简单的答案,可是实现这个简单的答案却往往会付出艰苦的努力。正是为了发烧友追求性能极端的要求,蓝宝付出的将是什么代价?
- 单PCB集成两片X1950PRO显卡:
- 输出区与普通显卡无异:
- 双核心显卡的灵魂——PCI-E桥接芯片:
- 双核心显卡的心脏——供电模块:
● 双核心高功率,供电是个难题:
拿掉蓝宝石X1950Pro Dual显卡的散热器,首先映入眼帘的是2颗巨大的RV570核心芯片和一颗PCI-E桥接芯片,还有16颗显存芯片密布其上。如此多数量的大面积芯片在一片尺寸有限的PCB上布置(不能超过9英寸否则很多机箱无法放置),只能要求电源等其它元件尽可能的小。
此时问题开始出现:小型电源元件如何满足两颗RV570以及桥接芯片、16颗显存的巨大功率要求,单是RV570一颗芯片峰值电流就超过50A,而输出超过50A的传统电源元件包括MOS管的体积都相当庞大。为了解决这个异常矛盾的问题,蓝宝的研发人员花费了大量的时间来优化电源设计决方案,经过多种排列组合最后选定VOLTERRA公司三种电源芯片(整合MOS管)搭配PULSE公司的两组高磁蔽电感来解决。
为两颗GPU供电的是1颗VOLTERRA VT1165M(PCB背面)和4颗VT1165S构成的四项回路外加两组PULSE公司的双胞胎电感。VT1165S采用CSP封装,电气特性异常优良,面积非常的小,散热很好,如此微小的体积还包含了可通过25A电流的MOS。VT1165S的标称输出电流是25A,笔者测试可以达到30A以上的持续恒稳电流输出,除了成本高以外真的是完美无缺。4颗VT1165S并联共可以输出100A电流,足以满足两颗RV570的需求。
由于VT1165芯片的开关频率高于1MHz,而且工作温度很高,ESR(电容的等效串联阻抗)要求特别低,所以只能使用多颗MLCC(陶瓷电容)给电源滤波,蓝宝的方案是大约30颗左右村田制作所X7R等级10UF 0603 MLCC(一般所谓高档显卡上的铝、钽聚合物固态电容工作在超过300KHz的开关频率上,性能将急剧恶化,因此无法给此电源滤波)。另外值得一提的是卡上采用了两组PULSE公司特别为VT1165设计的PA1312电感,每组PA1312电感其实是两颗40A电感并联而成,相当于每组输出80A的超大电流,而体积却很精简,和VT1165一起堪称绝配。
由于每个RV570芯片各有8颗显存搭配,因此蓝宝工程师选用的电源是两颗CSP封装的VT233为之供电,VT233的面积比小拇指指甲盖还小,却包含了电源和MOS,可输出18A电流(8颗显存一般峰值电流合计是12A),应付显存超频所需的大电流绰绰有余。
这套豪华的供电模块优势很明显:电源芯片的体积小、输出电流大、集成度非常高,在显卡右上角仅占用了很小的PCB面积。由此看来双核心显卡的供电问题是解决了,可新的问题出现了……
● 超高集成度,显卡PCB布线难度大增!
为了解决在小面积PCB上提供大电流,蓝宝使用了CSP封装的多项电源芯片,可由于芯片复杂度太高,因此针脚也增加很多,随之走线也大为增多,又将给PCB设计带来很多麻烦,下表给出的就是X1950PRO DUAL显卡上主要芯片总的针脚数量,超过5700PIN!大家可以设想一下在如此之小的PCB上布线难度有多大,而且蓝宝X1950PRO DUAL显卡的PCB仅仅是8层。
芯片名 | 用途 | 设计公司 | 封装 | 数量 | 单颗针脚 | 合计针脚 |
RV570 | GPU | AMD | FCBGA | 2 | 1250 | 2500 |
GDDR3 | 显存 | 三星 | FBGA | 16 | 136 | 2176 |
VT233 | 显存电源 | VOLTERRA | CSP | 2 | 75 | 150 |
VT | GPU电源 | VOLTERRA | QFN | 1 | 40 | 40 |
VT1165S | GPU电源 | VOLTERRA | CSP | 4 | 41 | 164 |
PEX8532 | PCIE桥接 | PLX | PBGA | 1 | 680 | 680 |
合计 | 5710 |
为了更形象的说明此卡设计难度,这里举个例子:ATI目前最优异的显卡X1950XTX上主要元件总的针脚数大概在2000多,但是PCB是12层的。现在要将5700个针脚所引出的线布置在8层PCB之上,还要解决随之产生的可怕的电磁干扰问题,对任何一个PCB设计工程师来说都是一场噩梦。好在最后工程师们通过一些特殊手段(这些是技术机密不便透露)以及对PCB阻抗控制终于解决了此问题。
在蓝宝研发X1950PRO DUAL过程中碰到的问题不可谓不多,类似上面的工程问题多如牛毛,毕竟这样的卡太过复杂而且没有公版设计作为参照。以上众多工程问题只要一个不解决就足以毁灭团队长期辛苦努力的结果,还在他们最终克服众多环环相扣的困难,拿出了现在的产品。
● 蓝宝X1950PRO DUAL研发的意义和未来展望:
芯片名 | 用途 | 设计公司 | 封装 | 数量 | 单价 | 总价 |
PA1312 | GPU电感 | PULSE | 2 | 1 | 2 | |
VT233 | 显存电源 | VOLTERRA | CSP | 2 | 5 | 10 |
VT | GPU电源 | VOLTERRA | QFN | 1 | 3 | 3 |
VT1165S | GPU电源 | VOLTERRA | CSP | 4 | 3.5 | 14 |
合计 | 美元 | 29 |
再给大家看一个表格,一张蓝宝X1950PRO DUAL的电源芯片成本就高达30美元左右(VT系列电源芯片最大的问题就是价格太昂贵,比同类产品贵5到10倍),与之相对的7950GX2电源芯片成本在5美元左右,而面对呼之欲出的R6XX、G8X等显卡,X1950PRO DUAL的性能未必占很大优势,可是为什么蓝宝愿意花上如此巨大的代价和漫长的时间来研发1950DUAL呢?
问题的答案之前就说过,仅仅是为了满足发烧友对显卡速度的追求。此时笔者的脑海里闪现了一个场景:最后一个莫西干骑士昂着高昂的头独自一个人去战斗,只是为了追求尊严,虽然未必能够胜利,但这已足够了。在ATI R5XX和NV G7X即将换代之际,仅仅为了对速度对于做工的终极追求,蓝宝仍然投入大量人力物力开发自己的X1950PRO DUAL显卡,其研发过程仅仅是工程界为了追求完美而做出的千方百计努力的一个小小的例子,但表达的精神却足以让人敬佩。
后记:当然付出那么大代价蓝宝也不会白费力,因为未来的RV670乃至更新一代R7XX显卡很多都将采用DUAL CORE的方案,在此卡开发上积累的经验必将融入蓝宝(ATI)新一代高档显卡庞大的身躯中。笔者作为一个发烧友好不容易见到一款与众不同的高档显卡心喜不已,故忍不住写之,希望大家看完后能对工程人员的辛苦稍有了解。
最后:本文得到AMD、蓝宝和VOLTERRA公司相关人员的大力协助对此深表感谢。
参考文献:
1. VOLTERRA公司:VT1165M_ds_2005_12_8
2. VOLTERRA公司:VT1165S_ds_2006_04_10
3. VOLTERRA公司:VT232W/233W
4. AMD公司:chs-215rv570-02
5. PLX公司:PEX8532AA_BA_BB_Data_Book_V1.4_01AUG06<