泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

八核+七卡!泡泡网DIY个人超级计算机

    泡泡网显卡频道11月21日 自从一代经典GeForce 8800GT之后,在中高端显卡上我们很难再见到单槽设计的版本了,双槽早已成为标配,三槽甚至巨型散热器都见怪不怪了,高端显卡似乎只有搭配巨型散热器才拿得出手,显卡的散热解决方案进入了一个怪圈。

    GPU集成的晶体管数越来越多,导致功耗和发热量大增,传统单槽散热器因为散热面积有限,难以胜任动辄几百瓦功率的要求,因此多槽散热成为必然。不过GPU的工艺制程一直在不断升级改进,新工艺能够缩小GPU核心面积,并降低工作电压,从而很好的控制功耗和发热。

    就拿NVIDIA的中高端主力GTX260+来说,在55nm工艺的帮助下,新版不但性能提升显著,而且功耗和发热下降不少。但由于各大厂商依然使用老的GTX260设计方案,新核心的优势不但没有发挥出来,反而变本加厉的通过增加供电相数、安装巨型散热器的方式让显卡看上去更“威猛”,这种本末倒置的做法其实并没有给消费者带来多少好处。

    国内AIC影驰则打破常规,从设计之初就通过优化供电模块、适当降低电压的方式,控制了显卡的功耗,而散热器则使用了全新的定制版本,全球首款单槽设计的GTX260+就此诞生!

    单槽的设计使得我们可以在一台电脑中插入七片影驰GTX260+无双版,再搭配四核八线程的Core i7处理器,“八核+七卡”的配置在性能上足以媲美超级计算机,那么如此强悍复杂的配置该如何使用呢?他们到底能否长期稳定工作?性能如何呢?

难以想象的轻薄!影驰GTX260+无双版外观赏析

    当大家习惯了高端显卡默认双槽的设计方案之后,第一眼看到影驰GTX260+无双版时,只能用惊艳二字来形容。

    纤细身材、简约高雅、精致外观——影驰GTX260+无双版绝对是非公版显卡中的典范,浑然一体的设计使得该卡特色鲜明,整体造型不输给NVIDIA和ATI的公版卡。

    美中不足的是,这个铝合金外壳只覆盖了散热器表面,未能将输出接口也囊括进去,否则GTX260+无双版一体式的造型将会更加精美。

    输出接口也非常简约,使用率越来越高的HDMI无需转接直接提供,Dual-Link DVI加装了金属屏蔽罩,保证30寸显示器超高分辨率输出,DVI也可以转接支持D-SUB,挡板还有剩余空间所以保留了并不常用的S-Video。

完全超越NV公版!影驰GTX260+无双版PCB做工用料解析

    GTX260(+)总共有三种公版PCB,NVIDIA经历了三次缩水才将显卡降至千元价位,当然这其中55nm工艺功不可没。事实上显卡做工再好都没用,更低的功耗与发热对于消费者来说才是最实在的。


从上至下分别是P651、P654、P897版GTX260+


影驰GTX260+无双版

    影驰GTX260+无双版的做工和用料虽然不及前两种公版,但比最后一种P897公版还是要强很多,全固态电容、磁蔽电感、清晰合理的布局看起来有赏心悦目的感觉。

  

    GT200核心和NVIO芯片就无需多言了。显存方面,GTX260+无双版使用的是现代H5RS5223CFR-N2C颗粒,14颗全部分布在PCB正面,散热无需担忧。尾号N2C的显存是0.8ns的颗粒,理论频率可达2400MHz,不过GTX260+的默认频率完全按照公版标准,核心/流处理器/显存分别为576/1242/2000MHz,这意味着该卡拥有不小的超频潜力。

    供电模块设计非常整齐紧密,这是考虑到安装MOS散热片的需要,同时也保证了显卡体积不会太大,并与单槽散热器很好的兼容。

纯铜散热片+真空腔均热板!影驰GTX260+无双版散热器拆解

    影驰GTX260+无双版最大的亮点就是全球优异单槽设计,因此这个单槽散热器值得仔细研究一番,看看它有何德何能胆敢压制近200W TDP的GPU。

    取下散热器,从底部来看似乎并无过人之处,结构类似于GeForce 6/7时代的公版散热器,能够将核心、显存、NVIO三大芯片全方位照顾到。

    取下散热器面罩之后,就可以发现原来整块散热片都是纯铜的,采用精良的回流焊工艺制造出了密密麻麻的散热片,通过侧吹式方案带走GPU热量。铜的热传导率远高于铝,但成本很高而且密度很大。所以影驰GTX260+无双版虽然体积很苗条,但重量甚至比很多双槽GTX260+还要大!

    可以看到,在纯铜散热片底部,并不是普通的铜底或者热管,而是一块超大面积的真空腔均热板,它负责把GPU的热量迅速传递给每一张散热鳍片,使得热量平均分布,提高散热效率。

    大家都知道GTX 260这样的显卡,NVIO芯片散热也是需要考虑的。但受限于体积,不可能为它单独设计散热片。而且,显存同样需要散热,所以散热器外壳采用了一体式设计,兼顾显存、NVIO芯片散热。而且铝基板采用了精度高的压铸工艺,保证散热的同时,机构强度高,刚性好,无需为显卡设计防变形金属条。

    供电部分因为电容和电感体积较大的关系,一体式散热片不能延伸至发热很大的MOS部分,因此这块单独安装了铝制散热片,散热器出风经过此处可以辅助散热。

    通过图片可以看到,这款单槽散热器的成本并不低,为了严格控制体积付出了很多努力。正是由于优秀的风道设计、密集的纯铜散热片、大面积真空腔均热板,因此影驰GTX260+无双版才能以单槽设计压制高端GPU。

单槽散热靠谱吗?影驰GTX260+无双版温度测试

    硬件配置上确实很强大,但实际散热能力究竟如何呢,风扇转速高不高、噪音大不大?我们还是通过实际测试来检验吧。

    首先,在启动的那一瞬间,GTX260+无双有点象NVIDIA高端公版卡,部分笔记本电脑也是这样设计——风扇全速运转。不过,显卡自检的一瞬间过去后,显卡就恢复了低速转速,即便是满载也没有出现过全速转动情况。整体来看,显卡可以说是比较安静的,噪音控制的不错。

    运行FURMARK稳定性测试,分辨率设置为1280×1024,长时间运行,显卡始终工作在40%转速下,噪音非常小。而在温度方面,最高温度在82度。尽管这样的温度在笔者了解到的GTX260中算是比较高。但单槽散热能以很低的噪音保证显卡的长期稳定运行,的确难能可贵。

    在实际游戏《街霸4》BENCHMARK循环测试中,显卡的负载明显没有Furmark那么苛刻,此时GPU温度一直保持在68度刻度线以下,看来正常用的时候,显卡温度还是比较低的。

    在把风扇手动调味全速情况下,显卡空载温度迅速降到了42度。然后运行FURAMRK稳定性测试,来模拟显卡极限满载运行。这时候,显卡温度最高不超过70度,看来高转速模式下的散热能力还是很强的,但此时噪音很大,除非有特殊需要否则不推荐强制全速,因为显卡风扇支持PWM温控技术,在高温下会自动加速。

    综合来看,GTX 260+无双几乎在整个运行过程中都比较安静,噪音也比较小,符合影驰官方宣称的低噪音;在散热效率方面,风扇低转速时显卡满负荷最高温只有80度左右,并不高,而长时间运行大型3D游戏,显卡温度低于70度,可以说是比较凉快。在全球最薄的体积下,实现又凉又静,可以说是很难得,散热出色设计可见一斑。

单槽的极致用法!超级计算机平台登场

    单槽的设计使得我们可以在一台电脑中插入七片影驰GTX260+无双版,当然需要特殊的主板才可以,一般的高端主板最多能插入3-4块显卡。笔者所使用的主板就是华硕的P6T7 WS SuperComputer(X58)主板,从型号上就可以看出定位于工作站,专门用于组建个人超级计算机。

  

    ASUS P6T7 WS SuperComputer是一块标准的X58+ICH10R主板,支持LGA1366接口的Core i7处理器以及三通道DDR3内存。与普通X58主板不同的是,这款主板没有提供任何普通PCI或PCI-E X1插槽,全部七条都是PCIE-E X16接口,最多可以插上七片显卡。

    X58北桥内建32条PCI-E通道,最多能提供4条PCI-E X8接口供显卡使用,那么这7条插槽从何而来呢?秘密就藏在这个一体式散热片下面:

    原来华硕在主板上一次性整合了两颗nForce 200芯片,每颗都可以将16条PCI-E通道桥接成32条通道,这样X58北桥的32条PCI-E通道就变成了64条,最终提供16+8+8+8+8+8+8这样的七条PCI-E插槽,如果不是主板PCB空间不够用的话,相信设计8条PCI-E X8插槽也没问题。

    PCI-E 2.0的带宽是1.0的两倍,因此PCI-E X8绝对不会限制当今主流中高端显卡的性能发挥,同时插7片显卡不成问题。

绝对不是作秀!七卡互联效果显著稳定如初

    NVIDIA的驱动对多卡互联有限制,最多只能支持三卡互联,也就是3-Way SLI,如果是Quad SLI的话,必须是两片9800GX2或者GTX295这样的双核心显卡才能开启。

    而且三路SLI必须使用专用的三路桥接器才能在驱动当中开启,多余的显卡被孤立,最多只能允许一片当作物理加速卡使用。因此对于游戏玩家来说,只需要四片显卡就够了,更多的话毫无用处。

    那么我们插满七块显卡有什么用呢?连SLI桥都没办法插(像交火那样级联是无效的),仅仅是作秀、看上去壮观而已?当然不是!除了游戏外,我们应该把目光转移到CUDA通用计算上面来,大规模并行计算并不需要显卡协同工作,不需要SLI桥相连,更不需要驱动对多卡支持……

    因为并行计算本身就是多线程多任务模式,如果软件自身能支持多GPU的话,就能自动将任务均分给每颗GPU运算,最后合并起来达到加速的目的。如果软件不支持多GPU的话,可以同时开启多个软件分别指定不同的GPU来运算,同样可以让性能倍增,道理与四核CPU同时跑四个SuperPi一样!

    七卡并行计算的注意事项:

  • 必须关闭SLI;
  • 必须在六块从卡上扩展桌面,确保每块显卡都处于激活状态;
  • Vista不支持扩展桌面,必须连接显示器或者欺骗的方式才能激活从卡,XP对于多卡支持最好、Win7次之,建议使用64bit系统;
  • 主卡负载不宜过高(不要开启3D或者硬件加速程序),否则容易失去响应;
  • 电源和散热是个大问题;

    经过笔者反复测试,7片影驰GTX260+完全可以同时稳定运行,七卡同时跑了整整一个晚上第二天上班依然稳定如初!但由于7片显卡挨太紧,散热方面必须特别注意,笔者使用了两个12CM风扇,一个吸一个吹平放在7片显卡上方,就能完美解决散热问题。

GPGPU Benchmark基准测试

    目前支持通用计算的测试程序并不多,前不久发布的DirectCompute和OpenCL测试软件都是Beta版,都不能支持多GPU,唯一能支持多GPU和多卡的测试程序就是SiSoftware Sandra 2009 SP4中的GPGPU Benchmark,笔者首先用它来测试多卡的稳定性,并评估效能。

  
单卡和双卡成绩

  
三卡和四卡成绩

   
五卡和六卡成绩


七卡成绩

    SiSoftware虽然能够支持多卡和多GPU,但兼容性还是不好,效率不够高,三卡性能甚至不如双卡,五卡比四卡提升有限,显卡越多效率越低,七卡的性能只相当于单卡的四倍,那么在实际应用中的表现如何呢?

蛋白质折叠计算:七卡就是七倍性能!

    一般的商业CUDA软件都只能支持单GPU,而且无法利用高端显卡全部的性能,像Badaboom这样经过特别优化的软件也只能支持双GPU。虽然很多专业CUDA计算软件能支持N多GPU,但民用通用计算软件只有Folding@Home(蛋白质折叠计算)和SETI@home(天文数据外星文明分析)这两个分布式计算支持多GPU。

    Folding@home是一个由斯坦福大学主持,全球主要硬件厂商共同参与的大规模公益性分布式运算项目。其主要是研究了解蛋白质折叠、误折以及相关的疾病,主要研究的疾病包括:癌症、阿兹海默症、亨廷顿病、帕金森氏症等。我想,这是一个比单纯跑各种Benchmark来得更有价值的事情。

    将Folding@home程序目录复制7份,各自分配不同的机器号并指定不同的GPU,这样7个蛋白质程序就能互不干涉的各自独立运行,由于7个程序全靠GPU运算,因此CPU占用率非常低,完全不会影响普通2D软件的运行。

    运行几个小时之后,性能估值已经出来了,7块显卡的PPD分值(Points Per Day每日运算得分)都是7000多,总分值高达53K,已经和国内第一强人65K的成绩相差不远了。

    通过内置的Benchmark测试来看,每片GTX260+都能够达到7K左右的PPD,七卡插一起的性能和单卡相比基本没有损失,但由于网络不稳的关系,长时间运行的话,个别数据包算出来的平均PPD会有所下降。

功耗测试:双电源消耗多少电力

    GTX260+的TDP(最大功耗)是170W左右,7块GTX260+就需要1200W,再加上CPU主板内存的话,总功耗达1500W可能还不止。为此笔者特意使用了Silverstone通过三路SLI认证的1500W电源,结果发现电源功率不是问题,接口数量才是最大的问题……

    7块显卡,总共需要14个6Pin PCI-E接口,Silverstone 1500W电源提供了6个6pin(和8Pin) PCI-E供电接口,即便使用双4Pin转6Pin的转接线,将所有4Pin口用光也无法连接所有的显卡。迫不得已使用了双电源,每个电源各自承担三块半显卡的电力。

    两个电源的24Pin输出线缆可以通过一个转接线并连在一起,这样双电源就可以随电脑同步开机或关机。两个电源插在同一个插线板上,这样通过电表就能测出双电源的总功率了:

    通过实测发现,待机状态下系统的总功率就高达572W,包括一颗i7 965(3.2GHz关闭节能),6GB DDR3-1333内存,2TB硬盘,主板,还有四个风扇。

    3D类的软件无法让这么多显卡同时运行,笔者只好通过运行7个Folding@home程序测出最高功率,此时7块显卡在拼命工作(但不一定是满载),而i7 965基本处于空闲状态,最终功率稳定在了1000W左右。

    事实证明一个1500W电源可以带动如此强大的配置,只是电源接口确实不够用,所以还是两个800W电源更合适一些,而且划算。

“八芯八卡”达成,性能再提升


6片GTX260+无双加上1片GTX295

    P6T7 WS Supercomputer最多提供了7条显卡插槽,只能插7片显卡,而且前6片必须是单槽的,但第7片可以插双槽显卡,如果我们把第7片显卡换成GTX295的话,那么就总共拥有8颗GPU了:

    通过理论测试来看,8颗GPU的性能又获得了不少的提升。也许有人会说直接插四片GTX295的话,不也是8颗GPU么,理论性能更高。不过四片GTX295的成本太高,而且GTX295作为双核显卡如果运行在PCI-E X8模式下性能损失会比较大。

影驰GTX260+无双版的适用人群:


一张卡占三个槽,这谁受得了?

  • 电脑PCI插槽比较紧张的用户,无双版不会影响其它扩展卡;
  • 想要组建双路或三路SLI的用户,单槽设计节约空间而且互不影响散热;
  • 多屏输出且有3D需求的用户,GTX260+ 3D性能出色,而且能插很多片;
  • CUDA通用计算用户,多块能达到优异性能。

全文总结:

    通过SiSoftware的GPGPU理论测试来看,多卡的效率并不出色,显卡越多效率越低。而且N卡本身就存在理论性能较弱、双精度性能远远落后与A卡的情况,相信大家通过测试截图也看出来了。

    但在实际应用测试中可以发现,根本不是那么回事,有几块显卡,并行计算性能就能提升几倍,完全没有任何的性能损失,这就是并行计算的优势。而且N卡在F@H中的运算能力要远高于同级A卡,理论与实际的效能差距之大让人难以想像。

    多GPU运行分布式计算的效率如此之高,可以预见在不久的将来,无论国家和企业的超级计算机还是个人高性能计算机,都将会是GPU的天下。一块主板只能安装一颗CPU,但显卡却能插很多块,而且GPU的运算能力远远超越了CPU,扩充升级显卡显然要比CPU更加简单方便!■<

0人已赞

关注我们

泡泡网

手机扫码关注