泡泡网显卡频道 PCPOP首页      /      显卡     /      新闻    /    正文

个人电脑新纪元!GPU超级计算机诞生

    从2008年超级计算机排行榜可以看出,由21万颗CPU核心组成的蓝色基因曾连续四年霸占超级计算机王座,今年终于被取代,但依然稳居前五名。中国曾在2004年凭借上海超级计算机中心的曙光4000A进入前十,时隔四年,由30万颗核心组成的曙光5000A型重返前十名!

2008年超级计算机排行榜TOP10

    电子计算机问世之后,电脑技术向三个方向发展:一是超级大型计算机的运算能力屡创新高;二是个人微型计算机速度更快、体积成本更小;三是计算机之间的连接,即互联网应用多元化发展。近年来个人电脑与互联网技术的发展是有目共睹的,但超级计算机始终难以取得突破。

    超级计算机是为研究复杂的科技课题设计的,它是由成千上万颗CPU组成,拥有超强的运算能力,但它高昂的价格及复杂的结构使科研成本居高不下,整个国家所拥有的超级计算机都是屈指可数,个人及小规模工作站更是不敢奢望,所以人们希望找到一种节约科技创新成本的替代办法。


GPU虽然为游戏和图形而生,但其运算能力可达CPU十倍以上

    而GPU运算技术的出现,给超级计算机的发展带来一丝曙光。一颗GPU的浮点运算能力相当于CPU的几十倍甚至几百倍,如果用同等规模的GPU组成超级计算机的话,那么超级计算机的运算能力将提升百倍之多;实现同等运算能力,GPU超级计算机的结构、规模、成本、功率将会大大减少——这就意味着个人超级计算机不再是梦想!

    说起来容易做起来,GPU虽然拥有CPU无法比拟的浮点运算能力,但想要颠覆拥有几十年历史的CPU运算王朝,除了具有诱人的性能价格优势之外,成熟稳定完整的平台、及应用解决方案才是重中之重。

    2008年11月18日,NVIDIA正式发布基于GPU流处理器运算架构的个人超级计算机“Tesla Personal Supercomputer”,以标准桌面工作站的体积提供相当于一个超级计算机集群的处理能力,同时价格只有百分之一,功耗也不过十分之一!

    在刚刚公布的全球超级计算机排行榜中,除了第10名中国上海曙光5000A打破美国垄断引人注目外,位列第29位的东京工业大学“TSUBAME”更是一枝独秀,因为它配备了NVIDIA Tesla计算处理器,这也是这GPU超级计算机第一次上榜。

    这套今年刚刚完成的超级计算机基于Sun Fire x4600/x6250集群,一共配备了170台NVIDIA Tesla S1070 1U计算系统,每个系统内有四块源于GT200核心的Tesla C1060计算处理卡,总共只用了680颗GPU,总体峰值浮点性能就达到了161.82TFlops,最大性能77.48TFlops。

    该系统使用了双核心Opteron 2.4/2.6GHz、四核心Xeon E5440 2.83GHz、ClearSpeed CSX600协处理器三种处理器,内存总量21.6TB,操作系统为SuSE Linux Enterprise Server 9。

    东京工业大学全球科学信息与计算中心主任Satoshi Matsuoka称,为这台超级计算机添加升级Tesla S1070只花了一个星期,而且期间系统没有离线。

    除了东京工业大学,美国的伊利诺斯州国家超级计算应用中心、莱斯大学、马里兰大学、北卡罗来纳大学和德国的海德尔堡大学、马克斯·普朗克研究院也都有各自的GPU超级计算机方案。

    NVIDIA Tesla个人超级计算机的价格与传统PC工作站差不多,但处理能力能加快最多250倍。它将为研究人员提供属于自己的强力计算平台,从而更快地处理数据、及时完成科学研究和新发现。

    此次NVIDIA发布的Tesla S1070个人超级计算机,实际上是由四块Tesla C1060组成的,基于GT200 GPU核心和CUDA并行计算架构,拥有960个处理核心和16GB GDDR3显存,理论单精度浮点性能超过3.5TFlops。

显卡构建1U服务器 看TESLA近来的发展
TESLA C1060计算处理器,可以堪称没有视频输出接口的显卡

    Tesla C1060其实就是GeForce GTX 280的流处理版本,其最大的特点就是配备了高达4GB GDDR3显存,另外它不需要显示输出,只需要从PCI-E传输/处理大量的数据。

显卡构建1U服务器 看TESLA近来的发展
核心为4片GPU的1U服务器

    Tesla S1070=Tesla C1060×4,它是按照机架式服务器设计的。从构造就可以看出,该1U系统内部主要由4片“显卡”——C1060组成,其它除了散热系统和电源系统,没有别的设备了。

    S1070的计算能力达到了4Tflops,功率为700W。不过,正如我们看到的其内部架构的原因,S1070是不能单独上机架使用的,需要和CPU服务器配合使用,我们可以把它看作是“外置”的计算服务器。

    根据NVIDIA的数据,1个4核心CPU 1U服务器计算能力大约0.07Tflops,单价2000美元,功率400W。假如要构建一个100TF处理能力的数据中心,需要1429台服务器,造价310万美元,总功率571KW。如果搭配S1070 1U服务器使用,单台S1070的造价是8000美元。那么只需要25台CPU服务器和25台S1070就可以构建一个100TF的数据中心,造价31万美元,功率21KW。

    虽然GPU超级计算机是新生事物,但其诱人的特性让业界都产生了非常浓厚的兴趣,各大学实验室、科研机构十分看好其发展前景,早在NVIDIA正式发布“Tesla Personal Supercomputer”之前,使用NVIDIA GeForce组成的GPU个人超级计算机就已经在民间投入应用了:


这些由GeForce显卡组成的普通电脑,是个人超级计算机的皱型

    通过使用NVIDIA日渐成熟的CUDA平台,即便是普通显卡也释放出惊人的能量,比起传统的高性能工作站,GPU个人超级计算机的性能少则提高几十倍,多则有上百倍的提升。


GPU超级计算产品发布,一呼百应

    随着GPU通用计算领域越来越广阔,GPU个人超级计算机的价值得到了肯定,NVIDIA正式宣布推出Tesla Personal Supercomputer,戴尔、华硕、联想、Scan、Boxx等厂商立即宣布会推出基于NVIDIA Tesla计算处理器的桌面级超级计算机。

    据了解,一套Tesla S1070系统的售价不到一万美元,和工作站相比,性能超强价格平易近人,因此大受欢迎。

    我们通常所使用的电脑正式名称是微型计算机,它与超级计算机、大型计算机、中型计算机、小型计算机之间的区别就是体积和规模,如果按照运算能力计算的话,现在的个人电脑已经可以同过去的大型计算机甚至超级计算机相提并论了,如今掌上电脑的性能也足以超越过去的台式电脑,但这还是远远不够的。

    时代在发展需求在增加,人类对运算能力的渴求是无止境的,尤其对于科研机构以及中小型企业来说,他们需要超级计算机的处理能力,但却无力购买、或者没有经费场地去喂养这么一台庞然大物。于是个人超级计算机的概念被提出来了,可由于CPU的性能所限始终都未能实现。而并行架构GPU运算的出现让个人超级计算机提前投入应用!

● Tesla个人超级计算机的魅力主要体现在以下三点:

    第一、它的超级计算性能可以说是达到了集群级别的计算性能,它是基于强大的并行CUDA的架构。同时它通过960个并行核心达到了4T浮点运算的性能。同时它的性能是台式计算机的250倍。

    第二、关于个人操作方面得到的便利性,首先每个研究人员都可以获得一台超级计算机,这样的话就不用像以前那样非得去数据中心才行,你直接在自己的办公室就可以使用了,而且它还非常的安静。此外,这个个人超级计算机使用的是标准的电源插座,应用起来是非常简单的。

    第三、关于它的应用性是非常高的,它是基于C语言,C语言对大多数编程人员来说是非常易懂、非常好上手,同时支持Windows和Linux系统,目前在全球上市了,价格也比较低廉,低于1万美金。

● 关于Tesla与GeForce之间的区别:

    前面介绍过,在Tesla Personal Supercomputer发布之前,各大学实验室已经使用多块GeForce显卡进行科学计算,那么Tesla和GeForce在并行计算方面有何不同呢?

    硬件方面,第一,Tesla与GeForce的内存(即显存)不同,GTX280是1GB而Tesla C1060是4GB。第二、在设计方面有一个比较大的区别,为了保证长期运算的精度和稳定性,我们进行一些更加精确和严格的测试,比如防烧毁的测试,在这方面Tesla要比GeForce系列更加稳定,做的更全面。

    特别提一下为什么多讲一些内存?因为在高性能计算的领域,内存是非常重要的,因为你的内存如果是很大的话,计算机在调用数据方面会很快,他就减少了数据传输的量,因为它带宽量是很大的,内存量也是很大的,就是内存很重要。这里面的内存相当于Tesla里面它是显存,指的是GPU在显卡上板载内存的流量,因为Tesla所设计的并行计算非常庞大,而且对于每个精度、每个数据的测试精度要求都非常高,所以不像游戏显卡一样显存有1G的流量,不需要经过很多测试就可以去玩游戏。但是对于专业的应用来说其实每个字节的数据都要保证它的精度,这样我们对Tesla上的显存的测试比GeForce都要更加的严格。

    接下来我进行一下总结,我们要根据应用来选择是用Tesla还是GeForce,他们都支持CUDA,对于一般的应用像玩游戏,或视频编码等简单的并行计算使用廉价的GeForce显卡即可,而对于特别海量的数字的科学运算,比如你在做石油勘探的时候要有数据测试,再进行天气预报的时候这需要用Tesla,要根据不同的应用选择不同的卡,尽管他们都支持CUDA,但是要给予不同的应用,尤其对数据的计算的精确度和专业度非常高的应用,我们推荐Tesla,而且是多路Tesla系统。<

0人已赞

关注我们

泡泡网

手机扫码关注