泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

NVIDIA Fermi要来了!GPU迎来二次革命

    泡泡网显卡频道3月5日 “跳票”在IT业界指厂商不能够按照ROADMAP计划按期推出产品及宣布延期,而近年来,在硬件/数码产品、游戏、电影等领域,“跳票”事件频频发生,似乎已经成为了商家敷衍用户的一种习惯!

    游戏产业最具代表性的当属暴雪,《暗黑破坏神3》一次又一次的刺激着我们的神经、《星际争霸2》历经12年的等待之后,终于赶在2010年初向我们走来。而在显卡产品领域,NVIDIA新一代显示核心“Fermi”在半年的时间内数次的调整发布时间,成为了2009年度显卡产业的“跳票王”!

    Fermi作为NVIDIA新一代DX11产品,被无数玩家寄予了厚望,在老对手AMD抢先推出DX11产品HD5000系列之后,Fermi的研发进程就更受关注,任何一个关于Fermi的消息都将成为业内关注的焦点。年对这HD5000系列咄咄逼人的气势,Fermi却迟迟不能上马,这也上NVIDIA在整个产品线的布局上陷入了很大的被动。

    回想当年DX10时代初期,伟大的GTX8800远远的将RV600甩到身后,但是,俗话说“三十年河东,三十年河西”,如今在向DX11时代迈进的时候,NVIDIA却放缓了脚步,被对手超越。面对如此窘况,作为业内“一哥”的NVIDIA自然不能容对手放肆,于是乎,Fermi将承载NVIDIA的希望,在DX11时代一扫阴霾,重建辉煌!

   如今,Fermi的正式发售日期已经确定,那么这款承载者无数人期望的产品,究竟能给我们带来什么样的惊喜?能否颠覆传统显卡的应用理念?能否开创一个属于NVIDIA的DX11时代?这些都是我们所期待的。今天,我们在Fermi正式发售之前,根据各方面的信息汇总,一起回顾一下这款产品问世的艰辛历程;一起来看看Fermi将会带给我们那些欣喜的东西!

●Fermi“处女秀”!NVIDIA GTC大会惊艳全场!

    Fermi作为NVIDIA新一代显示核心,在09年NVIDIA美国GTC大会之前,一直都属于高度机密,不为人所知。美国旧金山当地时间2009年9月30日下午,NVIDIA在圣何塞当地举办的GTC大会上,有CEO黄仁勋亲自向全球用户展示了基于Fermi架构的Tesla优异产品,完成了Fermi的全球“处女秀”!

   这次揭晓的Fermi显示核心,作为NVIDIA目前的GPU产品中,最强悍的一款,它在缓存上再次为并行运算进行优化。所有处理单元都可以共享缓存,并且增加了一级和二级缓存,这与以往都大大不同。尽管当时Fermi展示的只是Tesla样卡,但其巨大的魅力无不让大家相信Fermi很快就会有对应的GeForce产品问世。

    同时还针对NVIDIA GPU在娱乐级方面的成果分四点进行详细介绍,它们分别是PhysX物理引擎、光线追踪、3D Vision和DirectX 11,通过这次产品架构的介绍,NVIDIA展示了自己不仅在科学计算上的实力,更突显了NVIDIA在消费级用户日常应用产品的拓展。

●NV首席科学家谈Fermi背后的故事

     自从GTC大会上展示了Fermi样卡之后,这款产品便成为业内关注的焦点,关于其产品的任何信息都得到了玩家极大地关注。下面,我们就来看看NVIDIA首席科学家如何解答全球媒体对Fermi提出的问题。从而进一步了解Fermi研发背后的一些故事。

    Fermi究竟是那年开始孕育的?

    Bill Dally说道,一个GPU的研发一般都是3~4年,Fermi产品最终功能、架构定稿时间大概是在2年前。

来自亚太区的媒体问道,“Fermi架构的产品功能、性能已经非常强劲,那么基于它的GeForce、Tesla和Quadro是否会系列模糊化,最后只有一个系列?”

    “这个肯定是不会发生的!”Bill Dally说道,因为3个系列都是针对不同领域设计的产品,所以在功能以及设计环节会有特定的设计,他们之间的不能在功能及性能上完全一样。”

    “Fermi是否是您认为目前最完美的设计,如果您认为不完美,是否有哪些遗憾?”

    Bill Dally面露狡猾的笑容回答:“就目前来看,Fermi是我认为最完美的设计,不过GPU未来发展还有很多未知数,而且Fermi还有很大提升空间。”

    现在在GPU中加入了L2缓存设计,那么是否会像CPU一样加入L3缓存设计?

    谈到这个问题的时候,Bill Dally先生谈了他的看法:“第一个问题我认为,CPU和GPU不一样,因为CPU是以顺序计算为主,而GPU则是以并行计算为主,所以L2/L3缓存设计实际应用用途会根据当时应用者是否需要才加入,但我们不否定未来会加入L3缓存。

    规格的直接累加是增加效能的捷径,那么为何NVIDIA不是在GT200架构上累加规格,而是全新设计Fermi架构呢?

  Bill Dally答道:“确实是累加规格会增加旧架构的性能,但是我们的GT200在已有架构上性能已经非常好,我们需要更多针对CUDA计算方面的GPU,所以得革新架构,而且我们也不希望用老架构增加性能计算以前的东西”。

    从Bill Dally回答中,我们看到了他对NVIDIA和GPU未来的自信和憧憬,Fermi架构将在大规模科学计算,通用计算领域等应用方面达到了一个很高的水平。

●NV实验室探秘!Fermi是如何产生的?

    前面,我们简单了解了Fermi的“前世今生”,那么对于这款新产品诞生的地方--NVIDIA仿真实验室,相信大家也是非常的感兴趣,下面我们就来看看Fermi的诞生地。

 

NVIDIA实验室一景

   

这就是仿真的机器

这个标示为Cadence的机器集群,就是Fermi最初的母亲

    据NVIDIA的工程师介绍,GPU的芯片设计,模拟环节很重要。而虽然一些芯片可以通过软件模拟完成,但对于GPU来说软件模拟实在太慢,所以需要通过无数的设备进行硬件模拟。

诞生Fermi的仿真机器群

    大的仿真器上的排线是通过刚才看到的模拟用的卡连接的,模拟卡可以被放到我们常用的PC的PCIE插槽上,而通过后端IO与排线与模拟设备连接。上图看到绕着柱子一圈的机器就是Fermi的模拟器了。有了这套模拟器,在这个阶段NVIDIA就可以给产品开发驱动和软件运行环境了,甚至还可以模拟真实操作系统环境运行。

    拟器运行速度大概要比对应的真实GPU慢千倍,为什么还要用模拟器?因为硬件模拟比仅仅软件模拟器而言快几千倍,同时NVIDIA还可以在模拟的同时,同步研发驱动和软件配合。

●不断跳票 Fermi真是“纸老虎”

    看着对手的HD5000系列在DX11领域肆无忌惮的“嚣张”,越来越多的玩家都迫不及待的想了解Fermi的参数规格以及性能表现。但Fermi的一次次跳票,让不少玩家开始玩起了数字游戏,从理论上来预估Fermi的性能。

称Fermi为“Paper Dragon”

   同时,Fermi的延期也给了对手以话柄,ATI就曾在官方文档中将锚头直接指向了Fermi,称Fermi为“Paper Dragon”(纸龙、更形象一点也可以翻译成纸老虎)。

    尽管ATI讲Fermi称之为“纸老虎”,认为在NVIDIA的Fermi发布之前,NVIDIA的做法只是虚张声势。但ATI似乎也感受Fermi上市时的强大冲击力,为了万无一失的却不其得之不易的性能之王宝座,ATI推出了杀手锏HD5900系列来备战。

●架构大改进!核心特性、架构解读

    面对着竞争对手的巨大压力和众多用户的深切期待,Fermi该如和走出困境,也成为关心这款产品的用户所关注的。在年初的CES 2010展会上,NVIDIA终于首次公开拿出了Fermi架构高端型号GF100,展示立体多屏环绕技术3D Vision Surround的同时,NVIDIA用传说中的Fermi演示了DirectX 11 Benchmark程序,给不少玩家带来了惊喜!

    随后,NVIDIA又公开了Fermi GF100在游戏架构方面的诸多特性,让玩家深入的了解了Fermi核心架构和特色改进。

GF100架构改进要点预览

    如果说Cypress是“双核心”设计的话,那么GF100的流处理器部分就是“四核心”设计,因为其raster units(光栅化引擎)是以GPC(线程处理器簇)为单位的,一式四份。而raster units的功能就是以流水线的方式执行边缘/三角形设定(Edge/Triangle Setup)、光栅化(Rasterization)、Z轴压缩(Z-Culling)等操作。上页我们介绍过Cypress的Rasterizer和Hierarchial-Z双份的,而GF100则是四份的,虽然命名有所不同但功能是相同的

    另外,GF100拥有更多的PolyMorph(多形体引擎),是以SM(流处理器)为单位分配的,拥有多达16组。多形体引擎则要负责顶点拾取(Vertex Fetch)、细分曲面(Tessellation)、视口转换(Viewport Transform)、属性设定(Attribute Setup)、流输出(Stream Output)等五个方面的处理工作,DX11中最大的变化之一细分曲面单元(Tessellator)就在这里,因此GF100的理论Tessellation性能将会远超Cypress,因为Cypress只有一个Tessellator单元。

    至于流处理器核心部分,则是经过了重新设计,与GT200/G92/G80相比是焕然一新,因此NVIDIA将其称为CUDA核心而不再是流处理器。

    GF100的512个CUDA核心都符合IEEE 754-2008浮点算法(Cypress也是如此)和完整的32位整数算法,而后者在过去只是模拟的,事实上仅能计算24-bit整数乘法;同时全面引入的还有积和熔加运算(Fused Multiply-Add/FMA)。此外双精度浮点(FP64)性能大大提升,峰值执行率可以达到单精度浮点(FP32)的1/2,而过去只有1/8,AMD从R600开始到现在的Cypress核心都是1/5,没有做任何变化。

    至于显存控制器方面的改进,还有显存ECC等外围功能就不多做介绍了。总而言之,GF100核心是GPU自从进入DX10时代以来,架构变化最大的一次,在GPU图形架构和并行计算架构方面都有了革命性的进步,因此备受玩家和业界期待。

●跳过GTX300!Fermi命名最终确定

    由于Fermi架构的高端产品还没有正式的投放市场,关于NVIDIA高端系列的显卡一直都是谣言不断,之前有消息称,产品有可能会被命名为GeForce GTX 380/360,但也有消息称NVIDIA打算放弃字母标识。

     直到2月初,NVIDIA终于公布了Fermi新架构显卡的型号命名“GeForce GTX 480/470”,出乎意料地直接迈入了GeForce 400系列。

    之前谈论较多的名字当然是“GeForce GTX 380/360”,这也是延续上代产品的合理命名,不过因为NVIDIA在OEM领域推出了GeForce 310/305等型号相近但规格迥异的产品,如果都归入GeForce 300系列必然会造成严重的混乱,这样一来新架构产品跨入GeForce 400系列也就合情合理了。

● 尘埃落定!Fermi定于3月底震撼登场

    经过近半年之久的艰辛历程,NVIDIA终于放出确定的消息,将在3月26号正式发布Fermi。不过,在近日的Cebit 2010展会上,已经有不少品牌展示了基于Fermi架构的GTX480(核心代号GF100)显卡,让玩家提前一饱眼福。

Geforce GTX480的裸照

    关于GTX480的核心、显存频率至今仍然是个未知数,从目前掌握的情况可以直到,显卡GPU内含512个CUDA核心;显卡正面配有12块GDDR5显存(显存位宽384bit),总容量为1536MB;并设有6pin+8pin外接电源接头(意味着显卡的最大功耗在225W-300W之间);显卡并配置了4热管双槽散热器。

GTX470样卡

    另外,GF100的阉割版GTX470据传也将和GTX480同时发布,关于GTX470的细节目前还没有确定,不过有传言称会拥有448个流处理器和320Bit显存控制器,而GTX480拥有512个流处理器和384Bit显存控制器。


    上面,我们回顾了Fermi自首次曝光之后,一直到确定发售日期这段时间所经历的艰辛历程,从中我们了解了Fermi研发背后的故事、Fermi在新架构下拥有的特色技术、Fermi最新的产品参数规格,让我们对这款产品有了更多的认识和期待。接下来,我们所要做的就是等待,等待3月26日Fermi的正式发售。

    “天将降大任于斯人也,必先苦其心智、劳其筋骨”,Fermi经历了如此之多的坎坷之后,终将诞生。在DX11的时代,Fermi能否力挽狂澜,绝境重生,给我们带来意想不到的惊喜?■<

0人已赞

关注我们

泡泡网

手机扫码关注