NVIDIA Fermi要来了!GPU迎来二次革命-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

NVIDIA Fermi要来了!GPU迎来二次革命

2010年03月05日 04:47作者：孙磊编辑：孙磊文章出处：泡泡网原创

泡泡网显卡频道3月5日 “跳票”在IT业界指厂商不能够按照ROADMAP计划按期推出产品及宣布延期，而近年来，在硬件/数码产品、游戏、电影等领域，“跳票”事件频频发生，似乎已经成为了商家敷衍用户的一种习惯！

游戏产业最具代表性的当属暴雪，《暗黑破坏神3》一次又一次的刺激着我们的神经、《星际争霸2》历经12年的等待之后，终于赶在2010年初向我们走来。而在显卡产品领域，NVIDIA新一代显示核心“Fermi”在半年的时间内数次的调整发布时间，成为了2009年度显卡产业的“跳票王”！

Fermi作为NVIDIA新一代DX11产品，被无数玩家寄予了厚望，在老对手AMD抢先推出DX11产品HD5000系列之后，Fermi的研发进程就更受关注，任何一个关于Fermi的消息都将成为业内关注的焦点。年对这HD5000系列咄咄逼人的气势，Fermi却迟迟不能上马，这也上NVIDIA在整个产品线的布局上陷入了很大的被动。

回想当年DX10时代初期，伟大的GTX8800远远的将RV600甩到身后，但是，俗话说“三十年河东，三十年河西”，如今在向DX11时代迈进的时候，NVIDIA却放缓了脚步，被对手超越。面对如此窘况，作为业内“一哥”的NVIDIA自然不能容对手放肆，于是乎，Fermi将承载NVIDIA的希望，在DX11时代一扫阴霾，重建辉煌！

如今，Fermi的正式发售日期已经确定，那么这款承载者无数人期望的产品，究竟能给我们带来什么样的惊喜？能否颠覆传统显卡的应用理念？能否开创一个属于NVIDIA的DX11时代？这些都是我们所期待的。今天，我们在Fermi正式发售之前，根据各方面的信息汇总，一起回顾一下这款产品问世的艰辛历程；一起来看看Fermi将会带给我们那些欣喜的东西！

●Fermi“处女秀”！NVIDIA GTC大会惊艳全场！

Fermi作为NVIDIA新一代显示核心，在09年NVIDIA美国GTC大会之前，一直都属于高度机密，不为人所知。美国旧金山当地时间2009年9月30日下午，NVIDIA在圣何塞当地举办的GTC大会上，有CEO黄仁勋亲自向全球用户展示了基于Fermi架构的Tesla优异产品，完成了Fermi的全球“处女秀”！

这次揭晓的Fermi显示核心，作为NVIDIA目前的GPU产品中，最强悍的一款，它在缓存上再次为并行运算进行优化。所有处理单元都可以共享缓存，并且增加了一级和二级缓存，这与以往都大大不同。尽管当时Fermi展示的只是Tesla样卡，但其巨大的魅力无不让大家相信Fermi很快就会有对应的GeForce产品问世。

同时还针对NVIDIA GPU在娱乐级方面的成果分四点进行详细介绍，它们分别是PhysX物理引擎、光线追踪、3D Vision和DirectX 11，通过这次产品架构的介绍，NVIDIA展示了自己不仅在科学计算上的实力，更突显了NVIDIA在消费级用户日常应用产品的拓展。

●NV首席科学家谈Fermi背后的故事

自从GTC大会上展示了Fermi样卡之后，这款产品便成为业内关注的焦点，关于其产品的任何信息都得到了玩家极大地关注。下面，我们就来看看NVIDIA首席科学家如何解答全球媒体对Fermi提出的问题。从而进一步了解Fermi研发背后的一些故事。

Fermi究竟是那年开始孕育的？

Bill Dally说道，一个GPU的研发一般都是3~4年，Fermi产品最终功能、架构定稿时间大概是在2年前。

来自亚太区的媒体问道，“Fermi架构的产品功能、性能已经非常强劲，那么基于它的GeForce、Tesla和Quadro是否会系列模糊化，最后只有一个系列？”

“这个肯定是不会发生的！”Bill Dally说道，因为3个系列都是针对不同领域设计的产品，所以在功能以及设计环节会有特定的设计，他们之间的不能在功能及性能上完全一样。”

“Fermi是否是您认为目前最完美的设计，如果您认为不完美，是否有哪些遗憾？”

Bill Dally面露狡猾的笑容回答：“就目前来看，Fermi是我认为最完美的设计，不过GPU未来发展还有很多未知数，而且Fermi还有很大提升空间。”

现在在GPU中加入了L2缓存设计，那么是否会像CPU一样加入L3缓存设计？

谈到这个问题的时候，Bill Dally先生谈了他的看法：“第一个问题我认为，CPU和GPU不一样，因为CPU是以顺序计算为主，而GPU则是以并行计算为主，所以L2/L3缓存设计实际应用用途会根据当时应用者是否需要才加入，但我们不否定未来会加入L3缓存。

规格的直接累加是增加效能的捷径，那么为何NVIDIA不是在GT200架构上累加规格，而是全新设计Fermi架构呢？

Bill Dally答道：“确实是累加规格会增加旧架构的性能，但是我们的GT200在已有架构上性能已经非常好，我们需要更多针对CUDA计算方面的GPU，所以得革新架构，而且我们也不希望用老架构增加性能计算以前的东西”。

从Bill Dally回答中，我们看到了他对NVIDIA和GPU未来的自信和憧憬，Fermi架构将在大规模科学计算，通用计算领域等应用方面达到了一个很高的水平。

●NV实验室探秘！Fermi是如何产生的？

前面，我们简单了解了Fermi的“前世今生”，那么对于这款新产品诞生的地方--NVIDIA仿真实验室，相信大家也是非常的感兴趣，下面我们就来看看Fermi的诞生地。

NVIDIA实验室一景

这就是仿真的机器

这个标示为Cadence的机器集群，就是Fermi最初的母亲

据NVIDIA的工程师介绍，GPU的芯片设计，模拟环节很重要。而虽然一些芯片可以通过软件模拟完成，但对于GPU来说软件模拟实在太慢，所以需要通过无数的设备进行硬件模拟。

诞生Fermi的仿真机器群

大的仿真器上的排线是通过刚才看到的模拟用的卡连接的，模拟卡可以被放到我们常用的PC的PCIE插槽上，而通过后端IO与排线与模拟设备连接。上图看到绕着柱子一圈的机器就是Fermi的模拟器了。有了这套模拟器，在这个阶段NVIDIA就可以给产品开发驱动和软件运行环境了，甚至还可以模拟真实操作系统环境运行。

拟器运行速度大概要比对应的真实GPU慢千倍，为什么还要用模拟器？因为硬件模拟比仅仅软件模拟器而言快几千倍，同时NVIDIA还可以在模拟的同时，同步研发驱动和软件配合。

●不断跳票 Fermi真是“纸老虎”

看着对手的HD5000系列在DX11领域肆无忌惮的“嚣张”，越来越多的玩家都迫不及待的想了解Fermi的参数规格以及性能表现。但Fermi的一次次跳票，让不少玩家开始玩起了数字游戏，从理论上来预估Fermi的性能。

称Fermi为“Paper Dragon”

同时，Fermi的延期也给了对手以话柄，ATI就曾在官方文档中将锚头直接指向了Fermi，称Fermi为“Paper Dragon”（纸龙、更形象一点也可以翻译成纸老虎）。

尽管ATI讲Fermi称之为“纸老虎”，认为在NVIDIA的Fermi发布之前，NVIDIA的做法只是虚张声势。但ATI似乎也感受Fermi上市时的强大冲击力，为了万无一失的却不其得之不易的性能之王宝座，ATI推出了杀手锏HD5900系列来备战。

●架构大改进！核心特性、架构解读

面对着竞争对手的巨大压力和众多用户的深切期待，Fermi该如和走出困境，也成为关心这款产品的用户所关注的。在年初的CES 2010展会上，NVIDIA终于首次公开拿出了Fermi架构高端型号GF100，展示立体多屏环绕技术3D Vision Surround的同时，NVIDIA用传说中的Fermi演示了DirectX 11 Benchmark程序，给不少玩家带来了惊喜！

随后，NVIDIA又公开了Fermi GF100在游戏架构方面的诸多特性，让玩家深入的了解了Fermi核心架构和特色改进。

● GF100架构改进要点预览

如果说Cypress是“双核心”设计的话，那么GF100的流处理器部分就是“四核心”设计，因为其raster units（光栅化引擎）是以GPC（线程处理器簇）为单位的，一式四份。而raster units的功能就是以流水线的方式执行边缘/三角形设定(Edge/Triangle Setup)、光栅化(Rasterization)、Z轴压缩(Z-Culling)等操作。上页我们介绍过Cypress的Rasterizer和Hierarchial-Z双份的，而GF100则是四份的，虽然命名有所不同但功能是相同的。

另外，GF100拥有更多的PolyMorph（多形体引擎），是以SM（流处理器）为单位分配的，拥有多达16组。多形体引擎则要负责顶点拾取(Vertex Fetch)、细分曲面(Tessellation)、视口转换(Viewport Transform)、属性设定(Attribute Setup)、流输出(Stream Output)等五个方面的处理工作，DX11中最大的变化之一细分曲面单元(Tessellator)就在这里，因此GF100的理论Tessellation性能将会远超Cypress，因为Cypress只有一个Tessellator单元。

至于流处理器核心部分，则是经过了重新设计，与GT200/G92/G80相比是焕然一新，因此NVIDIA将其称为CUDA核心而不再是流处理器。

GF100的512个CUDA核心都符合IEEE 754-2008浮点算法(Cypress也是如此)和完整的32位整数算法，而后者在过去只是模拟的，事实上仅能计算24-bit整数乘法；同时全面引入的还有积和熔加运算(Fused Multiply-Add/FMA)。此外双精度浮点(FP64)性能大大提升，峰值执行率可以达到单精度浮点(FP32)的1/2，而过去只有1/8，AMD从R600开始到现在的Cypress核心都是1/5，没有做任何变化。

至于显存控制器方面的改进，还有显存ECC等外围功能就不多做介绍了。总而言之，GF100核心是GPU自从进入DX10时代以来，架构变化最大的一次，在GPU图形架构和并行计算架构方面都有了革命性的进步，因此备受玩家和业界期待。

●跳过GTX300！Fermi命名最终确定

由于Fermi架构的高端产品还没有正式的投放市场，关于NVIDIA高端系列的显卡一直都是谣言不断，之前有消息称，产品有可能会被命名为GeForce GTX 380/360，但也有消息称NVIDIA打算放弃字母标识。

直到2月初，NVIDIA终于公布了Fermi新架构显卡的型号命名“GeForce GTX 480/470”，出乎意料地直接迈入了GeForce 400系列。

之前谈论较多的名字当然是“GeForce GTX 380/360”，这也是延续上代产品的合理命名，不过因为NVIDIA在OEM领域推出了GeForce 310/305等型号相近但规格迥异的产品，如果都归入GeForce 300系列必然会造成严重的混乱，这样一来新架构产品跨入GeForce 400系列也就合情合理了。

● 尘埃落定！Fermi定于3月底震撼登场

经过近半年之久的艰辛历程，NVIDIA终于放出确定的消息，将在3月26号正式发布Fermi。不过，在近日的Cebit 2010展会上，已经有不少品牌展示了基于Fermi架构的GTX480（核心代号GF100）显卡，让玩家提前一饱眼福。

Geforce GTX480的裸照

关于GTX480的核心、显存频率至今仍然是个未知数，从目前掌握的情况可以直到，显卡GPU内含512个CUDA核心；显卡正面配有12块GDDR5显存（显存位宽384bit），总容量为1536MB；并设有6pin+8pin外接电源接头（意味着显卡的最大功耗在225W-300W之间）；显卡并配置了4热管双槽散热器。

GTX470样卡

另外，GF100的阉割版GTX470据传也将和GTX480同时发布，关于GTX470的细节目前还没有确定，不过有传言称会拥有448个流处理器和320Bit显存控制器，而GTX480拥有512个流处理器和384Bit显存控制器。

上面，我们回顾了Fermi自首次曝光之后，一直到确定发售日期这段时间所经历的艰辛历程，从中我们了解了Fermi研发背后的故事、Fermi在新架构下拥有的特色技术、Fermi最新的产品参数规格，让我们对这款产品有了更多的认识和期待。接下来，我们所要做的就是等待，等待3月26日Fermi的正式发售。

“天将降大任于斯人也，必先苦其心智、劳其筋骨”，Fermi经历了如此之多的坎坷之后，终将诞生。在DX11的时代，Fermi能否力挽狂澜，绝境重生，给我们带来意想不到的惊喜？■<

0人已赞

NVIDIA Fermi要来了!GPU迎来二次革命

关注我们