原生与胶水之争!CPU和GPU真假大论战
泡泡网显卡频道4月26日 原生与桥接GPU的叫法相信大家并不陌生,真假双核与四核CPU也曾闹得沸沸扬扬,IT界从不缺少各种口水战,无论竞争对手之间的对喷还是Fans们的激烈言辞,都能给热爱IT的用户们带来一些新的乐趣以及茶余饭后的谈资。
“有路不走何必搭桥?”听着很耳熟吧,这是当年ATI讽刺NVIDIA通过桥接手段进入PCI-E时代的经典言论,由此针对“原生”与“桥接”的讨论便在官方与民间展开。
“真双核”与“假双核”的说法是由AMD提出来的,Intel将两颗Pentium 4核心封装在一个基板上,组成了Pentium D,AMD认为这种架构是假双核,而网友则更具想象力,将这种双核称为“胶水”双核。
“真四核”与“假四核”也是同样的道理,Intel将两颗Core 2 Duo粘合成为一颗Core 2 Quad,而AMD则重新设计了Phenom原生四核CPU,“原生”与“胶水”的论战再起波澜。
“胶水”与“融合”之争也挺有意思,AMD最先提出了CPU+GPU的“融合”概念,不料却被Intel再次抢先,还是通过CPU和北桥封装在一起的“胶水”方案,由此引发了新的一轮争议。
近期比较有意思的话题就是关于真假DX11架构,在NVIDIA的GTX480/470发布之后,其DX9C与DX10性能优势不是很大,但是DX11性能却遥遥领先与对手的HD5800,这就使得双方在DX11方面展开了一场论战——到底谁的架构更优秀?
● GPU“原生”与“桥接”之争:AGP和PCI-E世代交替的产物
2004年初,Intel一意孤行发布915芯片组强行推广PCI-E平台,无情的抛弃了当时的绝对主流AGP8X,于是就需要PCI-E接口显卡的支持。
★ 首款PCI-E显卡是桥接版:
NVIDIA采用“投机取巧”的方式开发了代号BR02的HSI(High Speed Interconnect)芯片,能够将GPU的AGP8X接口转换为PCI-E X16接口,这样就让一大批库存原生AGP接口的NV35(FX5900)和NV36(FX5700)芯片率先登陆PCI-E平台!
当时NVIDIA的做法备受指责,因为这样桥接过来的PCI-E显卡本质上依然是AGP 8X接口,显卡并没有因为采用了带宽更高的PCI-E X16接口而提升性能,相反由于多了一个信号转换过程而损失了些许性能。这样的PCI-E显卡仅仅是抢得了头彩,只起到了配合首批915主板的作用。
桥接芯片在AGP向PCI-E的过渡过程中扮演了极其重要的角色
竞争对手ATI更是极其鄙视NVIDIA的BR02桥接芯片,并且放出了“有路不走何必搭桥?”的豪言壮语,因为ATI在X800一代所有核心都是一式两份,AGP和PCI-E都是原生版本,而NVIDIA依然在搞“过河搭桥”的“麻烦”工程。
★ 风靡一时的SLI技术竟然基于“胶水”PCI-E方案
进入GeForce 6时代,保守的NVIDIA在高端NV40核心上依然使用AGP接口,而当时PCI-E已经是首选平台了,就连NVIDIA自己的nForce 4芯片组也只支持PCI-E。随后NVIDIA终于发布了NV45核心,它除了支持PCI-E之外,重现江湖的SLI双卡互连技术让世人大为震惊,ATI也是始料未及!
事实上,NV45并非全新核心,它只是将原生AGP8X接口的NV40与BR02桥接芯片封装在了同一块GPU基板上面,也就是通常所说的“胶水”封装技术。封装在一起的好处就是集成度更高,PCB设计难度降低,散热更容易解决。
至于性能方面,HSI芯片人如其名,转换效率非常高,相同规格的6800U PCI-E和AGP版差异非常微小。此时,6800U SLI双卡显示出了令人生畏的强大火力,至于它的NV45核心是否是原生PCI-E接口,已经变得不重要了。
★ PCI-E转AGP反向桥接,老平台用户的福音
04年末05年初正好是个转折点,PCI-E开始成为主流,所以NVIDIA从NV43开始正式进入原生PCI-E时代。虽然NV43核心是原生PCI-E接口,但NVIDIA并没有忘记AGP用户,它再次通过桥接方案轻松的完成了对AGP8X的支持。而整块显卡的关键——桥接芯片居然就是PCX系列显卡和NV45核心上所用的BR02,原来BR02可以反过来用的!
当初在PCX5950/5750上所用的BR02芯片(包括NV45核心中的BR02),其作用是将NV35/36/40核心的AGP8X图形接口转换为PCI-E X16,而此后用在6600GT AGP显卡上的BR02作用正好相反,它完成了逆向转换,让原生PCI-E X16接口的NV43核心支持AGP8X。
高速、双向桥接的BR02芯片可以说是无所不能,如果没有BR02,NVIDIA不可能赶在ATI之前发布PCI-E显卡,没有BR02基于6800Ultra的SLI技术也成了镜花水月,没有BR02的话AGP用户也只能看着一款款新PCI-E显卡流口水。
★ 在PCI-E和AGP之间疲于奔命的ATI
打从一开始,ATI就坚定了走原生PCI-E之路,因此ATI提出了“有路不走何必搭桥”的口号,对NVIDIA的PCX系列桥接显卡以及NV45的内部桥接方案冷嘲热讽。ATI的X800系列首颗核心R420是原生AGP接口,还专门开发了一颗代号为R423的原生PCI-E核心:
ATI的R420和R423核心(核心印有AGP/PCI-E标志)
R420与R423的硬件规格是完全相同的,不同的就是接口总线,ATI将AGP和PCI-E划分的如此泾渭分明,这就导致它必须同时生产两颗核心,并且预估当时市场对PCI-E和AGP的需求来确定产量。而NVIDIA只需要制造NV40这一颗核心就够了(NV45就是NV40+BR02),显然ATI的成本付出要更高一些。
R480和R481核心,ATI在PCI-E和AGP之间疲于奔命
不仅如此,ATI为了提高产品竞争力,在X800系列之后又发布了更高频率的X850系列显卡,而X850家族所使用的是全新的核心——R480和R481——为了照顾两个平台的用户ATI必须推出两颗核心,R480原生PCI-E、R481原生AGP,X800和X850所有芯片都是一式两份,这就是“原生”的代价!
随着PCI-E显卡渐渐成为主流,如果每款GPU都要推出原生AGP接口的版本那么投入的成本势必增加不少,尤其是中低端GPU对成本控制非常敏感的领域,所以ATI也开发了自己的桥接芯片——Rialto,这个英文单词就是威尼斯大运河上一座著名的大理石桥。
与NVIDIA的BR02不同,ATI的Rialto芯片只能实现将原生PCI-E接口的GPU转换为AGP接口,而无法完成原生AGP的GPU转换成PCI-E,所以ATI所有的PCI-E显卡肯定是原生的,但后期的AGP显卡则使用了桥接。
可能是因为只支持单向桥接的原因,ATI Rialto芯片的发热量比BR02小的多,无须散热片就能很稳定的工作,而BR02必须配备散热片而且通风条件要好,否则容易死机。这就是ATI桥接的优势,但我们也可以看到Rialto芯片的基板面积很大,大多数桥接A卡都将Rialto芯片放在显卡PCB背面。
ATI Rialto桥接芯片还有个优势就是兼容性好,对于DX10和DX10.1核心都能完美支持,所以直到HD4000时代还有AIB厂商为老平台提供AGP升级显卡,而且ATI在驱动方面没有放弃支持,这是ATI“食言”之后为用户带来的最大好处。
● AMD与Intel之间的真假双核之争
2005年中,Intel和AMD相继发布双核心处理器Pentium D和Athlon64 X2,双方的产品是各有特色:AMD继续保持单核Athlon64系列高效能低功耗的优势,而Intel继续保持Pentium4系列高频率高功耗的特色。
当然最大的不同还是在核心架构方面,Athlon64 X2是经过重新设计的单一芯片原生双核方案,而Pentium D则是两把两颗Pentium 4核心封装在一起而已。Intel的高频低能与胶水双核的确是一大软肋,于是AMD最先发难,挑起了真假双核之争,下面我们就来简单回顾下:
2005年5月,AMD宣称,其用于服务器和台式机的双核处理器产品为“真双核”架构,以与Intel的Pentium D产品进行区分。
2005年6月7日,AMD大中华区市场总监王妩蓉表示:我们非常尊重我们的竞争对手,无意对它进行抵毁,我们只是想说明在双核处理器方面AMD的架构与英特尔的架构并不相同,AMD的产品在架构上的优势更为明显,性能更强。
2005年12月上旬,Intel总裁来华公关,称AMD转让给中国的处理器技术过时。
2005年12月中旬,AMD发起“我为双核狂AMD真双核体验风暴活动”,再抛“真假双核论”的王牌,认为自己是一个芯片上的两个核,是真正的双核,而Intel是一个处理器上的两个芯片,是假双核,并从网上招募电脑爱好者进行线上体验双核应用。同时在北京举行的小型媒体交流会,展示AMD双核处理器性能优势的大量测试数据。
Intel中国公司新闻发言人刘捷对于AMD发起挑战的问题回答很简单:“没必要”。其表示,Intel作为首先提出双核概念并且实现大范围市场化的领先企业,对于自己的产品十分有信心。没有必要通过这种评测来证明。
2006年02月27日,Intel中国北方区总经理曾明指出AMD在双核上制造了一个“谎言”。这是Intel半年来第一次针对AMD双核挑战表明立场。同时,曾明还拿出一家第三方最新的评测数据,称AMD双核产品在执行多任务时的低性能。
2006年2月28日,AMD公司就Intel的系列指责做出回应,表示“此测试结果的出现纯属软件原因,AMD无意攻击竞争对手。Intel公司引用的数据是断章取义。” 并表示从未对Intel的处理器称假双核,更没有对Intel进行过抨击,所谓“假双核”的说法属于空穴来风。
自从双核处理器问世以来,AMD曾在美国、新加坡等地邀请英特尔“决战双核”,对此Intel一直不予理会,Intel唯一一次公开回应,使得延续一年多的“真假双核处理器”之争愈演愈烈。
资深的玩家应该知道,AMD在当年的确占有性能和功耗方面的双重优势,所以AMD理直气壮、咄咄逼人的态势让Intel无言以对。但当年Athlon64 X2的价格可是高得离谱,最便宜的型号都要2000左右,而Intel则非常亲民,Pentium D 805还不足千元,处于劣势的Intel担任了双核普及使者。
● AMD与Intel之间的真假四核之争
真假双核之争终于在Intel发布酷睿2处理器之后画上了句号,凭借全新优秀的架构和共享式二级缓存设计,酷睿2所向披靡,让飞扬跋扈的AMD首尝败绩。而Intel并没有止步不前,而是如法炮制,将两颗Core 2 Duo处理器封装在一起,率先发布了Core 2 Quad四核处理器,让AMD在中高端市场毫无还手之力。
Core 2 Quad和Pentium D的本质相同,都是“胶水”封装而成
为了给自己全新的四核Phenom架构造势,AMD再次抛出“真假四核”的概念,道理上其实就是当年“真假双核”的延续。想当年,AMD和英特尔的“真假双核”大战给业内留下了深刻的印象,并在众多媒体评选的IT年度新闻中排列榜首,也让AMD出尽风头,尝到甜头的AMD故技重施,但这次不是为了击败Intel,而仅仅是拖延战术。
Core 2 Quad虽然只是由两颗Core 2 Duo封装而成,但凭借优秀的架构和单核效能,加之系统和软件对多核的优化支持开始到位,组成的四核性能非常出色,功耗控制也不错。而AMD的K8架构已经无力与酷睿2相抗衡,只能开发全新的K10架构,也就是AMD的真四核架构,但全新的架构谈何容易,加之AMD制造工艺跟不上,无法摆脱难产和延期的命运,只好通过“口水战”来度过最艰难的时期。
左:Phenom X4 右:Core 2 Quad
AMD所谓的“真四核”有很多特征,包括单芯片原生四核的设计,每个核都有独立的二级缓存、四个核心共享大容量三级缓存、统一的高速HT总线接口和高速低延迟的内存控制器等等。在AMD列举的七八项指标中,Intel是一片空白。“他们(Intel)只是把多个处理器黏在一个芯片上。这对客户而言意味着更加昂贵,而且效率更低、功耗更大。”而后在12月1日的年度AMD行业分析师论坛上,AMD首席销售与市场营销运营官亨利·理查德更是将AMD的四核X86服务器处理器和一只被剥掉外壳的英特尔四核处理器摆在了一起,直言Intel的Kentsfield单纯是把两个双核摆在一起。
AMD的理由听起来很充分,而且AMD真四核的这些技术也确实很先进(最终被Intel全部学去,应用在了下一代的Nehalem架构之中),但残酷的现实摆在AMD面前,即便是在AMD真四核巴塞罗那蹒跚发布之后,其产能和性能依然令人担忧,桌面版的Phenom X4 9650未能超越Intel最低端的Core 2 Quad Q6600,而且还遇到BUG召回的丑闻。更为雪上加霜的是,Intel再次引领业界进入了45nm时代,双方的差距越来越大,用户已经完全不在意到底哪个才是真那个才是假了。
● AMD与Intel之间的CPU+GPU整合方案之争
单从技术和架构方面来讲,AMD的真双核四核在架构方面确实一路领先,以至于Intel全新的Core i7架构基本上就是模仿/抄袭AMD的关键技术,但Intel总是能够后来者居上。真假双核四核之争告一段落之后,AMD提出了“The future is fusion”的CPU+GPU融合计划,AMD再次站在了业界的前沿。
★ Clarkdale核心的CPU+GPU胶水整合方案
但是,Intel在2010年伊始,以迅雷不及掩耳之势发布业内首款CPU+GPU整合架构的全新处理器——Core i5/i3,而AMD的Fusion至今还没有实际产品出现,据最新的消息表明要到2011年初才会发布,这次AMD不仅在性能上落后了,技术和创新方面也被反超,这下AMD该无话可说了吧?正好相反,因为Intel再次使用了“胶水”技术,AMD不认为这种架构是真正的CPU+GPU融合方案:
Clarkdale核心处理器“胶水”示意图
Intel刚刚发布的CPU+GPU整合式处理器,表面上看AMD所倡导的概念被Intel抢先了。但详细分析其架构之后大家会发现Intel的做法只是将CPU和GPU两颗不同的芯片封装在了一起(也就是通常所说的“胶水”技术),而不是真正把CPU和GPU无缝“融合”在一起,当然这只是表象,通过分析其技术和架构,会发现这种做法其实是一种倒退。
32nm工艺Westmere架构的Clarkdale处理器与Intel此前45nm工艺Nehalem架构的Bloomfield及Lynnfield处理器完全不同。Bloomfield(Core i7 9XX)整合了三通道内存控制器,Lynnfield(Core i7 8XX和i5 7XX)整合了双通道内存控制器以及PCI-E控制器,而Clarkdale(Core i5 6XX和i3 5XX)其实什么都没有整合:
Bloomfield/Lynnfield/Clarkdale核心架构图
上面的三款核心架构示意图揭露了所有答案,Lynnfield虽然少了一条内存通道,但由于DDR3带宽过剩因此性能损失很小,而PCI-E控制器的加入让整合度更高、架构更为先进。反观Clarkdale核心,它的内存控制器、集成显卡、PCI-E控制器都在北桥里面,这与Intel上代Core 2平台没有什么两样,将CPU和北桥封装在一起并不能提升性能,仅仅是简化了主板设计而已。由于Clarkdale没有整合内存控制器的原因,其内存性能非常低下,性能方面并没有带来惊喜,只是拜先进的32nm工艺所赐,功耗和发热表现比较出色,仅此而已。
★ Pineview核心新Atom处理器的“假”整合方案
Clarkdale将CPU和北桥封装在了一起,而Intel新一代Atom N450是一颗单芯片整合了内存控制器和集成显卡的处理器,表面上看似乎更像一颗CPU+GPU整合式处理器,实际上它的架构更为落后:胶水版Clarkdale的CPU和北桥之间好歹使用了新一代的QPI总线互联,而新Atom的CPU和北桥虽然在同一颗芯片之内,但他们之间依然使用老迈的FSB总线。
代号Pineview的新Atom处理器为单芯片CPU+GPU设计
新Atom本质上也是将CPU和北桥简单的放在一起,只是由于晶体管数较少,更容易整合,没必要使用胶水。而在内部架构方面,落后的FSB总线依然得到了保留,CPU和北桥(包括内存控制器和显卡)之间的瓶颈依然存在,最终结果就是性能提升有限。
★ AMD的融聚技术才是真正的CPU+GPU整合方案?
AMD认为,其融聚技术并不是简单地将CPU和GPU(及传统的北桥)攒在一块,更重要的是通过融聚提升性能,获得更有价值的应用。据了解首款融聚处理器Bobcat以不到目前CPU核心一半的面积实现了当前主流处理器90%的性能。这款核心将在2011年初随着AMD代号为Brazos的笔记本APU问世。它的设计非常灵活,高度可合成,可重新组合CPU使用。
“Bobcat” X86核心:小巧,高效,强大
·非常低的设计功耗——注重每瓦性能
·用不到一半的硅面积实现当今主流性能的90%
·综合/易用
·支持完整的ISA——SSE1~3和虚拟化
·2011年/笔记本APU/“Brazos”
核心架构类似K7/K8/K10的整数/浮点管线分离设计(而不是Atom那种顺序执行),2ALU/2AGU/2FPU,ALU/AGU/FPU都拥有独占的端口,ALU为对称设计,AGU为非对称设计(1Load/1Store),FPU也是非对称设计(1FADD/1FMUL)。
Bobcat将会使用最新的32nm SOI工艺制造,以接近于主流处理器的性能,实现超低的功耗将是其最大的亮点,它将大大改善便携式笔记本的性能和续航时间,成为入门级首选处理器核心。
从技术和架构方面来讲,AMD的APU似乎更值得期待,但其实际性能和功耗表现如何呢?这完全是个未知数,希望AMD不要重蹈Phenom一代的覆辙,用户最终看的是综合性能,而不是各种花哨的技术。
● 真假DX11架构:谁才是真正的DX11 GPU
我们知道HD5870是首款支持DX11的显卡,迄今为止AMD全线HD5000都对DX11提供了支持并全面上市。按理说只要能支持微软DX11 API就没有可以值得怀疑得了,为什么还会有真假DX11架构一说呢?
原因就在于NVIDIA发布GTX480之后,大家发现在DX9C和DX10游戏中,GTX480领先HD5870的优势不算太多,基本都在大家的预期之内,但是DX11性能GTX480却遥遥领先与HD5870。A卡的DX11性能为何如此不济?问题出在架构方面:
NVIDIA针对DX11中的几项关键技术,重新设计了GPU图形架构,加入了4组光栅化引擎和16组多形体引擎,这就使得GTX480在DX11 Benchmark和DX11游戏中的运行效率非常高,尤其是Tessellation性能。
而ATI为了抢先发布DX11显卡,只是在上代产品的技术上添加了DX11指令集而已,并没有针对DX11新的渲染流程和关键技术做优化。如此一来HD5000在DX9C/DX10游戏中的表现依然出色,但在DX11游戏中就出现了瓶颈,DX11特性使用越多,其性能就越差。
NVIDIA想要为GT200架构添加DX11和Tessellation支持是很容易的
于是,很多对GPU技术感兴趣的玩家和Nfan们对NVIDIA的做法大加赞赏,认为Fermi架构完全针对DX11的几大关键技术优化设计,可谓是原生DX11架构。而HD5800的架构则是R600架构植入SM5.0指令集而已,相当于是胶水或者桥接DX11架构,双方在DX11性能方面自然差距较大,而且是越来越大;
当然Afan们持反对意见,什么样的架构都无所谓,只要性能足够即可,在老游戏和早期的DX11游戏中其性能还是不错的,而且HD5000还有低功耗低发热的特性,等等。
争来争去,但凡涉及到技术与架构时,问题又回到了前面我们回顾过的“原生”与“桥接”或者“胶水”上面。那么您怎么看NVIDIA和AMD双方的真假DX11架构之争呢?只有经过广泛而又深入的讨论,才能对新产品与新技术又一个更加深刻的认识,欢迎大家各抒己见!■