泡泡网CPU频道 PCPOP首页      /      CPU     /      新闻    /    正文

落后的领跑者!AMD处理器先进技术回顾

   全球唯有实力的两大CPU生产商:INTEL和AMD。前者出生于1968,后者1969年诞生。然而彼此发展的道路却各不相同,时隔近40年过去,如今Intel已家财万贯(估计市值1600亿美元),而AMD创造历史收购ATI,欲打造1+1>2的时候,命运却开了AMD一个玩笑,导致目前只能看到1+1<1的结果,自此AMD+ATI市值不足40亿,比收购ATI时的价格还低上很多。在两者相差40倍的如此巨大差距下,今天的AMD依旧顽强的周旋在Intel左右,我们不得不感叹,渴望生存的力量是多么强大。

{imageTitle}

    两家成立仅相差一年,但一直以来,Intel都是以统治者的身份出现,而AMD则一直为了生存而苦苦挣扎。不过,AMD 一直是一个主张创新的公司,技术方面我们经常看到他从一个追随者转变成了领跑人,已经不再活在Intel的影子里,无论实力相差多么悬殊,也开始跳出来正面与Intel对抗,在处理器发展的道路上,很多时候,AMD甚至将Intel甩在身后,让Intel不得不追随其脚步。现在就让我们看一看在技术发展的道路上,AMD在哪些方面引领了业界的发展,令Intel不得不妥协的经典案例:

AMD:X86桌面平台64位处理器的鼻祖

    2003年美国时间9月23日,全球先进款桌面系统64bit处理器在美国正式发布。Athlon 64(服务器版本为Opteron)的诞生对于桌面处理器领域具有划时代的意义,这一次成功的走到了Intel的前面,这就意味着桌面世界将进入64位计算的新纪元。理想实现了,如今电脑市场上无论从低端的赛扬、闪龙还是到高端的酷睿、翌龙,满眼都是64位的CPU。

   

    64位计算的好处:

    64bit计算主要有两大优点:可以进行更大范围的整数运算;可以支持更大的内存。不能因为数字上的变化,而简单的认为64bit处理器的性能是32bit处理器性能的两倍。实际上在32bit应用下,32bit处理器的性能甚至会更强,即使是64bit处理器,目前情况下也是在32bit应用下性能更强。所以要认清64bit处理器的优势,但不可迷信64bit。

  从目前的情况来看,64位处理器的主要用户应该是对32位处理器能力局限很敏感的专业应用领域。由于传统的32位处理器只有4GB的内存寻址能力,因此系统装载的内存无论如何也无法超出甚至达到4GB的极限,这就给大型数据库、电脑辅助设计等应用带来很大的不便。

  而在64位处理器中,内存寻址能力得到了比较独特的扩大。AMD与Intel的64位解决方案都能提供至少4.5TB的内存寻址范围。保守地估计,这将足够应付今后五年的需求。此外,64位处理器对于设计汽车、卫星和其它复杂产品的电脑辅助设计软件而言也是极为重要的。

  对于广大桌面用户而言,64位计算也有重大的实际意义。在未来一段时间内,基于64代码的应用软件将大量涌现,而且在64位Windows XP/2003的支持下,常规的应用软件也能获得更加出色的性能。尽管目前内存技术、磁盘子系统的表现仍然严重制约着PC向更高方向的发展,但不可否认的是,CPU的性能上升还是有足够的空间。在3D游戏中利用64位技术,在PhotoShop中体验64位运算所带来的快感,并非天方夜谭!

    面对现实:Intel向AMD X86 64位妥协

  事实上,Intel早在AMD宣布Hammer系列处理器以前数年就开始开发一种全新的64位处理器,它不支持现有的32位CPU所采用的x86指令集,为了避免复杂繁琐的CISC结构x86指令集所带来的兼容性设计问题,Intel毅然放弃了将x86指令集延伸到64位的努力,转而开发一种全新的,与x86不兼容的IA-64结构。不兼容也就意味着升级不可能无缝,在新架构设计下的Intel Itanium和Mckinly处理器虽然性能卓越,设计先进,但都无法使用现有的任何32位程序。

  而另一方面,AMD作为Intel最大的竞争对手,一直在考虑如何让用户从32位无缝升级到64位,而Hammer系列就是最后的答案。Hammer系列处理器采用了x86扩展指令集——x86-64,一种由AMD定义的新型x86指令集,使用这种指令集固然造成了一些CPU设计上的困难,但最终达到的目的却是绝大多数用户所期待的。不仅家庭用户,不少企业级服务器使用的也是基于IA-32结构的x86指令集处理器,这些用户期盼着能在不受到经济损失的情况下获得全新硬件升级,而AMD则为他们带来了无比的希望。也正因为如此,Intel才会在继而推出的64-32兼容计划的核心内容Yamill,所以AMD可以说是桌面级无缝升级的64位的典型厂商,是普及64位的开山鼻祖。

    分析AMD  64位处理器技术:

    AMD64位技术是在原始32位X86指令集的基础上加入了X86-64扩展64位X86指令集,使这款芯片在硬件上兼容原来的32位X86软件,并同时支持X86-64的扩展64位计算,使得这款芯片成为真正的64位X86芯片。这是一个真正的64位的标准,X86-64具有64位的寻址能力。

{imageTitle}

    X86-64新增的几组CPU寄存器将提供更快的执行效率。寄存器是CPU内部用来创建和储存CPU运算结果和其它运算结果的地方。标准的32-bit x86架构包括8个通用寄存器(GPR),AMD在X86-64中又增加了8组(R8-R9),将寄存器的数目提高到了16组。X86-64寄存器默认位64-bit。还增加了8组128-bit XMM寄存器(也叫SSE寄存器,XMM8-XMM15),将能给单指令多数据流技术(SIMD)运算提供更多的空间,这些128位的寄存器将提供在矢量和标量计算模式下进行128位双精度处理,为3D建模、矢量分析和虚拟现实的实现提供了硬件基础。通过提供了更多的寄存器,按照X86-64标准生产的CPU可以更有效的处理数据,可以在一个时钟周期中传输更多的信息。

    分析英特尔64位处理器技术:

    Intel官方是给EM64T这样定义的:EM64T全称Extended Memory 64 Technology,即扩展64bit内存技术。EM64T是Intel IA-32架构的扩展,即IA-32e(Intel Architectur-32 extension)。IA-32处理器通过附加EM64T技术,便可在兼容IA-32软件的情况下,允许软件利用更多的内存地址空间,并且允许软件进行32 bit线性地址写入。EM64T特别强调的是对32 bit和64 bit的兼容性。Intel为新核心增加了8个64 bit GPRs(R8-R15),并且把原有GRPs全部扩展为64 bit,如前文所述这样可以提高整数运算能力。增加8个128bit SSE寄存器(XMM8-XMM15),是为了增强多媒体性能,包括对SSE、SSE2和SSE3的支持。

    Intel为支持EM64T技术的处理器设计了两大模式:传统IA-32模式(legacy IA-32 mode)和IA-32e扩展模式(IA-32e mode)。在支持EM64T技术的处理器内有一个称之为扩展功能激活寄存器(extended feature enable register,IA32_EFER)的部件,其中的Bit10控制着EM64T是否激活。Bit10被称作IA-32e模式有效(IA-32e mode active)或长模式有效(long mode active,LMA)。当LMA=0时,处理器便作为一颗标准的32 bit(IA32)处理器运行在传统IA-32模式;当LMA=1时,EM64T便被激活,处理器会运行在IA-32e扩展模式下。

    不论Intel是否抄袭了AMD的技术,在64位的支持上,AMD的确是走在了Intel前面,并且改变了处理器的发展方向。按照Intel原来的计划,是要大力推广IA64架构Itanium系列,并且日程上要落后许多。如果没有AMD,绝对不会出现当前64位普及的盛况。

AMD:性能卓越的内存控制器

    内存控制器(Memory Controller)是计算机系统内部控制内存并且通过内存控制器使内存与CPU之间交换数据的重要组成部分。内存控制器决定了计算机系统所能使用的最大内存容量、内存BANK数、内存类型和速度、内存颗粒数据深度和数据宽度等等重要参数,也就是说决定了计算机系统的内存性能,从而也对计算机系统的整体性能产生较大影响。

    AMD处理器内集成内存控制器

    从1997年开始,我们从EDO过渡到了SDRAM,从PC66过渡到PC133,从SDR过渡到DDR再到现在DDR2,甚至到DDR3。我们也能看到DDR SDRAM是如何轻易的使Athlon处理器增加了20%~30%的性能。我们也能看到内存颗粒制造商想方设法的降低内存的潜伏期。又看到了由于某些主板芯片组集成了性能低下的内存控制器而拖累了性能强劲的处理器。而在K8架构的hammer出现彻底的消除了这些隐患。

风雨历程 AMD一路走来带给我们什么?

    在hammer中最重要的技术革新就是将内存控制器集成到了处理器内部,从而代替了传统的北桥芯片的内存控制器。这会减小不同芯片组中内存效能的差异。会使处理器在设计之初就达到理想的内存效能。另外,内存控制器可以同处理器的始终频率同步,从而根本上降低了潜伏时间。随着处理器的频率的提高,还会继续缩短潜伏时间。这也可以更加简化芯片组的设计,降低主板的成本。


AMD平台的内存性能高出Intel很大一截

AMD集成内存控制器有很多优点 比较突出的是三点:

    第一、传统的计算机系统其内存控制器位于主板芯片组的北桥芯片内部,CPU要和内存进行数据交换,需要经过“CPU--北桥--内存--北桥--CPU”五个步骤,在此模式下数据经由多级传输,数据延迟显然比较大从而影响计算机系统的整体性能;而AMD的K8系列CPU(包括Socket 754/939/940等接口的各种处理器)内部则整合了内存控制器,CPU与内存之间的数据交换过程就简化为“CPU--内存--CPU”三个步骤,省略了两个步骤,与传统的内存控制器方案相比显然具有更低的数据延迟,这有助于提高计算机系统的整体性能。

    第二、CPU内部集成内存控制器可以使内存控制器同频于CPU频工作(现在CPU工作频率一般都在2G以上) 而北桥的内存控制器一般就要大大低于CPU工作频率 系统延时就更加少

    第三、CPU内部集成内存控制器 由于内存数据不经过北桥有效的降低了北桥的工作压力为北桥减低可负担

   CPU内部集成内存控制器是K8 K10 CPU的一大设计亮点,我们不得不佩服AMD的工程师们,K8架构中的很多设计理念实在太棒了,有些甚至是超前的思想。就算是现在的扣肉虽然在总体性能上远远超过,但是在内存性能上扣肉相对于K8 K10来说还是望尘莫及。像整合内存控制器和HyperTransport这类技术,确实左右着处理器的发展,同时也引领着Intel未来处理器的设计路线。

    效仿AMD,新架构Intel处理器集成三通道内存控制器

    然而AMD在内存性能上独领风骚的好日子似乎已到了尽头,之前虽然扣肉在性能上大幅领先AMD K8甚至K10,但是内存性能上却有所不如,这是因为AMD采用的CPU集成内存控制器方法更有性能优势,Intel却碍于面子不予采用,不仅不用,Intel还吃不到葡萄说葡萄酸,曾经列举了多项理由,表示不集成内存控制器好处多多……


新一代Intel 45nm的Nehalem构架处理器

    然而AMD在内存性能上独领风骚的好日子似乎已到了尽头,Intel下一代新架构,内存控制器就将与图形核心一起走入Intel处理器的内部。Intel 45nm的Nehalem构架中将会迎来整合内存控制器。而Intel不仅仅是简单集成,据了解,Nehalem架构下的原生四核心处理器Bloomfield将具备三通道DDR3内存控制器,支持DDR3-1600规格,可提供38.4GB/s带宽,相比目前的双通道20GB/s左右几乎翻了一番,同时内建的图形核心也能因此获得更好的性能表现,尤其是在3D游戏里。

{imageTitle}
Intel 整合内存控制器(IMC)示意图

    AMD 2001年就把内存控制器整合到了处理器中,时至8年Intel才将要实现这一功能,可以说这是对AMD的技术肯定而不得不妥协。所以Intel之前发表的一系列内存整合无用论自然也不攻自破,新一代架构中AMD和Intel在内存性能方面又重新走到了起跑线(甚至Intel更快),CPU性能落后的AMD,如果在今后的道路上再丢掉内存性能的头把交椅,以后的路将会很难很难,究竟鹿死谁手,只能期待两大高手如何博弈了~

AMD独有的HyperTransport技术

    HyperTransport技术是AMD除了内存控制器以外另一项叫Intel俯首称臣的功能,Intel称之为前端总线,受诸多限制目前频率也就能达到了1600Mhz,AMD称为HT总线,目前HT3.0频率可以达到2600MHz,就本质而言,其HT的频率也就相当于前端总线的频率,所以在这方面Intel还是落后的。

应用广泛的开放的HypeTransport总线

    从总体技术角度来看,Intel和业界从来没有否定过AMD内置内存控制器和HT总线技术的先进性,不过倒是AMD近年常用HT总线互联的多核心CPU来为难Intel,说得委婉些AMD认为Intel的四核心CPU并非原生四核设计。的确,Intel多年来使用的将内存控制器至于北桥芯片的方案,需要CPU与北桥芯片间足够带宽的FSB(Front Side Bus,前端总线)来交换CPU缓存与内存间数据。虽然Intel也将FSB速度的不同用以区分产品高低定位,但以酷睿2架构产品(台式机)最低端FSB 800MHz到最高端FSB 1600MHz也可以看出FSB对现有Intel CPU的重要性,而这一重要性在高端应用尤其是服务器领域更为突出。

    HyperTransport(超级传输通道)的起源

    HyperTransport(超级传输通道)是由AMD开发的一种“点对点”的数据传输总线,最先应用于NVIDIA开发的nForce芯片组的南北桥中。现在HyperTransport又大量的应用于Hammer的系统中,而在Hammer中,HyperTransport技术不仅仅是点对点的传输方式了。系统会在多条HyperTransport之间传递数据。

风雨历程 AMD一路走来带给我们什么?

    HyperTransport总线可以像DDR那样在一个时钟周期内传输两次数据。并且它的总线宽度与工作频率都可以改变的。通过不同的组合可以给用户很多种选择,这样使用HyperTransport技术可以在性能和制造成本之间找到很好的平衡。

    在典型的AMD 64架构中,为了解决处理器与内存进行数据交换时延迟较大的弊端,AMD把原有的北桥芯片一分为二,将传统位于北桥芯片中的内存控制器和北桥总线接口集成到处理器中,新的北桥芯片通过外置Hypertransport总线与处理器连接。

  这样一来,HyperTransport总线所承担的只是相当于“图形总线+南北桥总线”的I/O作用。尽管HyperTransport 2.0的8.0GB/s带宽在目前看来似乎已经足够,但随着NVIDIA和ATI并行显卡方案(如SLI、Quad SLI和CrossFire)的日渐流行,新游戏引擎和新特效的使用,图形数据交换量将会越来越大;同时处理器的核心数量也在不断增加,明年我们就会见到四核心处理器;因此在显卡和处理器飞速发展之时,AMD推出了第三代HyperTransport系统总线。

    HT3.0的发展与崛起

    随着时间的推移,HyperTransport也必然面临着进一步更新升级。HyperTransport 3.0提供了较HyperTransport 2.0的1.4 GHz更高的频率,达到了1.8 GHz、2.0 GHz, 2.4 GHz和2.6 GHz,并且提供最大5.2 GT/s速率、41.6GB/s的带宽,比HyperTransport 2.0足足快了86%,同时还可以兼容目前广泛存在的Peripheral Component Interconnect (PCI)、PCI-X、PCI Express技术。

『HyperTransport 3.0和HyperTransport 2.0、HyperTransport 1.X的规格对比』

    除了速度上更快以外,上图可以看到HyperTransport 3.0还有一些特性是此前版本HyperTransport所不具备的,其中包括在处理器中没用到的AC operating、Link splitting(连接分割,也被叫做un-ganging)、Hot Plugging(热插接)以及Dynamic Link Clock/Width Adjustment(动态链接时钟/位宽调整)。

    HT总线优势遭遇反击:Intel推出新CSI总线

    天生就是为双核而来的高速总线技术基础为AMD的K8系列赢得了将近三年的荣誉,虽然AMD一直保持着内存与总线的优势,可是正逐渐的被Intel一一打破,曾经的辉煌不知还能持续多久? 

    除了内置内存控制器外,推出CSI总线算是Intel又一壮举,Intel将QuickPath互联总线引入了Nehalem CPU和平台中,其中只有代号Bloomfield四核心CPU将支持QuickPath总线,这款CPU将通过QPI与北桥芯片Tylersburg-DT相连,而这颗北桥芯片的主要作用则是提供了两条PCIE 2.0 16X通道。Intel并没有说明在同一CPU内的四个或多个核心需要通过QPI连接,这与AMD方案不同。以双核心酷睿2双核心CPU效率表现来看,Intel的共享二级缓存互联双核架构是明显优于AMD HT互联下的双核架构(Nehalem多核心内部是否由QPI连接有待确认,安腾多核心将采用QPI相连)。

{imageTitle}
Nehalem QPI总线示意图

 QuickPath最大的改进是采用单条点对点模式下,QuickPath总线其数据吞吐量可以达到惊人的32GB/s(这仍是逊色于AMD的Hypertransport3—单条连接最大传输带宽可以达到45GB/s,但我们相信未来英特尔仍会对QuickPath进行进一步提速改进。)QuickPath最大的特点就是支持多条系统总线连接,并且频率不再是单一固定。根据系统各个子系统对数据吞吐量的需求,每条系统总线连接的速度也可不同,这种特性无疑要比AMD目前的Hypertransport总线更具弹性。因此,英特尔可以轻易将带宽提高到更快——英特尔使用的是4路+1QPI互连方式(4路针对处理器设计,1路针对I/O设计),而AMD将在未来的微处理器上也只使用的4路HT3连接方式。



  为了降低QuickPath总线的延迟,Intel打算在4路处理器以上的系统中使用一种叫做粘贴缓存的技术。它主要是倚赖更大容量的二级高速缓存来存储南桥和北桥的数据,使处理器不必反复通过QuickPath总线来读取南北桥信息。然而对于桌面应用来说,QPI基本没有太多用武之地,它将被Intel更多用于服务器高端领域CPU与CPU、CPU与芯片组以及CPU与协处理器的连接。根据目前掌握的信息来看, Quickpath高速互连方式使得处理器与处理器之间的峰值带宽达到每秒96GB而AMD的HT 3.0传输速度为每秒41.6GB。

AMD创新桌面处理器节能技术:Cool‘n’Quiet

    在桌面级处理器节能和降温方面AMD再次先行了一步,率先的推出了Cool‘n’Quiet功能,虽然CPU节能技术最早是由Intel推出的,但是只是针对移动产品,而面对日益高功耗产品的推出,桌面级处理器也面临着节能的需求,Cool‘n’Quiet应运而生是必然的结果,然而Intel不得不跟进时代潮流,模仿AMD,把之前移动处理器节能技术EIST同样内置在桌面处理器中,但毕竟还是晚了AMD一步,实有模仿之嫌。

何谓Cool‘n’Quiet?

  实际上,Cool‘n’Quiet最早出现在2002年初。日本AMD公司于2002年1月18日在东京宣布该公司在新型处理器Athlon XP使用了一种低耗电技术,该项技术被命名为“清凉安静技术(Cool‘n’Quiet Technology)”(以下简称CnQ)。这项技术使处理器可以根据所执行的运算工作来改变自己的频率,降低处理器的发热量,减小CPU风扇的工作量。

  CnQ类似于移动版Athlon 64所采用的PowerNow!技术,AMD把PowerNow!更名为Cool''n''Quiet还有一个目的,因为该技术并不仅仅是节能,还能让电脑更安静的运行。该技术可以在处理器负荷不重的时候降低其主频和核心电压,以减小处理器的发热量,使散热风扇的转速相应降低,以达到静音的目的。而英特尔通过SpeedStep技术也可以达到同样的效果。它可自动调节处理器的工作频率,并搭配测温器件,自动调速散热器达到降温静音效果。可以这样认为,Athlon 64的CnQ技术几乎可以与Intel PentiumM中所使用的SpeedStep技术和Transmeta Crusoe中的LongRun技术相媲美。但是,早期Intel和Transmeta的低功耗节电技术都是面向笔记本电脑的,而在桌面CPU中最早使用这种低功耗节电功能的应是AMD的产品了。

   Cool‘n’Quiet的使用价值更多是体现在高频率(高PR值或高标号)的Athlon 64和Athlon 64 FX身上,单比较最高功耗,Athlon 64和Athlon 64 FX比Prescott核心的Pentium 4只是稍好一些,但Cool‘n’Quiet技术却让二者出现质的差异:Cool’n’Quiet允许各款Athlon 64和Athlon 64 FX最低运行在1GHz,1.1V电压的状态下,性能大概与Athlon XP 1500+相当,完全可满足正常办公和娱乐的需要,而此时它的功耗仅有22W。在实际使用中,办公处理、多媒体娱乐、网络浏览等日常应用总是占据大部分,籍由Cool‘n’Quiet 技术,Athlon 64和Athlon 64 FX可长时间工作在低耗电环境下。比较保守的估计,它的平均功耗会在40至60W左右,对散热系统不会造成任何负担,风扇也可低噪音运行,称之为Cool‘n’Quiet的确颇为贴切。 

   Cool‘n’Quiet需要处理器硬件、驱动程序和主板BIOS三方面的支持,AMD的新一代Athlon 64、Athlon 64 FX、Athlon 64 X2以及部分Socket 754/939接口的Sempron产品都支持该项技术,只要安装最新的CPU驱动便可以感受到Cool‘n’Quiet带来的“低温体验”。凭借这项技术,AMD终于在功耗问题上大翻身,过去它的产品一直给人高功耗、高发热的印象,英特尔的产品则口碑优良,而现在情况刚好反过来。 

    严格来说CnQ并非什么全新的技术,Intel和AMD针对笔记本平台的移动CPU都拥有这种节能技术,比如大家所熟知的SpeedStep和PowerNow。但将节能技术移植到台式机这还是头一次!之后CnQ技术受到了用户的普遍欢迎,以至于Intel也开始在桌面CPU中加入节能技术。现在GPU的晶体管、核心面积、功耗和发热量早已超过了CPU,可是一直以来显卡的功耗和发热问题都没能得到重视,即便您不玩游戏,显卡还是要白白的浪费很多电力、制造一些烦人的噪音、并且源源不断地发出废热!

CPU内嵌的防病毒技术:AMD率先推出

  CPU内嵌的防病毒技术是一种硬件防病毒技术,与操作系统相配合,可以防范大部分针对缓冲区溢出(buffer overrun)漏洞的攻击(大部分是病毒)。AMD的防病毒技术是EVP(Ehanced Virus Protection),Intel的防病毒技术是EDB(Excute Disable Bit),但不管叫什么,它们的原理都是大同小异的。严格来说,目前各个CPU厂商在CPU内部集成的防病毒技术不能称之为“硬件防毒”。首先,无论是Intel的EDB还是AMD的EVP,它们都是采用硬软结合的方式工作的,都必须搭配相关的操作系统和软件才能实现;其次,EDB和EVP都是为了防止因为内存缓冲区溢出而导致系统或应用软件崩溃的,而这内存缓冲区溢出有可能是恶意代码(病毒)所为,也有可能是应用程序设计的缺陷所致(无意识的),因此我们将其称之为“防缓冲区溢出攻击”更为恰当些。

    但防毒芯片的最初应用,是AMD和微软联合宣布的,WindowsXP SP2补丁将开启AMD64处理器中的Enhanced Virus Protection(增强病毒防护)技术。AMD的Enhanced Virus Protection安全技术将与微软SP2中的Data Execution Prevention技术相结合,可以监测出已知的病毒,尤其对那些缓冲区溢出病毒以及传播速度快的病毒有很好的抑制效果。

  AMD Enhanced Virus Protection技术是通过在转换物理地址和逻辑地址的“page translation table”中增加新的比特位(NX bit)来实现。是一项当初内嵌AMDAthlon(速龙)64台式电脑和移动电脑处理器中的硬件功能。通过结合Windows XP SP2中的数据执行预防技术,可识别特定的恶意代码(尤其是执行缓存溢出攻击的代码)并且防止它们在整个系统中自我复制和扩散。

    而作为竞争对手而言,Intel的防病毒芯片技术EDB,虽然效果一样,但却晚了几个月才出现,所以说AMD是率先推出防病毒芯片的厂商。

 断Intel后路:AMD最新宣布下代架构新指令集:SSE5

    英特尔公司今年4月发布了SSE4指令集,而时隔不到半年,AMD近期又给Intel来了个意外“惊喜“,突然宣布了基于x86架构的扩展指令集“SSE5”,并计划配备在K10之后的下一代“Bulldozer”核心架构中,预计2009年推出实际产品,这让人们对于AMD未来处理器的有了更大的信心,由于之前业界接受比较广泛的还是Intel的SSE系列指令集,AMD的3DNow!指令集应用比较少。所以一直以来AMD在指令集方面都只上跟随在英特尔之后,这次终于尝到了领跑的感觉。

{imageTitle}

{imageTitle}

    从Core到Penryn再到Nehalem,Intel的工作重点之一便是不断升级的SSE4指令集,而AMD则直接拿出了SSE5,竞争对手直指同样定于2009年登场的Intel 45nm工艺全新架构Nehalem。当然我们知道,从SSE到SSE4都是Intel制定的,AMD虽然有对应功能的指令集但名称均有所不同,而这次突然命名为SSE5,无疑是断了Intel的“后路”,双方是否会因此惹出争议甚至对簿公堂还很难说。

SSE5支持SSE4a,但未必完整支持SSE4

    AMD表示,SSE5指令集的使命之一是增强高性能计算应用,并充分发挥多核心、多媒体的并行优势。SSE5将把以往只存在于高性能特殊架构里的功能引入到x86平台中,以此最大化每条指令的输出能力,并增强代码库。SSE5是128-bit指令集,一共有170条指令,其中基础指令64条,新增的最重要的有两条:

    首先是“三操作数指令”(3-Operand Instructions)。x86指令以往只能处理双操作数,而SSE5会提高到三操作数,达到RISC架构的水平,从而把多个简单的指令集整合到更高效的一个单独指令中,提高执行效率。然后是“熔合乘法累积”(Fused Multiply Accumulate,FMACxx)。该技术可以把乘法和其他算法结合起来,保证之用一条指令就能完成迭代运算,从而简化代码、提高效率,适用于真实图形着色、快速照相渲染、空间化音频、复向量(矢量)数学等场合。除此之外还有整数乘法累积指令(IMAC,IMADC)、置换与条件移动指令、向量比较与测试指令、精度控制舍入与变换指令等等。

    SSE5是第一个非Intel团队提出来的SSE管理模式,也说明AMD迫切希望摆脱跟跑困境,重新体验领跑的感觉。虽然现在K10才刚刚接任,但AMD方面已经开始筹划新的管理革命了,而这一次,SSE5确实也将带来更多新的东西……

    AMD下一代处理器的精华:Fusion的整合型处理器

    CPU+GPU整合是AMD处理器未来的发展方向,AMD已多次表示,将在2009年推出首款代号“Fusion”的整合型处理器。一般来讲,一款芯片的研发周期在5年左右,那么如此推算来看,“Fusion”应该已经进入了研发中期。假设CPU+GPU可以成功推出,这将对Intel是个不小的打击,毕竟玩家追新的观念很深,但前提是性能要令人满意。

AMD透露CPU+GPU架构细节:联合也独立

    据AMD介绍,Fusion中的CPU和GPU将是一块硅晶片(die)上的两个独立核心,而不是完全融合在一起。CPU部分拥有自己的缓存,GPU部分同样如此。将CPU和GPU互联的是交叉开关(CrossBar)和集成内存控制器,而各个单元之间通过HyperTransport总线连接成一个整体。CPU和GPU都可以直接访问系统内存,不过GPU看起来没有自己的帧缓冲。

    另外,虽然Fusion将CPU和GPU合而为一,但AMD-ATI将继续研发、生产独立显卡,因为AMD认为高端用户和物理计算仍然需要它们。AMD称:“相比目前单纯的CPU架构,Fusion架构处理器将在‘性能每瓦特每美元’上提供阶梯式的提升,并在日益依赖3D图形、数字媒体和高性能计算的今天提供非常好的用户体验。”

    据说第一款Fusion处理器被命名为“Shrike”,将包括双核Phenom处理器加ATi RV800图形核心。并且,台积电(TSMC)将会使用40nm工艺制造Fusion Shrike处理器。

    Shrike是AMD旗下第一款CPU + GPU的芯片产品,之前曾有传言说Shrike会选用Puma处理器和TV710图形芯片,如今曝光的这些信息的确让人意外。现在AMD还有比较充足的时间把相对低端的RV800图形芯片集成到Fusion处理器芯片中。RV800支持DX10.1,其性能比55纳米-40纳米的图形核心强不少。

    在CPU领域,英特尔是绝对的霸主。自从奔腾系列芯片发布并采取新的市场策略后,“INTEL INSIDE”的广告和商标几乎贴编了世界的各个角落,市场份额连续飚升。英特尔全球电脑CPU的市场占有率在80%以上,在单一行业,英特尔的“垄断”地位只有微软才可以与之媲美。

{imageTitle}
只有竞争才有进步!期待AMD的Fusion会有惊喜

    现在几乎可以称之为英特尔唯一追赶者的AMD,虽然明知相差悬殊但仍锲而不舍,在市场上,屡战屡败连年亏损,但仍然在年复一年地顽强挑战着英特尔。其实仔细看来,AMD的存在并不只是为了“防止CPU的绝对垄断”,事实上,AMD不仅不是英特尔的模仿者,在技术创新上已经开始发力并不断的创新,部分技术一直领先着英特尔。或许业界“英特尔不再是一个技术公司,而是一个可怕的营销公司”这句话有一定代表性,想想英特尔发布“超线程”CPU时中国有多少PC巨头簇拥吆喝?看看路边的广告牌四处都是“扣肉”的身影!Intel的身影铺天盖地的席卷着我们的视野,这也是AMD最逊色之处。


新一代架构Nehalem处理器,AMD估计无法招架

    这里不得不要说一下,Intel的Core微架构和即将推出的Nehalem架构相比AMD都相当出色,让Intel稳坐业界霸主地位,其五大创新特性,强调性能/功耗比等都非常值得肯定,例如生产工艺,AMD始终处于落后状态。但我们无法否认,AMD很多技术的确在引领着处理器的发展方向,同时一定程度上也带领Intel前进。
  <

3人已赞

关注我们

泡泡网

手机扫码关注