45nm最强平台!Core i7+X58深度解析
编者按:假如说2004年6月21日915芯片组的到来,为我们带来了Intel近十年来最重要的变革:新CPU插座-Socket 775、新的总线-PCI Express以及新内存规格-DDR2。而4年之后的X58告诉我们,摩尔定律真的不能再等10年了,LGA 1366、DDR3、PCI-E 2.0、SLI也已经不能再等10年了。
集成电路芯片上所集成的电路的数目,每隔18个月就翻一番。
微处理器的性能每隔18个月提高一倍,而价格下降一半。
用一美元所能买到的电脑性能,每隔18个月翻两番。
阿基米德在澡盆里发现了“浮力定律”,牛顿在苹果树下获得"万有引力",而引领PC发展的Intel在激烈的市场中,创造了“摩尔定律”。从摩尔定律提出那一年开始,“IC上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍”的规律,就一直不断向市场兑现。
在Intel内部称为“时钟一般的精确的嘀嗒嘀嗒小步跑”,在45nm技术带来了又一次的改变后,这一次取代65nm制成的45nm制成CPU变大了、内存变成了三通道了,近十年的老朋友FSB也变成了QPI,超线程技术又一次回归了。
在融合的时代,Intel赋予了CPU更多的使命,虽然我们已经做好了CPU整合更多功能的准备,但是这次突如其来的改变,还是让所有的人大吃一惊。
i7+X58来了,带来了一连串的改变,也带来一脸的迷茫和疑问、争议。
习惯让竞争者悲伤,让追捧者亢奋的Intel,早在1999年至2002年间,英特尔试图用RambusDRAM改变SDRAM标准,最终功败垂成。2002年,英特尔又“重装上阵”,改用DDR标准全盘封杀SDRAM的存在。时间走入2004年,英特尔再度用2年时间,用DDR2标准甩开DDR的束缚。而这次三通道DDR3的应用,是否能带动行业再一次追随Intel转向呢?
一向以行业标准制定者自居的—Intel,在引领PC行业大步前进的时候,丢掉陈旧的设计,以尖端技术领先众多竞争对手,是Intel在技术上一直追求的,然而这次Core i7为什么重新启用奔四时代的超线程技术?
今天Corei7+X58的到来,肩负着改变行业标准的使命,QPI、DDR3、超线程、PCI-E 2.0、内存控制器、Turbo Mode等一系列新技术接踵而至。
面对如此多的改变,我们将会从规格到性能一一讲解,现在我们就开始,你准备好了吗?
当45nm工艺的LGA 1366处理器一经面世,硕大的身材,优异的设计,使得媒体对于Nehalem身影的捕捉,达到了一个疯狂地步。紧接着P45家族产品才出货不到一季,Intel开始移情别恋,开始推出一代芯片组X58的产品做准备。
● 跟随Tick-Tock节奏 Nehalem如期而至
自2006年Intel发布了革命性的酷睿2处理器,凭借着高效能的特点,将AMD苦心经营的性能宝座重新握在手中,重新挽回了自己的颜面。对AMD的一系列胜利,Intel并没有冲昏头脑,继续按照自己的钟摆tick-tock(即英特尔芯片技术与微体系结构创新发展步调模式)节奏稳步发展。
进入07年底,钟摆tick-tock的摆针摇到了tick这一侧,Intel也按计划推出了改进工艺制造的Penryn处理器,随着45nm工艺产能的提高,Intel迅速将45nm工艺处理器推向主流市场,将AMD牢牢压制在自己脚下。
步入08年底,在老对手AMD窘态频出,为注入资金频于奔命,45nm技术迟迟不见上马的情况下,Intel的钟摆tick-tock节奏继续着自己的脚步运转。摆针这次摇到了TOCK一侧,架构升级的Nehalem降临了!
● 代号Core i7!从LGA775摇身变成LGA1366
那么,英特尔Nehalem处理器自然成为了变革的一代,在习惯了LGA775接口、习惯了CPU会变得越来越小、功耗越来越低、工艺越来越先进。然而LGA1366接口的CPU一到,让我们大吃一惊,CPU体积居然又变大了,这意味着之前的主板不能用了,LGA775的散热器也要全部废弃,而更多的疑问:“英特尔葫芦里卖的是什么药?”先别急着下结论,让我们一步一步的来了解。
Core i7 Extreme Edition 965(左)、Core 2 Extreme QX9770(右)
Nehalem架构处理器的产品代号为Bloomfield,有别于之前的命名,英文品牌名为Core i7,但中文品牌名字还叫“酷睿”。初期上市的产品有三款,分别是Core i7-920、Core i7-940和Core i7 Extreme Edition 965。
Core i7 920 |
Core i7 940 |
Core i7 Extreme Edition 965 | |
产品编码 |
BX80601920 |
BX80601940 |
BX80601965 |
制程 |
45nm |
45nm |
45nm |
接口 |
LGA 1366 |
LGA 1366 |
LGA 1366 |
晶体管数 |
7.31亿 |
7.31亿 |
7.31亿 |
核心线程数 |
4核8线程 |
4核8线程 |
4核8线程 |
主频 |
2.66GHz |
2.93GHz |
3.2GHz |
二级缓存 |
4x256KB |
4x256KB |
4x256KB |
三级缓存 |
8MB |
8MB |
8MB |
QPI总线 |
4.8GT/s |
4.8GT/s |
6.4GT/s |
内存控制器 |
三通道DDR3-1066 |
三通道DDR3-1066 |
三通道DDR3-1066 |
TDP |
130W |
130W |
130W |
售价 |
284美元 |
562美元 |
999美元 |
从规格来看,首批上市的三款Nehalem处理器全部采用45nm工艺,并且新增了三级缓存和QPI总线技术,而且内存控制器默认为三通道DDR3-1066,彻底抛弃DDR2内存。通过内存控制器设计,Nehalem处理器达到了酷睿2处理器的4倍内存带宽,这样就可以更好的支持超线程的应用。好了,相信大家对于Nehalem处理器架构的改变非常的期待了,赶快看接下来的内容吧。
● 核心智能管理 单核多核按需定
Nehalem作为英特尔第一款原生4核处理器,采用45纳米制造工艺,内置内存控制器,拥有4x256KBbytes二级高速缓存,8M三级共享缓存。通过SMT技术,可将物理4核虚拟成8逻辑核心、三通道DDR3内存通过QPI连接。
拥有原生4核物理核心,并通过SMT技术可以模拟出逻辑8核心,但对目前的应用来说,大多情况下,多核心不可能同时运行,用户的大多情况下,只需要少量核心运行即可满足需要。有鉴于此,INTEL此次对节能技术再度进行升级。核心可以通过系统负载,在单逻辑核心到八逻辑核心动态转换。
多数应用中我们不可能使用到8核
这项节能技术称之为Turbo Mode,CPU可以自动开启此功能,即CPU识别用户的当前负载情况,彻底关闭其中两个物理核心,减低功耗,同时自动加压超频另外两个物理核心,提高CPU频率,进而降低CPU的总体功耗,并可在一定条件下提高CPU整体效率。
● 系统带宽质的飞跃 超线程得以回归
当年酷睿架构诞生之初,由于架构设计原因,毅然放弃了HT超线程技术,而此次英特尔原生4核的Nehalem,作为处理器微架构升级的产物,性能提升是必然的。由于微架构的变化,并发多线程技术Simultaneous Multi-Threading(SMT)得以回归,可有效提升多线程工作负载的性能,多线程运算效能比上代酷睿Penryn性能高出不少。Nehalem微构架的SMT功能支持每内核同时运行两条线程,照此计算,一个四核处理器可同时运行8条线程。
但需注意的,引入的并发多线程技术,和当年P4时代HT超线程技术一样,并非真正意义上的核心加倍。举个例子来说,一个物理核心通过SMT技术模拟出两个逻辑处理器,处理器处理多线程运算时,每个逻辑处理器均独立运行,一个逻辑处理器运行线程时,另外一个逻辑处理器运行其它线程。为避免资源冲突,负责运算第二个线程的处理器,使用的还是第一个线程运行时闲置的处理单元。通俗来讲就是一人挑两担。
该技术的初衷是好的,但任何事物都不是完美的,超线程技术也有局限性。尽管多加入了一个逻辑处理器,4物理核心处理器可以模拟成8核心逻辑处理器,但处理器的整数运算单元,浮点运算单元以及CPU缓存仍旧是8个核心分享从前4个核心的资源。这样的话,当两个逻辑处理器有需要处理数据时,不可避免地会发生争抢资源的现象,其中一个逻辑处理器必须暂定运算让出宝贵的资源,直到资源闲置后再行运算。
由于逻辑处理器争抢资源的问题,在P4时代,同时执行两个线程容易使CPU运算产生延时,换句话说,要想超线程技术的优势得以体现,内存带宽的要求就要很高,进入酷睿架构后,因为内存带宽没有任何提高,所以放弃超线程技术成了理所当然的事情,而Nehalem由于内置三通道内存控制器,内存带宽相当惊人,并且延时超低,所以拾起超线程技术是顺理成章的事情。
● CPU集成内存控制器 内存进入三通道时代
CPU中集成内存控制器,是一把双刃剑,虽然能提高系统的性能,主要是降低系统延时,但CPU的频率提升因此变得很难,还有不小的制造成本。也正因此,集成内存控制器一直是个大家乐于讨论的问题,孰优孰劣,一直争论不休。不可否认的是,当AMD集成内存控制器,并通过HT总线连接系统的时候,已经缩小与INTEL之间的技术差距。
在AMD推出集成内存控制器近5年后,英特尔终于将推出了集成内存控制器的CPU,而为了压制竞争对手,保持技术领先者的姿态,一上来就引入了3通道DDR3,引领内存带宽达到新的高度。
根据英特尔的资料,Nehalem的内存控制器为Integrated Memory Controller,简称IMC。规格上支持三通道DDR3内存,初期最高支持到1333MHz,不过像个别一线厂商的高端主板支持oc到1600MHz的规格。同时,IMC支持乱序读取可以有效降低延迟,而且每通道均可独立运行,无疑在一定程度上提高了兼容性问题。但稍感遗憾的是,Intel似乎没有照顾低端用户的意思,IMC仅支持目前价格昂贵的DDR3。
● 放弃传统FSB 引入QuickPath技术
既然集成了IMC内存控制器,那么就需要能与之匹配连接到CPU核心的高速连接。英特尔将此技术命名为QPI(Quick Path Interconnect),和之前AMD的HT(Hyper Transport)颇为相像。
英特尔QPI技术提供点到点的高速链路来分配共享内存,从而充分释放下一代英特尔45纳米微架构(代号为Nehalem和Tukwila)的并行处理性能。这些全新设计的微架构将首次采用英特尔的QuickPath互联系统,在整体性能上实现了重大改进。
不仅如此,现在QPI还有很大的升级弹性,未来的Nehalem和Tukwila微架构整合新的英特尔QuickPath技术之后,每个处理器核心都将拥有集成的内存控制器和高速互联,把处理器和其他组件连接起来,动态可扩展的互联带宽,可以全面释放Nehalem、Tukwila和未来英特尔多核处理器的性能。后面,我会给大家详细解释QPI的互联技术用途。
● 指令集再升级 提高文本处理
CPU中的指令集,虽然不起眼,但是在CPU的运算中有重要加速作用,若使用的软件对CPU的指令集有优化,那么CPU的运算效能较无指令集优化运行速度有很大提升。
英特尔的Core2架构处理器的SSE4(流式单指令多数据扩张)指令集包含了54条新指令,其中的47条指令在Wolfdale/Penryn上实现,被称作SSE 4.1,SSE4除了扩展Intel EMT64指令外,还针对高清编码、播放、图形渲染、三维渲染、3D游戏应用进行了多方面的改进,使得产品的性能在更大范围内得到提升。
SSE指令集作为INTEL的顶梁柱,重要些不言而喻。每次的SSE指令集升级,都牵动着英特尔不少心血,除了自身研发指令集外,如何能让众多软件支持新指令集是更为关键的问题。
那么,此次Nehalem架构的SSE4指令集再度扩展为SSE4.2 ,由于Penryn中的SSE4.1占据了大部分指令,所以Nehalem中的SSE4.2仅是小幅升级,新加入的7条指令集,有效提升XML,sring和文本处理的性能,可以说是对SSE4.1的修补。
你是否觉得曾经在486、586电脑里那个叫“Turbo”加速功能吗?也许当时这个为了防止程序过快运行的设计,被您曾经称呼过“鸡肋”设计,当Core i7增加了这个设计后,您是否感到过困惑?
在Core i7和X58身上,您大可放心,因为这个功能与以往完全不同了。
这次命名为“Turbo mode”的功能,它是基于Nehalem的“Integrated Power Gate”电源管理技术,它允许关闭一些核心,而将电力加至其它核心,让他们以更高的频率运行,整个CPU的TDP仍保持不变。
【实例——改变多核处理不如高频双核处理器”的观点】
举一个例子,假如你使用Core i7的4核处理器,恰巧您玩的游戏没有经过双核优化,结果游戏时只使用1个核心,其余的三个核心就浪费了,CPU的3/4功能没有发挥。而Core i7这时会将其他三个核心关闭,减少CPU的功耗和发热量,然后将真正起作用的核心超频以获得更高的性能。
这项技术的目的是优化CPU的使用效率,有望改变“多核处理不如高频双核处理器”的观点,不过也有人提出,“Turbo Mode”会使手动超频更加复杂,因为如果CPU已经被预先超频,那么开启“Turbo Mode”就很危险了。
首批发布的Nehalem Core i7处理器TDP为130W,在这个TDP设定范围内用户可以开启一种名为Turbo的技术来提升CPU在某些应用中的时钟频率。例如在大型3D游戏中,可能多核心并不能带来明显的效能提升,对处理器进行超频反而效果更好,如果这个时候开启Turbo模式,并且将TDP设定在用户所采用的散热器允许范围内,那么CPU在这个时侯可以对某颗或某两颗核心进行动态超频来提升性能。
英特尔Nehalem的“Turbo Mode”自超频技术。Turbo技术会动态的调整处理器中不同核心的频率。用户还可以在BIOS中指定一个TDP数值,处理器会根据此数值动态的调整核心频率。如果用户拥有良好的散热措施,甚至可以把TDP调整到最高190瓦。当然,一般来说140瓦甚至更低的数值便已经足够日常使用。在英特尔的测试中,通过“Turbo Mode”功能,不少游戏在相同的运行环境下,得到了大约10%的性能提升。
英特尔表示,使用“Turbo Mode”功能之后,计算机的处理能力“几乎等于增加了第二块显卡”。用户的满意度究竟如何呢?还得看它在广大用户使用后的反馈。
上面的CPU部分就介绍到此,下面的芯片组和主板的解析部分,由我的同事武文斌为大家做详细的介绍,共同解读Intel的这款Chipset的同时,找出问题的答案。
经历了4年的LGA775接口终于迎来了它改变的时候,当Intel的X58带着DDR3内存、全新的LGA1366接口、三通道内存设计……的时候,我们知道Intel终于开始带来改变了。
一向被竞争对手攻击为没有个性的原厂主板,这次绽放出了异彩。全新的设计布线,独特的内存、供电设计风格,原厂X58也开始搞起了形象设计。
带有浓烈的“标准工厂”气息的,英特尔原装X58主板,以6层黑色PCB板、蓝色的散热片和内存插槽,以及醒目的Intel骷髅头告诉我们。这是Intel制造。
X58主板上的CPU供电模块,使用了6相供电模式,相对于高端主板来说,6相供电并不出彩,值得注意的是除了每相都使用了优质的全封闭电感以外,每相的电流滤波都是使用的高品质固态电容,Mosfets管还被放置在了散热片下,可以有效防止其温度过高。
从图中可以看到主板的布局,和LGA775接口的主板有一些区别,不论是CPU、北桥、内存之间的位置距离,还是内存插槽的个数,都告诉我们,X58带来的不仅仅是用北桥连接内存,将由CPU直接连接内存并进行控制,的设计改变,更多的是这样布局上改动,可以让CPU更好的实现对内存的控制,得到更好的性能效果。
X58主板上的扩展接口部分,包括了2条PCI-E 2.0 x16插槽和1条PCI-E 2.0 4X插槽以及2条PCI-E 2.0 1X插槽与1条PCI插槽,目前该主板能够支持Crossfire X。
主板的I/O接口部分,包括了两个E-SATA接口和8个USB接口,值得注意的是X58主板不在支持PS/2接口,以后在X58主板上就只能使用USB接口的键盘和鼠标了。其他的1394接口和网卡接口、光纤输出接口等,显得中规中矩。Intel DX58SO
[报价查询] 主板产品报价 Intel主板产品报价<
2007年,英特尔将从65纳米制程工艺向45纳米过渡。2008年,推出不过才一年的Bearlake芯片组,就被Eaglelake所替代,在我们还没来得及喘口气的时候,Nehalem又来了。有人说Intel每逢奇数年架构更新的话,45nm时代有一个发酵的产物就是X58。
翻开Intel的Roadmap资料,原本空空如也的2008年的Q4突然多了一个新的芯片名称—X58,因为它的存在,Intel好比一辆高速行驶的汽车,接口的改变让英特尔又开始进入了一个新的弯道,突然提速让很多用户感到了不适应,被抨击“没有进取心、产品没有本质变化的Intel”因为规格的改进,让用户感到了不适用。
·采用LGA 1366接口,封装面积更大
·支持8八线程四核心处理器
·采用3通道内存设计,提供更高带宽
·8MB的共享缓存
·提供更多PCI-E 2.0通道(2X16和4X8的方案)
·更多的SEE4
X58北桥芯片还是采用65nm工艺制造,因此核心(DIE)面积很大,而且主板从业人员透露明显要比现在任何芯片组都热得多,主要原因是它要通过高速QPI总线和处理器进行通信。X58可提供36条PCI-E 2.0信道,所以可支持双x16模式的CrossFire/SLI,还剩下四条信道,既可以用于第三条PCI-E x16插槽,也可以用于几条PCI-E x1插槽。
LGA1366+X58性能 比上代架构提升30%
据台湾主板业者指出,Intel公布最新Nehalem微架构产品规划,第四季末将推出三款Bloomfield四核心处理器,核心频率介乎2.66~3.2GHz。新一代Nehalem微架构放弃了旧有FSB,改用全新Quick Path Interconnect架构,因此并不兼容于旧有平台,采用全新Socket LGA1366,将配搭新一代X58芯片组,预期效能将比同上代Penryn微架构提升15~30%。
根据Intel最新桌面处理器规划,XE版本的Bloomfield,采用全新LGA 1366处理器接口,核心频率为3.2GHz,原生四核心并支持类似 Hyper-Threading 的SMT 技术,因此同一时间最高可处理8个Threads。
Bloomfield XE版本内建8MB L3 Cache,放弃FSB设计改用全新Quick Path Interconnect架构,处理器与芯片组传输速度为6.4GT/s,内建Tri-Channel内存控制器,支持最高DDR3-1333模块,FMB版本为08,最高TDP为130W。
|
|
|
|
Processor Generation |
Nehalem |
Nehalem |
Nehalem |
Process |
45nm |
45nm |
45nm |
Socket |
LGA1366 |
LGA1366 |
LGA1366 |
Cores/Threads |
4/8 |
4/8 |
4/8 |
QPI Speed |
6.4GT/s |
4.8GT/s |
4.8GT/s |
L3 Cache |
8MB |
8MB |
8MB |
Integrated Memory Controller |
Yes, 3ch |
Yes, 3ch |
Yes, 3ch |
Memory Support |
DDR3-1333 |
DDR3-1066 |
DDR3-1066 |
FMB |
08 |
08 |
08 |
TDP |
130W |
130W |
130W |
IntelVT |
Yes |
Yes |
Yes |
Intel TXT |
No |
No |
No |
EIST |
Yes |
Yes |
Yes |
Intel 64 |
Yes |
Yes |
Yes |
Lead Free |
Yes |
Yes |
Yes |
Halogen Free |
Yes |
Yes |
Yes |
Order Available |
Q4, 2008 |
Q4, 2008 |
Q4, 2008 |
值得注意的是,Intel一改以往推出新微架构时,初期仅针对高阶市场的作法,Bloomfield除了XE版本外,将会同时发布两款针对主流级至效能级型号,核心频率分别为2.66GHz与2.93GHz,同样拥有8MB L3 Cache及支持SMT技术,但Quick Path Interconnect速度下降至4.8GT/s,内存支持速度亦下调至最高支持DDR3-1066。
新平台支持Quad CrossFireX多显卡协同运算
由于改用全新Quick Path Interconnect架构,因此Bloomfield与旧有平台并不兼容,除了改用全新LGA 1366处理器接口外,同时亦配搭全新X58芯片组,新平台加入Quad x8 PCI-Express绘图接口支持,可支持Quad CrossFireX多绘图卡协同运算。
◎ 2007年高端旗舰:X48(替代X38)
2007年Intel为了接替975芯片组,祭出了X38芯片组,没想到还不足一年,Intel又送出了X48芯片组,对比之前的975芯片组,这两款芯片组除提升至支持1333MHz FSB外频之外,并同时内建DDR2及DDR3内存控制器,最高可支持至DDRⅡ-800及DDR3-1333模组、Bearlake-X也提升至PCI-Express 2.0。
肯定有读者要问X38为何有推出了X48?事实上,X38与X48芯片早本身就是孪生兄弟。一切都是为了调整原有的芯片布局而生。
◎ 2007年高端旗舰:548(替代X48)
X58北桥芯片还是采用65nm工艺制造,因此核心(DIE)面积很大,而且主板从业人员透露明显要比现在任何芯片组都热得多,主要原因是它要通过高速QPI总线和处理器进行通信。
X58可提供36条PCI-E 2.0信道,所以可支持双x16模式的CrossFire/SLI,还剩下四条信道,既可以用于第三条PCI-E x16插槽,也可以用于几条PCI-E x1插槽。
通过两款芯片组的介绍,想必您会了解到,统一芯片组的布局结构,打造专属玩家的平台,乃至日后推出单芯片设计的芯片组,整合了更多功能的CPU,一切都是为了细化产品线,此举就是为了英特尔未来十年的一个局。
●FSB生命进入倒计时,学会生活在QPI时代
习惯了谈论FSB——前端总线(Front Side Bus,简称FSB)的我们,面对QPI时代的到来,以后再谈论CPU连接到北桥芯片的总线时,QPI将是一个崭新的朋友,作为渠道FSB,成为新一代CPU和CPU、CPU与芯片组(CPU与内存)之间的连接总线,QuickPath Interconnect(简称QPI)的总线技术,Nehalem成为了推动FSB生命终结的死亡使者。
让FSB去死的唯一理由,就是没足够宽的前端总线带宽,即使配备再强的CPU,用户也不会明显感觉到计算机整体速度的提升。接替它的QPI可以满足这一需求。
小提示:目前Intel处理器主流的前端总线频率有800MHz、1066MHz、1333MHz几种,进入2007年后,Intel在11月又将处理器前端总线提升至1600MHz(默认外频400MHz),这比2003年最高端的800MHz FSB总线频率整整提升了一倍。这样高的前端总线频率,其带宽有多大呢?前端总线为1333MHz时,处理器与北桥之间的带宽是10.67GB/s,而提升到1600MHz能达到12.80GB/s,增加了20%。
●FSB最大杀手——前端总线瓶颈
也许很多人会认为,Intel处理器的前端总线频率已很高了,还有必要换吗?作为Intel来说也许很高,但是对比内存带宽、显卡带宽相比,CPU与芯片组的前端总线瓶颈依旧没有根本的改变,例如:1333MHz的FSB所提供的内存带宽是1333MHz×64bit/8=10667MB/s=10.67GB/s,其与双通道的DDR2 667正好匹配,但如果使用双通道的DDR2 800、DDR2 1066的内存,这时候FSB的带宽就小于内存的带宽。面对承担普及DDR3、以远远领先竞争对手的Intel来说,这是无法容忍的,更何况X58带来的三通道高频率DDR3内存搭配了(Nehalem平台DDR3 1333内存的带宽可达32GB/s)FSB无法提供支持,面对这些问题,FSB必须被抛弃。
●Intel不能忍了——FSB以全面落后Hyper Transport
当全世界都对Intel Inside拥有非常好的印象的时候,作为Intel的CPU领域竞争对手,AMD推出的HyperTransport(HT)总线技术相比,FSB的带宽瓶颈也很明显。
小帖士:HT作为AMD主板CPU上广为应用的一种端到端总线技术,它可在内存控制器、磁盘控制器以及PCI-E总线控制器之间提供更高的数据传输带宽。HT 1.0在双向32bit模式的总线带宽为12.8GB/s,其带宽便可匹敌目前最新的FSB带宽。2004年AMD推出的HT 2.0规格,最大带宽又由1.0规格的12.8GB/s提升到了22.4GB/s。而最新的HT 3.0又将工作频率从HT 2.0最高的1.4GHz增到2.6GHz,提升幅度几乎又达一倍。这样,HT 3.0在2.6GHz高频率32bit高位宽的运行模式下,它即可提供高达41.6GB/s的总线带宽(即使在16bit位宽下它也能提供20.8GB/s带宽)值得注意的是,HT 3.0技术应付近两年内内存、显卡和处理器的未来需要也没有问题。
作为Intel来说,虽然CPU的市占率上它可以全面领先,崇尚技术的英特尔,面对这种带宽上劣势,虽然采取多种方法,但是并没有能够带带来根本的转变,换句话来说,Intel假如可以将FSB提升到2133MHz,面对DDR3以及交火、SLI等多显卡系统带来的带宽需求时,FSB依然没有办法满足它们的带宽需求,QPI必须被推到前台。
●(一)QPI究竟能给我们带来什么呢?
面对上述困难,Intel也清醒地认识到,再单纯提高处理器的外频和FSB,已难以带来更好的性能提升,保守的使用FSB将会成为AMD乃至其它竞争对手诟病之处,因此全新的Nehalem架构让我们看见了英特尔变革的决心。
采用全新的Socket 1366接口,45nm制程,集成三通道DDR3内存控制器(支持DDR3 800/1066/1333/1600内存规格),使用新总线QPI与处理器进行连接,支持SMT(Simultaneous Multi-hreading,单颗处理器就可以支持8个线程并行运作)多线程技术,支持SSE4.2指令集(增加了7条新的SSE4指令),是Intel第一款原生四核处理器……
CPU接口的改变引发了人们探寻变革的理由,FSB被抛弃了新的QPI能给我们带来什么?
【架构上】
●(二)QPI互联架构本身具有升级性
QPI采用串联方式作为讯号的传送,采用了LVDS(低电压差分信号技术,主要用于高速数字信号互联,使信号能在差分PCB线对或平衡电缆上以几百Mbps以上的速率传输)讯号技术,可保证在高频率下仍能保持稳定性。QPI拥有更低的延迟及更良好的架构,将包括集成的存储器控制器技术以及改善的系统组件间通信链路。
Nehalem平台将具备很好的扩展弹性,因为QPI互联架构的数量可以根据用户将来对中央处理器的需要进行增加或者减少。QPI具备的这种可让Nehalem中央处理器体系架构可扩展性的特点,不受核心的限制,这对于构建服务器高性能集群非常有利。
●(三)QPI总线架构具备高可靠性和性能
可靠性,实用性和适用性特点为QPI的高可用性提供了保证。比如链接级循环冗余码验证(CRC),自愈型连接能避开错误区域重新进行自我配置来启用连接中好的部分。出现时钟密码故障时,时钟能自动改路发送到数据信道。QPI还具备热插拔能力来支持诸如处理器卡这种节点的热插拔。深度改良的微架构、集成内存控制器设计以及QPI直连技术,令Nehalem拥有更为出色的执行效率,在单线程同频率条件下,Nehalem的运算性能在相同功耗下比现行Penryn架构的效能同比提高30%。