单芯时代来临 英特尔Nehalem产品规划
● 下一带全新架构——Nehalem
为迎合未来十年甚至更远的处理器市场发展,Intel发布了全新的Tick-Tock硅与微架构发展战略,于每年推出新处理器技术时,皆具备改良的微架构或是全新设计微架构,每个Tick代表推出具有增强微架构的新一代硅制程技术,与相对的Tock代表推出全新微架构,而每个Tick-Tock周期大约为2年。
因此按照既定规划,Intel已经在去年11月发布了代号为Penryn的下一代Core2处理器家族,基于全新45nm High-K金属闸极(high-kmetalgate)技术,及经改良的微架构设计,是最近一次的Tick。
接着今年的下半年,即将登场的下一代Tock全新微架构,产品代号为Nehalem,是Intel第一款使用Quick Path互联系统架构的处理器产品,Quick Path将包括集成的内存控制器技术以及改善的系统组件间通信链路,类似对手AMD的Inter connect及Crossbar设计,而且在多处理器作业下,每颗处理器可以互相传送数据,并不需经过芯片组,从而大幅提升整体系统性能。
(左)Intel院士兼Nehalem首席微架构工程师Glenn Hinton(右)2路四核心并支持HT的Nehalem实物运作
Nehalem微架构最高支持4颗处理器的Quick Path多路服务器环境,单一芯片最高可拥有2、4及8颗核心,支持经改良的Hyper-Theading技术,令单颗处理器最高可支持16 Threads,而且Nehalem架构中的Havendale亦将会内建绘图核心,不让AMD Fusion处理器专美。新增SSE4.2指令集及ATA指令集令系统性能全面提升,令人期待。
目前,Nehalem处理器已在去年8月正常运作中,并在去年9月的美国旧美山举行IDF论坛上首次公开展示,Intel院士兼Nehalem首席微架构工程师Glenn Hinton,在台上示范一台内建两颗四核心Nehalem服务器,达成了16 Threads运算。
● Nehalem:相同功耗下效能提升30%
由于Nehalem仍在Beta测试阶段,Intel仍未向外间提供Nehalem微架构白皮书,连主板业者对Nehalem微架构认知就只有去年美国旧金上IDF大会上的仅有资料,在综合主板业者收到英特尔的讯息后,我们归纳出以下数点:
1.Nehalem大部份微架构设计仍是沿自Yorkfield及Wolfdale,并拥有原生四核心设计。
2.Nehalem将支持类似Hyper-Threading的SMT技术,而在多线程运算效能是上代Penryn微架构高出1.2x-2x。
3.Nehalem单线程运算效能将会比上代Penryn微架构的1.1x-1.25x。
4.Nehalem大幅强化低负载及闲置状态时的功耗表现,进一步减少漏电情况。
5.Nehalem在相同功耗下效能比上代Penryn提升30%,或是在相同效能下功耗下降30%。
6.7组新增的SSE4.2指令,主要是强化Database作业,并加速数据传输效率,DB服务器效能提升明显。
此外,新一代Nehalem将会放弃FSB设计,采用全新的Quick Path Interconnect架构,现时已得知服务器版本的Nehalem处理器最高可拥有4组Quick Path Interconnect,并至少可组成四颗处理器的数据可直接互换的4Ways服务器架构。
● 2008-09年Nehalem桌面平台规划
根据Intel新旧桌面平台交替规划,2008年第四季将会推出针对高阶市场的Nehalem微架构产品,核心代号为Bloomfield的四核心处理器,北桥芯片代号为Tylersburg,南桥是采用现有的ICH10芯片,平台代号则为Tylersburg平台。
接着将会在2009年第一至第二季推出效能级Nehalem微架构产品,核心代号为Lynnfield的四核心处理器,此颗处理器将会内建大部份北桥功能,只需要配搭一颗Ibexpeak的南桥芯片。
最后则会在2009年第二季推出入门级至主流级Nehalem微架构产品,核心代号为Havendale的双核心处理器,同样内建大部份北桥功能,但将会内建绘图核心,同样将配搭Ibexpeak南桥芯片。
现时已得悉ibexpeak南桥芯片将会分为DigitialHome版本及DigitalOffice版本,DigitalHome平台代号定命为Kingscreek、DigitalOffice平台代号则为Piketon。
低阶方面,Intel暂时并没有规划以Nehalem微架构取代现有的Penryn产品,因此在2009年内,Wolfdale双核心将会是Intel低阶处理器的主力,配搭IntelG43芯片组及ICH10南桥。
● 面向高端平台的45nm Nelalem
其实一线主板厂商已拿到了初期的Bloomfield的处理器样本了,这颗全新的四核心处理器采用原生设计,45nm生产技术,不再像Yorkfield般采用两颗双核心封装的架构,支持类似Hyper-Threading技术并定名为SMT(Simultaneous Multi-hreading),由于是四颗核心共享相同的L2Cache,因此Bloomfield的L2Cache容量仅为8MB,但命中率相比Yorkfield的6MBx2更高。
放弃采用FSB设计,改用QuickPathInterconnect技术,能双向串联点对点传输,它可提供与FSB相近的Latency,可让软件及操作系统管理,并且针对部份Streams(Threading、ISOC、LT/VT)及outoforderrequests作出了优化,单向最高速度暂定为6.4GT/s,双向最高速合共10.8GT/s,相比AMD采用的Hyper-Transport3.0的速度更高。
Bloomfield将采用全新的LGA1366 Socket,Package Size为42.5x45mm,散热器设计虽然和LGA775类似,但Mounting Holes为80mm2,相较LGA775的72mm2更大,因此散热器不能另相兼容,VRM采用全新的11.1版本,最高TDP为130W。
据了解,Bloomfield并非只针对Enthusiast市场,Bloomfield预计将由$266美元以上起跳,并至少推出3款型号,较高级的Extreme型号将会是6.4GT/s的Quick Path Interconnect,接着的将会是4.8GT/sQuick Path Interconnect。
芯片组方面,全新的Tylersburg北桥芯片采用全新Quick Path Interconnect技术,内建四组PCI-Express2.0x8绘图接口,可组成x16绘图接口,或是支持Quad CrossFireX的四个x8绘图接口。
内存支持方面,它将会是首款支持6组DIMMs的nmTriple Channel内存技术的平台,最高支持DDR3-1600内存速度,最高容量为24GB,当然用家还是可以只插两组也能支持DualChannel。
据主板业者表示,作为首款而且是高阶的Nelalem产品,Bloomfield不内建内存控制器及PCI-Express,有助提升良率、减低风险,能提升超频潜力,而且Tylersburg芯片组规格强大,针对玩家市场吸引力高,是十分聪明的做法。
● 09年Q1推出首款集成北桥功能的处理器Lynnfield
Intel将会于2009年第一季末至第二季初,推出自家首颗内建北桥功能的处理器,核心代号为Lynnfield,这是一颗针对效能级至主流级的原生四核心处理器,采用45nm制程,同样支持SMT(Simultaneous Multi-Threading),L2Cache容量最高为8MB,规格上与Bloomfield十分相近,分别在于Lynnfield内建内存控制器,支持DualChannelDDR3内存配置,此外,Lynnfield亦内建了PCI-Express绘图接口,可支持1组PCI-Express2.0规格x16接口,或是分割成两组x8接口,支持CrossFireX技术。
由于已内建了大部份北桥功能,Lynnfield处理器并没有采用Quick Path Interconnect技术,连接南桥芯片仍会采用旧有的DMI协议,最高速度为2GT/s,由于南桥功能所需的传输速度较低,其实DMI协议已经绰绰有余。
Lynnfield处理器将采用全新的LGA1160 Socket,Package Size为37.5x37.5mm,虽然PackageSize大小与LGA775相同,而且散热器设计亦类似LGA775,但Mounting Holes为75mm2,相较LGA775的72mm2更大,因此旧散热器无法进渡至新平台。VRM方面同样采用全新的11.1版本,最高TDP为95W。
● 09年Q2推出首款内建绘图核心的处理器Havendale
接着在2009年的第二季末,Intel将会推出内建绘图核心的处理器,核心代号为Havendale,这是一颗针对主流级市场的双核心处理器,采用45nm制程,支持SMT(Simultaneous Multi-Threading),L2 Cache容量最高为4M。虽然同样内建内存控制器及PCI-Express绘图接口,但它却不是原生设计,Havandale把绘图核心、PCI-Express绘图接口及内存控制器制作成一颗芯片,与处理器核心采用MCP(Multi-Chip Package)封装在一起,两者将采用Quick Path Interconnect连接。
由于已内建了大部份北桥功能,Havendale同样只需采用一颗南桥芯片,不会采用Quick Path Interconnect技术,南桥芯片仍会采用旧有的DMI协议。
绘图核心方面,Havendale将会支持DirectX10、Shader Model4.0及OpenGL2.1,采用全新Unified Shader架构,Shader运算单元数目不仅由G45的10个增至12个,固定功能运算单元亦由6组提升至8组,其中一组就是为了高清影像译码而设的CABAC运算引擎。
高清影像运算能力,Havendale真正能做到完全硬件译码MPEG2、VC-1及AVC(H.264)影像,支持HWMotion Comp、InLoop Deblocking、Inverse Transform及VariableLengthDecode等工作,可支持40Mb/s的HD-DVD及Blu-RayFull Framerate影像播放。
值得注意的是,由于Havendale处理器内建了绘图核心,因此Havendale除了DMO协议外,还会有一组Display Link连接管道,把影像信息传至南桥,而新一代南桥将会内建Analog(VGA)及Digital(SDVO、HDMI、Display Port及DVI)图像处理单元,而且HDCPKey已内建于南桥芯片中,并不需要额外芯片。
Havendale将会采用LGA1160 Socket,与Lynnfield处理器互相兼容,同样支采用VRM11.1版本,最高TDP为75W。
● Intel未来走进单芯片时代 将推配南桥芯片的处理器—Ibexpeak PCH
由于新一代Lynnfield及Havendale已内建了大部份北桥功能,因此Intel未来将走进单芯片时代,称为PCH(Platform Controller Hub),首颗PCH核心代号为Ibexpeak。
Ibexpeak采用65nm制程,28x28FCBGA设计,支持6组SATA2.0硬盘接口,其中Port4及Port5支持FIS-basedMultiPort技术。此外,USB2.0数目将增至14个,令扩充能力进一步强化,而且使用RateMat ching Hub取代旧有的UHCI架构,令所有USBPort均支持HS/FS/LS模式,令省电效果更明显。
PCI-Express接口方面,Ibexpeak内建8组PCI-Express2.0x1接口,相比上代只有6组及只支持PCI-Express1.0更进一步。
为了进一步减低成本,Ibexpeak内建了Clock Chip Buffer,不单节省主板的BOM Cost,也可大幅减省PCB使用空间。
针对Digital Office平台,Ibexpeak将会支持更先进的AMT6.0版本,而且会加入硬件KVM(Keyboard Video Mouse)控制器,有别于软件KVM,它可以进行BIOSSetup、OSInstall、OSHang及Blue Screen时也能运作,方面网管人员理管及维修。
此外,Ibexpeak将会加入Direct NAND Controller,因此用家只需要加入ONFI connector规格的NAND内存,便能支持SSD(SolidStateDisk)功能及Danbury Encryption保安功能,取代需要ASIC的Intel Turbo Memory技术。
● Nehalem采用Turbo Mode技术,功耗将更低
值得注意的是,Intel将会在Nehalem桌面产品中加入Turbo Mode设计,这是类似Centrino平台的IDA(Enhanced Dynamic Acceleration)技术,当部份核心出现闲置情况,而其他核心将会进入TurboBin状态,核心频率将会被提高令效能进一步提升。
据了解,TurboMode将会按照处理器的功耗、温度及规格限制,在安全稳定的情况下进行加速,令部份多线程及单线程作者可加速完成。原理是透过ACPI Terminology机制,观察处理器的P1及P0状态把闲置的核心进入LMF(Lower Frequency Mode)状态,正运作中的核心则提升其频率,因此而提升的TDP将不会超过正常情况下所有核心运作中的最高TDP规格,此举将令处理器更具能源效益。
● 基于Nehalem架构的移动处理器—Clarksfield和Auburndale
除了桌面平台,Nehalem微架构亦会在2009年第二季末进军行动平台,分别有四核心的Clarkefield处理器及双核心内建绘图核心的Auburndale处理器,基本上这两颗处理器与桌面版本Lynnfield及Havendale架构相同,但功耗则大幅下降以满足行动平台对电池续航力的需要。
针对主流级的Auburndale双核心,其最高TDP值为45W,在数字上虽然惊吓,但由于它已内建了北桥功能,因此对比上代Penryn的35W再加上IGP北桥芯片的12W,其实差别不大。
效能级行动平台将会在2009年普及至四核心时代,采用Clarksfield四核心处理,但Intel诚诺把最高TDP保持在45W。
针对玩家的Extreme行动平台,同样会以Clarksfield四核心取代四核心的Penryn,不设锁频限制,最高TDP为55W。
[后记]:
对比AMD的事先张扬,Intel对于未来平台布局显得十分低调,除了Tick-Tock硅与微架构发展战略上的数个代号,鲜有对未来产品作出太早的宣示,但其实在背后已准备就绪,布局井然有序,经历惨遭AMDK8痛击的教训,让Intel不敢再怠慢,处理器双雄之争,对用家来说绝对是福气。
Nelalem赢定了吗?不一定。
如果以制程及微架构设计来说,未来两年仍会是Intel继续占优,但在芯片整合时代,绘图核心已开始内建于处理器之中,并购ATI后的AMD,在这方面绝对比Intel有更大的优势,这正是Nehalem最大的弱点,胜负仍然未能分晓,如果AMD能好好善用ATI的绘图技术优势,AMDK8光辉时代或许会再度出现。
如果没有双A合并,笔者可以肯定AMD将会兵败如山倒,就像棋盘对奕一样,高手对招计算已在10步之外,当年很多分析师也不看好AMD并购ATI,现时看来反而是AMD的非常好的出路,真的要佩服AMD CEO HectorRuiz的深谋远虑,突然想起了投名状的一句:大哥是对的!。
但笔者仍较看好Intel的前景。<