智从何来?“数”说SNB的技术哲学
有着“智二代”美誉的英特尔酷睿(代码:Sandy Bridge)处理器一上市便好评不断,卖场里每日因此人满为患。从Nehalem到Sandy Bridge,架构的更替带来了太多令人匪夷所思的变化。如今互联网上“视觉应用”大行其道——在线视频、照片分享无疑是最热门的应用,Sandy Bridge处理器无缝融合核芯显卡,内置的InTru 3D技术和高速视频同步技术在日常均可提供前所未有的视觉体验,究竟“智二代”为何如此给力?让我们换个角度出发,让一组有趣的数字来揭示真相。
32
这个数字大家一定不陌生,因为按照英特尔的Tick-Tock发展模式,每两年就会对芯片制造工艺进行升级,曾经辉煌的45nm技术已经成为过去时。Sandy Bridge采用了业内非常先进的32nm制造工艺,第二代高-k金属栅极在晶体管中的采用,不仅大大提高了晶体管性能、降低了功耗,而且使漏电率降至新低。领先业界1年以上,英特尔早于2009年第四季度就采用这项新工艺进行量产。
在45nm晶体管中,高-k栅极的等效氧化层厚度为1.0nm。在32nm晶体管中,氧化层的厚度降低了10%,仅为0.9nm,而栅极长度则缩短为30nm,达到史上最小。这些变化对于提高芯片性能、缩小芯片尺寸至关重要,对于缩小集成电路(IC)尺寸、提高晶体管的性能至关重要。采用32nm制造工艺的芯片尺寸可比45nm产品降低大约70%,而在性能方面提高超过22%以上。与40年前相比, 32nm晶体管耗电量下降至之前的1/4000,单个晶体管的价格则下降至原价格的十万分之一。
1+1
也许你要问,9.95亿个晶体管,都用到哪里去了?这些晶体管开销除了用于为处理器提升性能与增加新功能,还有一个重要用途是:无缝融合新一代HD Graphics(核芯显卡),这就是“1+1”的含义。
众所周知,英特尔于去年1月推出了基于32nm Westmere架构的2010酷睿处理器家族,除了提升运算效率并降低平台功耗,2010酷睿还在功能整合方面取得了全新突破——显示芯片不再放置于主板北桥芯片中,而是被CPU“吞并”变成其一部分。换句话说,2010酷睿首次实现了将CPU与GPU两颗芯片封装在同一块基板上,并以高速的QPI总线为二者牵线搭桥。但是,在Sandy Bridge架构中,核芯显卡不再以独立的芯片形式呈现,而是完全融入这颗32nm芯片变成了处理器的一个功能模块,从核心架构图来看,这个模块占据的芯片面积几乎达到了1/4。
按照定位的不同,核芯显卡分为HD Graphics 3000和HD Graphics 2000两个型号,主要区别是前者拥有12个EU(执行单元),而后者只有6个。实测显示,新一代核芯显卡在3D性能上的提升极为明显,拥有12个EU的HD Graphics 3000可全面压制Radeon HD 4550 512MB,这说明其完全可匹敌主流级独立显卡。
2.0
有着两年历史的睿频加速技术随着Sandy Bridge的到来终于升级到了2.0版,这个令酷睿家族格外耀眼的神器再次迸发出新的活力,这次升级带来了哪些亮点?
大家知道,前一代睿频加速技术会根据处理器计算负载动态调节主频,例如Core i7 980X处理器默认主频3.33GHz,而经过智能加速之后最高可达3.6GHz,主频提高后程序响应速度也随之加快。作为一项限制措施,英特尔规定搭载第一代睿频加速技术的处理器,在加速模式下TDP不得超过标称值,因而主频通常只能提高1~2bin,即133~266MHz,多线程模式下加速幅度则通常只有1bin。随着并行计算正在成为未来趋势,用户越来越渴望他们的电脑在应对复杂的多任务处理时,也能表现得更为高效。这正是睿频加速2.0技术变革的主要方向——加速模式更具弹性。
Sandy Bridge的睿频加速技术2.0解除了加速模式下TDP不得超过标称值的限制,它允许处理器短时间(15~25s)地运行在超过标称TDP的频率,只有当温度达到设定阈值后,频率才会随之降低。需要注意的是,这是一个循环的过程:CPU加速→温度升高→主频降低→温度降低→再次加速。以酷睿i5-2500T为例,当睿频加速机制介入时最多能提升高达1GHz主频,由2.3GHz至3.3GHz,这对CPU性能的帮助是极为显著的。
值得一提的是,睿频加速技术2.0并非仅限于CPU核心,其核芯显卡也能从这套全新的体制中受益,例如酷睿i7-2600K的核芯显卡 3000显卡默认频率为850MHz,加速状态下可提高至1.35GHz。此外,CPU计算核心与核芯显卡之间会根据负载的需求实时调整睿频加速的侧重点,当系统要求更强大的CPU运算能力时,更多的TDP资源会帮助CPU来获得更高频率;而当图形运算负载显著增加时,TDP资源又会向核芯显卡倾斜以帮助其提高运行频率。
0
为什么是0?其实这是一个字母“O”,也许你猜到了,这里要向大家介绍的是Sandy Bridge的环形总线技术。
在Nehalem时代,一种高效率的数据传输模式被引入,它就是以点对点交换为特征的QPI总线。由于不用经过任何中间环节,QPI总线可以为处理器提供充足的资源带宽,这是FSB时代远远不可及的。随着Sandy Bridge的到来,处理器达到了前所未有的整合度,为了更高效地进行资源调度,英特尔引入了一种在服务器领域被广为采用的环形总线(Ring Bus)。
这种总线之所以得以采用,还要归结于Sandy Bridge全新的LLC(Last Level Cache,末级缓存,即L3)缓存机制。不同于Nehalem和Westmere,Sandy Bridge的LLC是一个共享组件,处理器核心、核芯显卡、系统助理(System Agent)都可以从中直接获取数据,数据交换发生时,环会自动从路径最短的节点接入以降低数据延迟。Sandy Bridge为什么会这么快?这就是其中因素之一。
995,126,547
这么大一个数字乍看让人迷糊,不知你是否猜到它代表什么?没错,它是Sandy Bridge 的酷睿i7处理器的晶体管数量——多达9.95亿个。尽管晶体管规模如此惊人,得益于优秀的制造工艺,处理器的整体功耗与发热量依然在前一代产品的基础上不升反降,酷睿i7 2600K处理器频率高达3.4GHz,而TDP只有95W,与此同时性能也得到了大幅提高。
让我们做个有趣的类比,如果一辆汽车拥有9.95亿个配件,那么即使让全球生产率最高的汽车制造商来装配,也需要114年才能完成整个工程;如果将处理器比作国家,而晶体管就是这个国家的人口 ,那么Sandy Bridge处理器凭借9.95亿“人口”将成为仅次于中国和印度的全球第三人口大国。
简言之,睿频加速技术2.0将第二代智能酷睿处理器的智能特性提升到一个新的高度,核芯显卡、高速视频同步技术以及InTru 3D则“非常给力”地诠释了Sandy Bridge的视觉表现力,这种“智能+视觉”概念无疑开创了PC应用新境界。如此说来,Sandy Bridge是里程碑式的产品毫不为过,以上寥寥几组数字也只能揭秘其众多卓越技术的冰山一角。随着数字时代的到来, 人们的日常工作与生活越来越需要Sandy Bridge这类智能芯片来提供强大的运算能力。智能计算,其实就在你我身边。