为何如此能超?解读推土机的设计实力
泡泡网CPU频道5月22日 在2011年10月中旬,AMD发布了旗舰级CPU产品推土机(Bulldozer)FX系列处理器,除了用户关心的绝对性能之外,推土机FX系列处理器强大的超频能力一直是业界关注的焦点。推土机CPU为什么拥有如此强大的超频能力?为什么AMD需要让这款产品成为新一代的超频明星?在CPU超频世界纪录频频被推土机CPU打破之时,我们也开始寻找一些隐藏在这颗CPU设计过程中的蛛丝马迹。
推土机FX处理器将采用“Bulldozer”微架构,全系列包含8核、6核以及4核处理器,其超强的可超频能力,全系列处理器均不锁频和丰富的指令集支持。推土机系列人气最高的莫过于FX-8150处理器,其8核处理器将成为目前业界唯一的面向台式机的8核心处理器。
推土机FX处理器拥有强劲的超频能力
推土机(Bulldozer)是AMD全新微处理器架构。“推土机”将采用32nm SOI工艺,采用了“模块化(Module)”的设计,每个“模块”包含两个处理器核心。每个Bulldozer Module将会集成2M L2缓存, 8MB的L3缓存,核心面积为30.9平方毫米。
推土机FX系列处理器的超频能力让每一个AMD用户非常自豪,早在2011年AMD就已经对外宣称其推土机FX系列处理器产品在制冷足够的情况下将“有着令人惊喜甚至不可思议的表现”。事实也证明了这一点,熟悉或者关注DIY超频领域的用户应该,早在两年之前CPU主频的世界纪录就突破了8GHz的大关,去年这个世界纪录的具体数字是8.308GHz,而现在,AMD的FX-8150已经将记录再一次改写并得到了吉尼斯世界纪录组织的认证,近期的CPU主频世界纪录是由AMD的FX-8150在2011年8月31日创造的8.429GHz。
推土机FX处理器正在创造更多超频奇迹
就在去年底,这一超频纪录再次被推土机系列CPU自己刷新。上图为台湾著名超频玩家Andre Yang现在又取得了8461.51MHz的更好成绩。和AMD官方的做法类似,Andre Yang也使用了优异型号FX-8150,同样屏蔽成了单模块双核心。根据CPU-Z认证页面的信息,这颗处理器的外频超到了272.95MHz,倍频为31x,核心电压已经加至1.992V,几乎突破了2V,而主板是推土机御用的华硕玩家国度Crosshair V Formula,内存使用海盗船的一条2GB DDR3,频率909.8MHz,时序9-9-9-24。
从架构来看,推土机是一款使用了全新架构的CPU,同时AMD历经长时间大规模重新开发让推土机和以前的所有CPU有极大的区别——推土机每一个整数单元有两个浮点单元包围,我们可以理解它是一颗自然的超线程处理器。作为AMD耗尽心血研发的新一代CPU,Bulldozer堪称K8之后的最大革新(K10架构只能算K8的增强版,架构变化并不多),它改变了传统CPU的设计思路,将CPU模块化,每个模块又可细分为两个微内核,这两个微内核相互独立而又高度共享浮点单元、L2缓存等功能单元。
推土机架构CPU每个内核自带双整数单元
得益于对CPU内核的彻底重新设计,AMD开始大手笔改变推土机CPU的流水线,AMD从K8架构也就是Athlon 64处理器开始将流水线提升到12级,这在当时是一个较为平衡的设计,它远低于Intel为了冲击频率高峰而达到的32级;其后Phenom II X4处理器为了提升频率将流水线提升到14级,而到了推土机Bulldozer FX系列处理器,流水线通过添加堆栈、寄存器等访问过程达到了18级。
CPU的流水线可以被比喻为“楼梯”,不管采用几级流水线,一个周期内所达到的高度都是一个楼层的高度。也就是说楼梯采用的阶数越多,坡度越小,同时路程也越长;这样对于构架一定的情况下,楼梯的阶数必然有一个非常好的值,流水线太长会导致分支预测失败后流水线重新载入代价太大,但是流水线太短又会导致CPU难以提升到理想运行频率。
流水线对于频率提升至关重要
众所周知,Pentium 4正是在流水管线上的加长设计,使之能够达到如此之高的主频,虽说流水管线的加长会导致数据在管线逗留的时间增长,导致数据出错的可能增加,一旦一个数据出错,其结果就在于整个运算步骤都将重新来过,这样就会造成处理器处理性能的降低。但依靠高效的分支预测体系和Cache机制就可以改善这一点。AMD经过多年探索,认为在多核心之路上仍然不能放弃单核性能,更不能因为提升频率而放弃效率,所以最终将推土机Bulldozer FX系列CPU流水线确定在18级,保证了频率和效率的平衡。
所有推土机FX系列处理器都支持Turbo Core自动超频技术
所以最终产品推土机CPU的频率也是非常值得欣喜的,我们可以看到推土机CPU依靠较长的流水线工位推升了运行频率达到稳定运行3-5GHz。AMD首批发布的四款CPU型号分别为FX-4100、FX-6100、FX-8150和FX-8120,全部都采用了不锁倍频设计。
推土机CPU在频率方面的努力还远不止默认频率的提升,通过Turbo Core技术,用户能够在日常工作中获得更高的CPU核心运行频率。我们用简单的总结可以将Turbo Core技术的原理阐述清楚:利用P-State电源管理状态切换。我们可以通过FX系列处理器的规格表格来了解一下全系列推土机FX处理器的Turbo Core情况。
与Intel相比,AMD在32nm方面的技术同样是非常完美的。AMD全球晶圆代工厂Global Foundries在90nm时代就和IBM展开了深入的合作。在今年初,GlobalFoundries与IBM再次达成了协议,利用现有资源和工厂共同生产32nm处理器。面对来势汹汹的Intel,IBM和GlobalFoundries终于携起手来,从技术和产能两个方面为AMD的APU和推土机处理器提供全方位支持。
GlobalFoundries生产的AMD 32nm工艺晶圆
制造工艺的改进理论上可以带来功耗的降低,使得产品的默认时钟频率可以更高,直接提升性能。相对于45nm工艺,AMD所使用的32nm工艺的NMOS和PMOS晶体管漏电量大幅度很多,如果芯片晶体管数量相同,32nm工艺同比封装尺寸仅是45nm工艺产品的70%。由于上述改进,电路的尺寸和性能均可得到显著优化。这种晶体管可以承受最高的驱动电流,并可以提升极限开关速度,配合应变硅SOI技术有效降低发热。
新的推土机FX系列处理器采用的是最新的32纳米制造工艺,在此之前的Llano APU其实也同样采用了相同的工艺技术。让我们换位思考一下,如果不采用32纳米技术,那么我们将看到极高的功耗和无法控制的芯片面积,所以32纳米就成为必然。
推土机使用了先进的32nm工艺
推土机采用GlobalFoundries的32nm新工艺(之前还一直维持在45nm), 除了SOI(Silicon On Insulator,绝缘硅)技术外,HKMG(高K金属门)工艺也被首次采用。使用HKMG工艺的好处是可以减少栅极的漏电量,降低栅极电容,这也是继续提高制程的关键技术之一。除此之外,11个铜金属层和低K电介质、基于硅锗的拉伸硅、第二代沉浸式光刻等技术也悉数在列,目的就是为了进而使得晶体管的尺寸进一步缩小,减小核心面积,降低整体功耗,提升频率潜力。
传统的CPU为了限制用户自主超频,在倍频方面几乎是无法调整的,即便拥有调整余地也只能向下设置以获得更低功耗。AMD自从Athlon X2黑盒时代打破这一格局,推出了可以向上调节倍频的CPU,以便为用户提供更强的超频潜力,同时更小幅度影响到周边硬件设备,在工艺成熟的背景下提供这种增值服务,也让我们看到了AMD对自家CPU产品的质量信心十足。
超频玩家通过液氮助力推土机达到8.335GHz高频
我们知道CPU总频率=外频X倍频,由于CPU的外频调节经常伴随着内存频率、北桥总线、PCI-E频率等一系列频率发生变化,所以大部分被锁定倍频的CPU在超频过程中会影响到内存、显卡、硬盘等硬件的稳定工作,超频幅度被限制。下图中我们看到的是某款990FX系列主板BIOS设置界面,第一项CPU Clock Ratio就是倍频调节选项,直接在这里设置比率,就可以在外频不变的情况下获取更高的核心频率。
推土机搭配990FX主板拥有丰富的超频选项
由于取消了倍频调整的限制,推土机CPU超频更加轻松,在超频过程中对内存、PCI-E频率的影响更小。推土机FX-8150的超频选项和以往的羿龙II没有什么区别,在990FX主板上能够调节的选项主要有倍频、外频、CPB倍频、内存频率等,相对基本上没有什么改变,用户可以通过修改倍频为主要方式进行超频。
风冷超频到4.5GHz的推土机FX-8150
电压选项方面,目前市面上的高端990FX主板提供CPU PLL电压、内存电压、CPU NB电压和CPU电压等多种选项,调节步进精细,调节范围也比较足,我们通过提升PLL电压和CPU电压来配合超频。上图中我们看到推土机FX-8150最终在1.31V电压下稳定超频到4.5G的水平,超频幅度达25%,可以通过AIDA64的3分钟稳定性测试,此时国际象棋成绩为13759,相比默认频率成绩提升约17.3%。
在32nm工艺的全方位配合下,通过改变CPU逻辑架构,加上完全不锁倍频的设计,AMD为高端DIY玩家带来了一款超频潜能极强的CPU。从目前的媒体与用户测试情况来看,推土机CPU的体制不同,极限频率也不同,推土机架构普遍超频能力比较强,风冷可以稳定达到4.5GHz左右,而配合AMD官方水冷可以稳定达到4.9GHz以上。按照关节能、调外频、倍频、升CPU电压、主板相关供电设置的顺序调节可以很轻松的实现超频。■<