为何如此能超?解读推土机的设计实力
从架构来看,推土机是一款使用了全新架构的CPU,同时AMD历经长时间大规模重新开发让推土机和以前的所有CPU有极大的区别——推土机每一个整数单元有两个浮点单元包围,我们可以理解它是一颗自然的超线程处理器。作为AMD耗尽心血研发的新一代CPU,Bulldozer堪称K8之后的最大革新(K10架构只能算K8的增强版,架构变化并不多),它改变了传统CPU的设计思路,将CPU模块化,每个模块又可细分为两个微内核,这两个微内核相互独立而又高度共享浮点单元、L2缓存等功能单元。
推土机架构CPU每个内核自带双整数单元
得益于对CPU内核的彻底重新设计,AMD开始大手笔改变推土机CPU的流水线,AMD从K8架构也就是Athlon 64处理器开始将流水线提升到12级,这在当时是一个较为平衡的设计,它远低于Intel为了冲击频率高峰而达到的32级;其后Phenom II X4处理器为了提升频率将流水线提升到14级,而到了推土机Bulldozer FX系列处理器,流水线通过添加堆栈、寄存器等访问过程达到了18级。
CPU的流水线可以被比喻为“楼梯”,不管采用几级流水线,一个周期内所达到的高度都是一个楼层的高度。也就是说楼梯采用的阶数越多,坡度越小,同时路程也越长;这样对于构架一定的情况下,楼梯的阶数必然有一个非常好的值,流水线太长会导致分支预测失败后流水线重新载入代价太大,但是流水线太短又会导致CPU难以提升到理想运行频率。
流水线对于频率提升至关重要
众所周知,Pentium 4正是在流水管线上的加长设计,使之能够达到如此之高的主频,虽说流水管线的加长会导致数据在管线逗留的时间增长,导致数据出错的可能增加,一旦一个数据出错,其结果就在于整个运算步骤都将重新来过,这样就会造成处理器处理性能的降低。但依靠高效的分支预测体系和Cache机制就可以改善这一点。AMD经过多年探索,认为在多核心之路上仍然不能放弃单核性能,更不能因为提升频率而放弃效率,所以最终将推土机Bulldozer FX系列CPU流水线确定在18级,保证了频率和效率的平衡。
所有推土机FX系列处理器都支持Turbo Core自动超频技术
所以最终产品推土机CPU的频率也是非常值得欣喜的,我们可以看到推土机CPU依靠较长的流水线工位推升了运行频率达到稳定运行3-5GHz。AMD首批发布的四款CPU型号分别为FX-4100、FX-6100、FX-8150和FX-8120,全部都采用了不锁倍频设计。
推土机CPU在频率方面的努力还远不止默认频率的提升,通过Turbo Core技术,用户能够在日常工作中获得更高的CPU核心运行频率。我们用简单的总结可以将Turbo Core技术的原理阐述清楚:利用P-State电源管理状态切换。我们可以通过FX系列处理器的规格表格来了解一下全系列推土机FX处理器的Turbo Core情况。