能否推倒i7?AMD推土机CPU架构全解析
分享
AMD推土机架构的设计理念不难理解,但更多人担心的是其核心执行效率,毕竟这些年来AMD在效能方面改进缓慢。如果CPU内核效率不行的话,整体架构再怎么优秀也不会有很好的综合表现。现在我们就来看看推土机内核相对于羿龙有何改进?
根据AMD官方发布的Bulldozer架构资料,推土机模块的指令解码宽度将从K7/K8/K10的每时钟周期三条微指令提升为四条。
推土机的前端指令解码和分派模块
这里我们把一个推土机的模块看作是一颗核心的话,里面有两个独立的整数核心,每一个都拥有自己的指令、数据缓存。虽然两个整数运算核心要比K10的三个少,但实际上其中任何一个核心的运算能力都要强于Phenom II。
Intel的Core架构无论整数或者浮点,都采用了统一的Scheduler(调度)派发指令。推土机构架使用独立的整数和浮点派发器,而且整数派发器有两个,对应推土机模块里面的两颗核心。
推土机模块和K10微架构对比图
推土机模块的两个核心支持执行两个线程,会共享对延迟要求较高的功能、平缓突发和低效应用、线程间动态分配资源,好处是比两个线程共享一个核心更高的伸缩性和可预测性、多线程负载的吞吐优势、单线程时所有共享资源均可访问、以少得多的面积和功耗提供物理核心80%的性能。
推土机模块的浮点运算单元是两个128位的FMAC(乘加运算器),这两个运算器可以被两个整数核心共享,如果其中一个整数核心获得的线程支持纯粹的整数操作,那么另外一个核心就可以获得全部的浮点执行资源。
这样设计的结果就是,推土机的单核效能将会比Phenom II强不少,而多核效能部分,整数运算能力很强,而浮点运算能力也不会太弱。
0人已赞