CPU/GPU真融合!Intel新酷睿权威评测
第三章 SandyBridge处理器核心架构解析
第三章/第一节 SandyBridge核心架构改进总览
Intel Core i系列处理器拥有一套革命性的体系架构,包括大容量完全共享式的三级缓存、整合的内存控制器以及QPI快速互联总线。无论是Nehalem、Westmere还是最新的SandyBridge微架构,其CPU部分的架构是基本相同的,改进的只是处理器指令集以及外围功能和控制模块。
从Nehalem到Westmere,制造工艺从45nm进化到32nm,新增AES加密解密指令集,Turbo Boost睿频加速技术升级,从原来的多核+1倍频单核+2倍频、增强至多核+2倍频单核+4倍频。
从Westmere到SandyBridge,制造工艺没有变化,但CPU+GPU的整合模式有了革命性的改进,两者之间不再通过QPI总线互联,而是将GPU的运算单元作为处理器内核的一部分,GPU可以直接使用CPU的三级缓存以及内存控制器,将CPU和GPU相互通讯时的延迟降到了最低。
SandyBridge处理器模块示意图
由于GPU嵌入到了CPU内核当中,所以三级缓存以及内存控制器的共享和负载平衡算法都需要做相应的改进,SandyBridge的微架构相比上代改变是巨大的。Intel声称新的三级缓存和内存控制器相比上代产品无论带宽还是延迟都有了不小的进步,以满足CPU和GPU双方运算单元的存取需要。
SandyBridge处理器架构与功能简介
此外,SandyBridge新增的AVX(Advanced Vector Extension)高级矢量扩展指令集并不是一般意义上的指令集扩充,它需要对CPU和GPU的运算单元底层寄存器重新设计,从而获得更强的浮点运算能力,从根本上改进CPU浮点运算能力较弱、图形和视频处理消耗资源过大的现状,后文中笔者会详细介绍AVX指令集的威力。
当然,SandyBridge的Turbo Boost睿频加速技术也升级到了2.0版本,与Westmere微架构相比,自动超频幅度更大,对于负载的判定更加准确,而且可以智能的分配CPU和GPU的负载,同时对CPU和GPU进行超频。