Conroe为何如此强?简析酷睿五大创新
许多朋友经常会问,为什么Intel新一代Conroe处理器性能会如此强?相比之前的奔腾4、奔腾D简直是天壤之别。实际上,新一代Conroe处理器基于的Core(酷睿)微架构相比之前的Netbrust架构有80%以上的部分是重新设计,并且加入了5大创新技术。
Intel宽位动态执行(Intel Wide Dynamic Execution)
当今衡量一款处理器的性能水平,已经不能再单纯的以频率的高低考量,而是更强调“每瓦特性能”,也就是所谓的能效比。性能=频率×每个时钟周期的指令数 是Intel新提出的对性能的创新理解,Intel宽位动态执行的出发点,就是为了提升每个时钟周期完成的指令数升,从而显著改进执行能力和能效。
Intel酷睿微架构拥有4组解码器,相比上代Pentium Pro(P6)/PentiumII/PentiumIII/Pentium M架构拥有3组可多处理一组指令,简单讲,每个内核将变得更加宽阔,这样每个内核就可以同时获取、分配、执行和退回多达4条完整的指令。
Intel酷睿微体系结构在提升每个时钟周期的指令数方面做了很多努力,例如新加入宏融合(Macro-Fusion)技术,它可以让处理器在解码的同时,将同类的指令融合为单一的指令,这样可以减少处理的指令总数,让处理器在更短的时间内,以更低的功率处理更多的指令。为此Intel酷睿微体系结构也改良了ALU(Arithmetic Logic Unit)部份以支持宏融合技术。
Intel智能功率能力(Intel Intelligent Power Capability)
Intel智能功率能力,可以进一步降低功耗,优化电源使用,从而为服务器、台式机和笔记本电脑提供个更高的每瓦特性能。新一代处理器在制程技术方面做出优化,采用了先进的65nm Strained Silicon技术、加入Low-K Dielectric物质及增加金属层,相比上代90nm制程减少漏电情况达1000倍。
值得注意的是,Intel加入了超精细的逻辑控制机能独立开关各运算单元,具体来讲,酷睿微体系结构采用先进的功率门控技术,来充分利用该微架构的超精细逻辑控制。以往功率门控技术实现起来十分困难,因为元件开关过程需要消耗一定的能源,而且由休眠到恢复工作也会出现延迟,但Intel酷睿微体系结构已经解决这些问题。
通过该特性,可以智能的打开仅仅是当前需要的子系统,而其他部分则处于休眠状态,这样将大幅降低处理器的功耗及发热。
Intel高级智能高速缓存(Intel Advanced Smart Cache)
以往的多核心处理器,其每个核心的二级缓存是各自独立的,这就造成了很多应用下,二级缓存不能够被充分利用,并且两个核心之间的数据交换路线也更为冗长,必须要通过共享的FSB和北桥来进行数据的交换,负担很大,严重影响了处理器工作效率。
而Intel酷睿微结构体系结构,采用了共享二级缓存的做法,有效的加强了多核心架构效率。这样的好处是,两个核心可以共享缓存内部的数据计算据结果,而不是通过FSB和北桥再进行外围的交换,大幅增加了缓存的命中率。
Intel高级智能高速缓存还有其他方面的优势,每个核心都可以动态支配100%的全部缓存。例如某一个内核当前对缓存的利用很低,那么另一个内核就可以动态的增加占用二级缓存的比例。Intel酷睿微体系结构可以把其中的一个内核关闭以降低功耗,但却可以保持全部缓存在工作状态,当然也可以根据需求关闭掉部分缓存来降低功耗。
这样可以降低缓存的命中失误,减少数据延迟,改进处理器效率,增加绝对性能和每瓦特性能。
Intel智能内存访问(Intel Smart Memory Access)
Intel智能内存访问是另一个能够提高系统性能的特性,他可以通过隐藏内存延迟,来优化内存子系统之外的数据带宽使用率。Intel智能内存访问能够预测系统的需要,从而智能的提前载入或预取数据,反映到用户的直接使用体验上,就是大幅提高了执行程序的效率。
以前我们要从内存中读取数据,就需要等待处理器完成前面的所以指令后才可以进行,这样的效率显然是低下的。而Intel酷睿微体系结构中加入一项名为内存消歧的能力,它可以对内存读取顺序做出分析,智能、预测性的装载下一条指令所需要的数据,这样能够减少处理器的等待时间减少闲置,同时降低内存读取的延迟,而且它可以侦测出冲突并重新读取正确的资料及重新执行指令,保证运算结果不会出错误,大大提高了执行效率。
Intel高级数字媒体增强(Intel Advanced Digital Media Boost)
上面提到了性能=频率×每个时钟周期的指令数 这个新概念,而Intel高级数字媒体增强也同样是为了提高每个时钟周期的指令数而诞生,它可以提高SIMD流指令扩展指令(SSE/SSE2/SSE3)的执行效率。之前的处理器需要两个时钟周期来处理一条完整指令,而Intel酷睿微体系结构则拥有128bit的SIMD执行能力,一个时钟周期就可以完成一条指令,效率提升明显。
当前SSE指令集已经十分普遍地用于主流的软件中,包括绘图、影像、音频、加密、数学运算等用途,单周期128Bit SIMD处理器能力以频率以外的方法提升性能,令处理器拥有高能源效益表现。
基于以上这些先进的创新特性,Intel酷睿微体系结构提供了比前代产品更卓越的性能,更高的能效,同时也保证了完整的软件兼容性。结果为服务器、台式机和移动平台带来了振奋人心的全新可能。<