Intel Core微架构全解析 X6800抢先测
分享
Microarchitecture︰Intel Core VS AMD K8
Intel Core uA | AMD K8 uA | |
L1 Cache | Instructions - 32KB Data - 32KB | Instructions - 64KB Data - 64KB |
L1 Cache Latency | 3 Cycles | 3 Cycles |
L1 Associativity | 8-way | 2-way |
L1 TLB | Instructions - 128 Entries Data - 256 Entries | Instructions - 32 Entries Data - 32 Entries |
L2 Cache | Max 4MB | Max 1MB |
L2 Cache Latency | 12 Cycles | 12-14 Cycles |
L2 Associativity | 16 Way | 16 Way |
L2 Bandwidth | 256Bit | 128Bit |
L2 TLB | n/a | 512 Entries |
Memory Controller | External | Internal |
Pipeline Stage | 14 | 12 |
Branch Predictor Bandwitdh | 20Bytes | 16Bytes |
Decode to Execute Unit | 3 Simple + 1 Complex | 3 Complex |
FPU | 1FMUL + and 1 FADD + 1 FStore + 1 FLoad | 1FMUL + and 1 FADD + 1 FStore |
Integer Unit | 3 Int + 2 AGU | 3 Int + 3 AGU |
Load/Store | 1 Load + 1 Store | 1 Load & Store |
ALU | 3 | 3 |
SSE Unit | 3 - 128Bit | 2 - 64Bit |
FP Unit | 2 | 2 |
Intel Core微架构完全承袭了P6微架构的优良传统,并加入了多项创新的技术,针对提升每周指令执行指令数目而努力,从以提升效能功耗比。如果拿Core微架构与AMD K8微架构作比较,就会发现Core微架构有更"宽"的设计,Core微架构的4-Wide执行核心为x86系统提供了强大IPC运算能力,尤其是SSE指令集方面,Core微架构采用3组ALU,相比上代Yonha多出一组并已追上了AMD K8微架构的单简x86指令执行能力,同时Core微架构却大幅提升SIMD指令能力,拥有3组128Bit SSE运算组,亦因如此Intel Core微架构将拥有比AMD K8微架构约三倍以上的整数SSE指令频宽,而浮点SSE指令频宽亦比AMD K8微架构高出2倍。
为了提供升实际软件IPC运算潜能,Intel并不只单纯地加入更多的运算组,还在处理器设计上作出重大改良,为了让IPC能力保持于高水平,Intel加入了两个Fusion机制包括Marco Fusion及Micro Fusion,同时采用了Memory Disambiguation提供了Out-of-order的效率,所有设计都让Intel Core微架构变能体现Performance per Watt的能力。
虽然AMD K8微架构已是三年前的产品,但其设计却一点也不显得落后,但面对有备而来的Intel Core微架构还是显得有心无力,现时AMD K8微架构仅存的优势就是内建记忆体控制器,但由于Intel Core微架构在Cache设计(加入更多的Prefetchers)、增强Branch Prediction命中率及记忆体存取上的技术改良(Memory Disambiguation),AMD于这记忆体效能的领先已被大幅收窄。据Intel表示,它们要把记忆体控制器放进处理器并不困难,是不为也非不能也,主要是考虑到加入记忆体控制器将会令产品被限制其记忆体支援弹性及升级能力,加上Intel估计记忆体的发展速度将会不断增加,AMD需要不断改良核心内的记忆体控制器设计才能追上记忆体发展的步伐,值得注意的是,未来IGP晶片组占市场比例将日益增加,内建记忆体控制器将成为IGP系统设计的弱点,效能上比不上北桥内建记忆体器方案。
无疑Intel Core微架构是一颗十分优秀的处理器,解决了一直以来Intel双核心处理器的设计弱点,其高效率低功耗设计更让微架构可跨越Desktop、Mobile及Server平台,效能绝对能凌驾现时所有x86微架构之上,相信AMD在下一代K8L微架构出台前会受到极严峻的压力,笔者认为Core微架构唯一的弱点还是在于其SMP的支援能力,在Server的领域里,企业可能会使用超过四颗以上的伺服器系统,由于AMD处理器拥有Hyper-Transport Tunnel,让各颗处理器能行拥有管道通交换资料,但Intel Core微架构在多处理器方案中,还是保留FSB及北桥作传输设计上落后于AMD,故此Intel Core微架构在Desktop、Mobile及SOHO Server (1-2 CPU)较AMD K8拥有更佳优势是不会被质疑,但AMD Opteron处理器对决于多路处理器领域,则因FSB先天架构不足还是较为落后。
0人已赞