多核革命 AMD首席技术官帮你解密CPU
◎ 如何做才能达到性价比的平衡?
为撰写本文,我们将使用一个带有调整后的系数,并最适应SPEC_fp2000和SPECfp_rate2000基准测试大型子集(截至2006年 3 月)的分析模型,估算多种配置选项的性能影响。
该分析模型包括508个SPEC_fp2000结果730个SPECfp_rate2000结果。另有233个结果被排除在分析之外,因为它们使用了先进的编译器优化或特殊的硬件配置,而这都会导致其与大部分结果进行比较毫无意义。
前面已经对该性能模型进行了介绍,但是,此处对其进行了扩展以纳入更完整的数据集,并已经将它应用到每个SPEC_fp2000基准测试结果的14 个测试项目和几何平均值中。虽然该模型没有捕捉这些基准测试的某些性能特征细节,但它对大量结果进行最小二乘法,能够大幅度减少与单个结果相关的随机“干扰”,并提供很高的平台独立性。
简而言之,该模型假定每个基准测试的执行时间为“CPU 时间”和“内存时间”之和。其中,内存子系统完成的“工作”数量是缓存规模的简单函数,从“大型”缓存(其中“大型”也是该模型的一个参数)最大值线性减少到无缓存的最小值,对大于大型规模的缓存,内存工作量恒定不变。假定CPU工作的完成率与芯片采用64 位IEEE 算法的峰值浮点性能成正比,而内存工作的完成率与系统在171.swim(基础)基准测试上的性能成正比。此前的研究已经显示,在171.swim 基准测试上的性能和使用STREAM基准测试直接测量的持续内存性能之间有很强的联系。
该模型的模拟结果与测量结果有很强的相关性,75% 的测量结果都具有15%的模拟映射。这指出,基础的模型假设与这些系统在这些基准测试上的实际性能特征一致。虽然模型中存在某些体系性错误,但模型与观察结果之间的差异并非都来自于硬件假定的过度简化,很多差异也可能来自于编译器、编译器选项、操作系统和基准配置方面的差异。总的来说,该模型足够健壮,可以作为说明微处理器系统中性能和性能价格比灵敏度的基础。
◎ 我们假设几种设计方案,以此来看CPU的成本核算
为进行性能和性能价格比分析,我们将假定:双插槽“裸”系统(带有磁盘、内存和网络接口,但没有CPU)成本为1,500美元。
基本CPU配置为2.4GHz单核处理器,配备1MBL2缓存,成本为300美元。
Die设定为CPU核心和L2缓存约各占一半,其他片上功能限制在Chip全部区域的小区间中。
“小型芯片”配置为2.8GHz单核心处理器,配备1MBL2缓存,成本为150美元。
“大缓存”配置为2.8GHz单核心处理器,配备3MBL2缓存,成本为300美元。
“多核”配置为2.0GHz双核心处理器,每个核心配备1MBL2缓存,成本为300美元。