韩信将兵多多益善?CPU缓存探究全测试
泡泡网CPU频道4月28日 史曰:“韩信将兵,多多益善”,这是指将才中的优品,无论给他多少士兵,他都能指挥得过来,发挥出每个士兵的战斗力,那么对CPU来说,缓存就是要控制的千军万马,不过是不是每颗CPU都能充分利用超大容量的缓存呢?
传言Intel下一代单芯片处理器Haswell将配备四级缓存,不过最新消息又辟谣说L4缓存并不会出现,目前的桌面级主流处理器最多配备了8MB三级缓存,Sandy Bridge-E最多配备15MB三级缓存,服务器版处理器的三级缓存容量早已达到30MB,尽管Ivy Bridge-E的具体规格还未可知,但是种种迹象表明Ivy Bridge-E的缓存容量肯定会有所提升,那么处理器究竟需要配备多大容量的缓存呢?本次测试将揭开这个谜底。
我们选择了四款Intel的主流处理器进行测试,其中包括Intel酷睿i5-2500K、酷睿i7-2700、酷睿i7-3820和旗舰酷睿i7-3960X。在测试之前我们先来了解下缓存的工作机制。
CPU缓存对于CPU的性能究竟有多大的影响呢?首先,小编先简单介绍下CPU缓存,CPU缓存(Cache Memory)是位于CPU与内存之间的规模较小的但速度很高的临时存储器,它通常由SRAM(静态随机存储器)组成。用来存放那些被CPU频繁使用的数据,以便使CPU不必依赖于速度较慢的DRAM(动态随机存储器)。不过限于它的昂贵成本,一般容量比内存要小。
SRAM结构简图
缓存的设计思路是用少量的速度较快的SRAM作为CPU与DRAM存储系统之间的缓冲区,起初是在芯片的外部,到了80486时期,这部分SRAM被集成到了芯片内,因此又叫片内Cache。
DRAM结构简图
片内Cache即是今天的一级缓存,这部分缓存的容量是很少的,486芯片内只有8KB,到了奔腾高档芯片就升级到了16KB,Power PC可达32KB。后来Pentium微处理器改进片内Cache,采用数据和双通道Cache技术非常灵活、方便,极大地提高了微处理器的性能。
不过缓存的容量并不是越大越好,除了SRAM的高成本,CPU芯片的面积限制也是重要因素之一。随着CPU集成越来越多的计算单元,每一代处理器的晶体管数量都相比上代大幅提升,不过随着制造工艺屡遭瓶颈,摩尔定律也频繁遭到质疑,好在3D Tri-Gate技术暂时缓解了这方面的困扰,在缓存容量保持不变的情况下,最新的Ivy Bridge比Sandy Bridge多出28%的晶体管,多出来的这部分晶体管主要是用来增强核显性能,那么目前的8MB三级缓存对于这些处理器就足够了么?
本次测试我们采用Intel酷睿i5-2500K、酷睿i7-2700、酷睿i7-3820和旗舰酷睿i7-3960X进行测试,配套主板分别为华硕P8Z68 DELUXE/GEN3和华硕P9X79 DELUXE。
测试中,我们分别将处理器的主频锁定在3.0GHz、4.0GHz(关闭HT超线程)、4.0GHz(开启超线程)来排除其他因素的干扰作用,测试项目则选择了Super PI、wPrime、WinRAR、Fritz Chess Benchmark、Cinebench R11.5和3DMark 11。
Super PI是一款专用于检测CPU稳定性的软件,软件通过计算圆周率让CPU高负荷运作,以达到考验CPU计算能力与稳定性的作用。
● 3.0GHz主频
● 4.0GHz主频
在单核性能测试中,三级缓存容量并未引起多大变化。
wPrime是一款常见的多线程计算测试工具,测试多核心处理器性能时比Super Pi更准确。与SuperPI的单线程运算不同的是,wPrime在打开一个软件界面下,可以支持多个核心的处理器运算,甚至是8核心处理器。
● 3.0GHz主频
● 4.0GHz主频
● 4.0GHz主频 开启超线程
在wPrime多线程性能测试中,三级缓存容量的差别也没造成影响。
首先测试的项目是最新的3D性能基准测试软件3DMark 11,它是Futuremark最新推出的DX11显卡性能测试工具,同时也兼顾考察CPU处理器的配合能力,尤其是在并行计算方面。3DMark 11基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面细分、计算着色器、多线程。3DMark 11继承并改良了3DMark Vantage的统计方式,去掉了几乎没什么人用的高端级(H)。
● 3.0GHz主频
● 4.0GHz主频 关闭超线程
● 4.0GHz主频 开启超线程
(酷睿i5-2500K不支持超线程)
从测试成绩来看,在低主频下,L3缓存容量对CPU性能的影响微乎其微,而在超频至4GHz后,相同核心数下,15MB三级缓存的CPU仅比6MB成绩高出4%,这一情况在开启超线程技术后保持了一致,15MB L3的酷睿i7-3960X比8MB的酷睿i7-2700K也仅高出4%(由于酷睿i5-2500K并不支持超线程,因此这里的数据并不做比较,以下同)。
CineBench使用针对电影电视行业开发的Cinema 4D特效软件引擎,可以测试CPU和显卡的性能,最新版本R11.5对于运算强度有了进一步加强,即便目前最强悍的处理器也很难在这项测试中取得高分。
● 3.0GHz主频
● 4.0GHz主频
● 4.0GHz主频 开启超线程
从测试来看,超频前后包括开启超线程技术后,L3缓存容量也并未对成绩造成明显影响。
Fritz Chess Benchmark是国际象棋软件Fritz自带的电脑棋力测试程序,由于支持多线程,而且主要测试大量科学计算,所以经常被用来测试处理器的科学运算能力。它通过模拟思考国际象棋的算法测试处理器性能,而且能够很好地支持多核心、多线程。
● 3.0GHz主频
● 4.0GHz主频
● 4.0GHz主频 开启超线程
测试成绩显示,在科学计算测试中,L3缓存容量的差别也未造成多大的差距。
WinRAR是一个使用用户非常多的文件压缩管理共享软件,针对多媒体数据,提供了经过高度优化后的可选压缩算法,而且可以支持处理器多线程。
● 3.0GHz主频
● 4.0GHz主频
● 4.0GHz主频 开启超线程
在低主频下,三级缓存容量的不同造成了最大19%的性能差别,当主频超至4GHz后,15MB三级缓存的酷睿i7-3960X比6MB的酷睿i5-2500K成绩高出36%。
● 总结
从本次测试来看,三级缓存容量的差别并未引起性能的多大变化,15MB三级缓存相比6MB的平均提升不足4%,只在高数据计算的WinRAR解压缩性能测试中造成了19%的差距,相比之下,CPU在超频前后的性能差距更为明显,在针对多线程优化的测试中,关闭开启超线程技术之后的CPU性能差距也更为明显,因此目前提升CPU性能的非常好的办法还是提高CPU频率,而对于三级缓存,Intel显然自有打算。■<