三级缓存威力多大?AMD羿龙家族大对比
[泡泡网评测室2月24日] 处理器的缓存大小,一直都是CPU厂商定位产品的标准。老大Intel依靠工艺优势,竟然在同一时间段中将CPU依靠缓存大小划分出了7种等级,涵盖了中高低端整个市场(详见“多大缓存够用?酷睿2家族6大系列横评”一文)。而AMD因为核心架构和工艺原因,并不能随心所欲划分缓存大小,导致产品线相对单一,在市场细分中不能占得先机。
市场中没有永远的落后者,当AMD进入45nm时代,Phenom II的到来,AMD也能通过核心数量和缓存的搭配,设计出定位不同市场的CPU。
纵观AMD Phenom处理器的发展,核心架构的改进相对有限,而三级缓存的变化是最直观的。从早期Phenom的2MB三级缓存,猛增至Phenom II的6MB三级缓存,而为了市场的需要,又推出了采用Phenom II架构但没有三级缓存的Athlon X4。而AMD处理器独有的双核、三核、四核架构,加上缓存的不同搭配,一时间,AMD处理器呈现出门丁兴旺的景象。
对于AMD的用户来说,多是追求性价比的用户,而现在AMD处理器这样的现象,对用户即是好事也是坏事,好是用户的选择更多了,坏的是用户对CPU的选择无所适从。而细细观察,AMD处理器百龙争宠的现象,无外乎是核心与缓存搭配的结果。那么,究竟核心数量还是缓存大小对性能影响大,用户花高价格买四核值不值?缓存和核心的平衡点在哪里?本文将对此进行深入研究。
为让评测文章更具参考价值,同时也让广大网友能够看到自己最感兴趣的内容,泡泡网DIY评测室特意开设了“You Think.I do”板块,您可以将最感兴趣的内容、甚至任何想法发送到邮箱“Think@PCPOP.COM”,一旦您的建议被采纳,在评测文章发布之日我们会为您送出精美礼物一份!
与65nm Phenom相比,新一代45nm Phenom II最大的变化就是升级到了45nm SOI沉浸式光刻生产工艺,好处就是主频更高、功耗更低、集成度更高,特别是三级缓存从2MB猛增到了6MB!
三级缓存翻了三番,自然需要付出一定的代价,通过Phenom和Phenom II芯片示意图的对比,我们就能略知一二了:
Phenom一代:浅蓝色为单个核心与其二级缓存,粉红色为共享三级缓存。
Brcelona/Agena集成了4.68亿个晶体管,核心(Die)面积大约285平方毫米,Shanghai/Deneb的晶体管增加了62%,多达7.58亿个,但核心面积却减小了9.5%,只有258平方毫米,新工艺的好处可见一斑。
Phenom二代:浅蓝色为单个核心与其二级缓存,粉红色为共享三级缓存。
晶体管数量增加如此之多主要就是因为三级缓存的大幅扩容,这部分在整个核心里的面积比例也从大约六分之一提高到了足有三分之一。
<
关于三级缓存,AMD的态度是:
- 第一,三级缓存容量在服务器领域的作用更明显,不过如果服务器和桌面处理器采用不同的架构,必然会提高生产难度和成本,故而带到了桌面上;
- 第二,在桌面上,三级缓存从2MB增加到6MB可以带来大约5%的性能提升,实际测试也证明了这一点;
- 第三,从前边的数据看出,三级缓存增加了两倍,但得益于生产工艺的改进,核心面积反而更小了,成本也更低。
Core i7 Die示意图:四个核心一字排开,与Phenom II的方阵型不同。
熟悉Intel Nehalem Core i7处理器的朋友一定想到了,Intel也使用了同样的大容量共享三级缓存设计,且容量多达8MB,也占据了整个核心面积的三分之一左右,不同之处在于Core i7每核心一级缓存和二级缓存只有64KB和256KB,都比Phenom/Phenom II少一半。
Phenom、Phenom II、Core i7、Core 2 Quad对比。
有趣的是,同样基于45nm工艺的Core i7集成了7.31亿个晶体管,比Phenom II略少,但核心面积却稍大一些,为263平方毫米。
现在我们从成本的角度来算一笔帐,通过Phenom II X4的芯片结构示意图可以看出,三级缓存所占芯片面积比两颗核心以及L1L2加起来还要多,如此一来即便是屏蔽了一颗核心的Phenom II X3,其成本也并不低,这对于主打性价比路线的AMD来说,利润损失会比较大。
三级缓存所占芯片面积大于两颗核心
于是,AMD在发布Phenom II X4、X3处理器之后,也在积极准备定位主流中低端的产品,用以取代征战多年的Athlon 64 X2系列。由于L3成本较高,因此AMD将Phenom II X4的三级缓存彻底删去(注意不是屏蔽),Athlon X4将会很快与大家见面。
Athlon X4处理器CPU-Z截图(尚无法识别全部资料)
如此一来,我们就可以通过对比评测,轻松了解到AMD的Phenom II架构处理器中,6M L3对性能的贡献有多大,也能提前了解拥有完整L3但却少一颗核心的Phenom II X3强呢,还是没有L3的但却有四颗核心的Athlon X4强?相信很多朋友都会挺感兴趣的。
此次测试我们找到了AMD已上市的Phenom II 920(6M L3)和Phenom 9850(2M L3),还有一颗神秘的没有L3的Athlon X4工程样品,让他们都工作在200*14=2.8GHz频率下,这样就能直观的对比6M/2M/0M三级缓存所造成的性能差异。
另外还加入了刚刚发布的Phenom II X3 720处理器,它拥有完整的6M三级缓存,但少一颗核心,这样可以反映出多一颗核心的贡献大还是6M L3的贡献更大?
PCPOP.COM泡泡网DIY评测室 | |
硬件系统配置 | |
处理器 |
|
主板 |
技嘉 790X-UD4 (790FX+SB750) DDR2 |
硬盘 |
西部数据 velociraptor 300G 10000 RPM, 16M |
|
海盗船dominator 10000C5DF DDR2 800×2 |
|
ASUS EAH4870 (核心频率750MHz 显存频率3600MHz) |
电源 |
海盗船 HX1000W 额定1000W |
显示器 |
ASUS 24寸 M241H |
软件系统配置 | |
|
Windows vista Ultimate SP1 32BIT |
驱动 |
AMD/ATI Catalyst 8.12 WHQL |
为了不使测试平台的其它部分作为瓶颈,在系统方面采用了Vista 32bit SP1,主板方面选用了技嘉的790FX搭配HD4870显卡进行辅助测试。最重要的内存选用上,选用了性能甚至堪比DDR2的海盗船统治者10000C5DF,默认频率为1250MHz CL5,但为接近AMD平台的常规使用情况,降频至1066MHz使用。
◎ Fritz 10 Benchmark 性能测试
这是一款国际象棋测试软件,但它并不是独立存在的,而是《Fritz9》这款获得国际认可的国际象棋程序中的一个测试性能部分。由于国际象棋的运算大致仍旧是依靠电脑CPU的高速处理能力,将每一个可能的走法以穷举算法预测,从中选择胜算最大的非常好的走法。所以用它来衡量对比不同的PC系统中CPU的多线程运算能力也是有参考价值的。
Fritz这款国际象棋引擎模拟器,测试的是CPU的AI算法运算能力,在默认情况下,软件是根据核心的数量,自动设置线程数进行计算。新一代Phenom II凭借工艺进步,三级缓存的加大,CPU处理能力得到小幅提高。但需要指出的是,性能提升不仅来自于三级缓存,同样内存带宽的突破也不能否认。这点从没有三缓的Athlon X4力压上代旗舰9850就能看到。
◎ wPrime 性能测试
wPrime是一款与Super Pi相同的圆周率计算软件,但与Super Pi只能支持单线程不同的是,wPrime最多可以支持八个线程,也就是说可以支持八核心处理器,并且测试多核心处理器性能时比Super Pi更准确。
这是一款取代SuperPI的新一代的纯计算软件,不过加入了多核的支持,软件测试原理依旧是测试CPU整体的计算能力,由于牵涉到多核,所以内存带宽也会影响CPU的性能得分。新工艺下,性能的提升是毋容置疑的,这点很明显能从测试得分看出来。而内存带宽对性能的影响,就不是从数据上直观看到了。从CPU架构上看,缓存对性能的影响很大,但Athlon X4的表现,尤其是在大量运算过程中,力压上代拥有完整3级缓存的9850,内存带宽的优势不言而喻。
◎ CineBench R10 性能测试
CineBench使用针对电影电视行业开发的Cinema 4D特效软件引擎,可以测试CPU和显卡的性能。Maxon公司表示,相对于之前的9.x版,R10版更能榨干系统的最后一点潜能,准确体现系统性能指标。最新R10版,支持XP、vista、MAC等,最高支持16核。
默认优化线程模式:双核处理器双线同开,三核则三线同开,以此类推
在CineBench对比测试中,缓存对性能表现影响很大。即便是在核心数量占绝对劣势的情况下,Phenom II X3 720比Athlon X4强上很多。从中可以看到缓存的作用。
OpenGL测试主要是依靠显卡做渲染,CPU只其辅助作用,多核心效能得不到充分发挥,只有单核心效能强才能取得更好的成绩,此时没有L3的Althon X4发挥失常,而Phenom II X3的性能直逼X4。
● 应用程序对比测试
◎ WINRAR压缩软件性能测试
WINRAR作为目前最常用的压缩软件备受大家喜爱,基本是每台电脑的必备软件。而大家也知道,WINRAR的压缩效率和CPU的性能成等比关系,CPU运算能力越强,压缩及解压文件的速度就越快。
从WinRAR测试结果来看,内存带宽对解压缩的性能表现影响较小,核心数量架构效率与缓存的配合才是决定性因素。
◎ 高清X264编码压缩
高清视频流行的今天,有多少人知道欣赏的720P高清电影是通过压缩1080P视频得来的,而关乎压缩速度的最有效途径就是使用的CPU以及支持的指令集。所以,笔者采用X264的编码压缩720P测试CPU的编码能力。
从测试结果看,核心数量是决定内存带宽对视频压缩性能的影响并不大,DDR3和DDR2的性能差距在伯仲之间。从Phenom I代和II代间的性能表现来看,核心架构的效率才是决定视频压缩性能的关键。
● 综合性能对比测试
◎ everest性能测试
Everest是一套功能强大的系统分析评比工具,拥有电脑你能想到的各种设备的检测,作为一款系统测试软件,除了可以提供详细的硬件信息外,还可以做产品的性能对比。其中内存带宽的测试具有代表性。
内存读写方面,虽然平台配置中除了CPU外均一样,但由于内存控制器集成在CPU内,所以带宽的表现还是有差异的。从测试成绩中看,新一代Phenom II整体内存带宽较phenom高出不少,相信45nm工艺下改进的不只是制程,内存控制器的延时把控也有了不小提升。
◎ 3D Mark Vantage 测试
3DMarkVantage2008年4月28日发布,是业界第一套专门基于微软DX10 API打造的综合性基准测试工具,并能全面发挥多路显卡、多核心处理器的优势,能在当前和未来一段时间内满足PC系统游戏性能测试需求。和3DMark05的DX9专用性质类似,3DMark Vantage是专门为DX10显卡量身打造的,而且只能运行在Windows vista SP1操作系统下。
由于此款软件是针对3D性能的测试,所以只选用了测试项目中的CPU选项的得分进行对比。设置为性能模式,采用1280X1024进行测试。
Peformance模式下,CPU性能对vantage整体得分有一定的加成。由于3D Mark Vantage支持多核处理器,所以在这里单核效率的意义就不是很大了,拥有完整3级缓存的Phenom II X3 不敌Athlon x4也就不难理解了。
Peformance模式下,两代Phenom处理器性能差距十分明显,从测试成绩分析,缓存对性能的提升有很大的加成,同时在更高内存带宽的帮助下,没有3级缓存的Athlon X4领先9850显得十分强悍,让我们十分期待这颗未出生就奠定性价比之王的CPU。
◎ PCMark Vantage 性能测试
PCMark Vantage 是Futuremark发布的新一代基准测试软件,并比较完美的对多核心处理器进行了优化,而且是专为Windows vista 32/64-bit打造的,不再支持Windows 2000/XP。
PCMark Vantage可以衡量各种类型PC的综合性能,主要分为三大部分进行:1、处理器测试:基于数据加密、解密、压缩、解压缩、图形处理、音频和视频转码、文本编辑、网页渲染、邮件功能、处理器人工智能游戏测试、联系人创建与搜索。2、图形测试:基于高清视频播放、显卡图形处理、游戏测试。3、硬盘测试:使用Windows Defender、《Alan Wake》游戏、图像导入、Windows vista启动、视频编辑、媒体中心使用、Windows Media Player搜索和归类,以及以下程序的启动:Office Word 2007、Adobe Photoshop CS2、Internet Explorer、Outlook 2007。
PCMark是一大堆日常应用的合集,其中包括大量的多任务测试及多媒体视频音频测试,虽然多核心并不能发挥出全部性能,但优化支持也很到位。
从成绩看,内存带宽对PCMark Vantage得分影响不大,仅在内存带宽一项上有巨大优势,对其它项目的影响不大,当然,内存带宽的高低对整机性能有一定影响,这也是Athlon X4总分高出9850的原因。而缓存方面,可以说对性能的影响是明显的,Phenom II X3力压4核的615和9850就是明证。
◎ DX10游戏—《失落星球:殖民地》
作为首款DX10大作《失落星球:极限状态》的资料片,《失落星球:殖民地》只是强化了网络对战功能、提供了更多对抗地图,并未加入新的任务关卡,这让单机游戏玩家失望不已,好在新的“过关斩将”模式有点新意,可以让玩家直接挑战前作任务关卡中的所有大小BOSS,而本游戏最酣畅淋漓的无疑就是BOSS战,另外还提供了“挑战模式”、“竞分模式”等更丰富的内容与玩法。
测试方法:针对资料片的特性,游戏自带的测试场景也作了些改变,还是分为室外和室内两个场景,但对于系统的要求更加苛刻:
面对着与日俱增的新游戏,再强大的CPU似乎已对性能影响不大,当主频接同为2.8G时,4核处理器的表现在伯仲之间,3核因为核心数量劣势表现不佳。
◎ DX10游戏—《孤岛危机》
作为年度DX10游戏巨作Crysis的游戏画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏,即便是搭配优异的显卡,在采用大分辨率开抗锯齿的情况下,也只能勉强“浏览”游戏。
测试方法:Crysis Demo内置了CPU和GPU两个测试程序,我们使用CPU测试程序,这个程序会自动切换地图内的爆炸场景,激烈的爆炸场面严格的考验着CPU渲染性能,运行一段时间得到稳定的平均FPS值作为测试依据。
在低分辨率情况下,显卡已经不是瓶颈,而仅在于考验CPU的运算能力。Crysis的两个CPU测试场景,得出的结果表现基本一致,缓存对帧率的影响明显。
至此,Phenom II家族中代表性CPU测试到此结束了,对所有测试成绩分析对比后,我们可以得出以下结论:
-
虽然AMD处理器的架构的特殊性,对缓存的依赖性不如Intel处理器那样强烈,但大缓存也能够提高性能;
-
三级缓存容量在大多数项目中对CPU性能都有影响,但只是量变并非质变;
-
三级缓存只能作为辅助,对CPU性能起到决定性的作用是内核架构;
-
Phenom II的性能提升,主要来自于内存带宽和三级缓存两方面的贡献。
-
Phenom II的单核效率,与三级缓存有很大的关系,缓存越大,性能表现越好;
-
在现今的多数应用环境下,多核处理器并不能完全发挥所有性能,单核效率的高低才是决定电脑快慢的主因。
根据笔者的测试,分析出以下几点:Phenom II的腾飞,与采用45nm工艺有密不可分的关系,先进的工艺,可以在有限的空间内放置更多的晶体管,换句话说,Intel常用的提升CPU性能的方法——增加缓存容量,AMD这次也以彼之道,还施彼身,带来性能提升。同时,新一代Phenom II的内置内存控制器较以往有了不少提升,采用专业内存检测工具发现,在内存同频率同延时下,Phenom II的内存控制器表现出的性能更猛。而稍感遗憾的是,Phenom II的核心架构,并没有太大的改进,也没有新指令集的加入,仅是小幅改进BUG而已。
缓存与核心谁更重要?通过测试结果分析,那就是根据应用环境而定。现今的软件环境,并非全面针对多核设计,不少软件的运算速度取决于单核效率。像我们常见的游戏环境,即便是Crysis这种较新的游戏对多核的支持也不是很好,更多地是依靠单核效率。游戏尚此,我们常用的软件更不例外。常规应用中,多核心总有闲置的情况发生,这就是软件环境所致,所以,若您想装配一台性价比十足的电脑,单核效率绝对是首选。
虽然现在4核处理器的价格并非漫天要价,且性能强劲,甚至能够满足未来1-2年的系统要求,但千元多的售价对普通人来说还需要掂量掂量。而AMD独有的3核处理器如同一只奇葩,接近双核处理器的价格,同时拥有接近4核处理器的性能,不失为一种选择。<