FX之名回归 AMD八核心推土机详细评测
泡泡网CPU频道10月13日 AMD的处理器产品的核心架构自从2007年以来就没有发生过本质变化,而自从上代K10架构发布以来,下代“推土机”核心处理器的传闻就没有停止过。这4年时间里,Intel则已经完成了2次Tick & Tock,旗下处理器产品已经变更3代。而面对如日中天的Intel Core i系列产品,AMD拿什么与之抗衡呢?
就在前几天,泡泡网评测室收到了推土机处理器的送测产品,并附带了可选的水冷散热器套装。我们已经于昨日进行曝光。关于推土机FX处理器的架构和技术分析,会在后文中做详细的解析。相信很多网友对AMD产品发布会比较感兴趣,并且想知道AMD自己如何评价自己的产品,那么不妨跟随AMD产品市场总监Bob Grim的PPT演示文档来详细了解一下。
4年的时间AMD也没有白白浪费,全新架构的推土机处理器让我们眼前一亮,全新的设计思路、众多新技术的引入,带来了一番翻天覆地的变化。终于,我们等到了它正式发布的这一天,我们最关心的性能测试结果也马上揭晓。
在进行测试之前,首先我们还是要讲解一下“推土机”核心的特点,来看看它到底有什么与众不同之处。
推土机模块架构图
在处理器微架构方面,推土机发生了巨大的变化。它采用了前所未有的“模块化”设计,将两颗核心组成一个单独的单元,称之为“模块核心”。这让产品生产及成本控制更加具有灵活性,处理器核心模块的两个核心各自拥有一级缓存,但是共享二级缓存和预取,解码单元,所有的“核心模块”共享8MB三级缓存和北桥模块。
推土机的另一大改进就是基于集群的多线程技术。推土机的内核模块是一个可以同时运行两个线程的处理组件,两个内核可以执行两个完全不会相互干扰的线程。尽管双核、多线程和Bulldozer在线程并行执行方面是相同的,但是内核的分区却截然不同。多线程就是在一个单个的处理核心内同时运行多个工作线程的技术,和CMP芯片多处理器技术不同,后者是通过集成多个处理内核的方式让系统的处理能力提升,现在主流的多核处理器都是用了CMP技术,而像Pentium 4、Corei7这样的处理器带的“超线程技术”则属于多线程技术,而Bulldozer是基于集群化多线程架构,称为Cluster-BasedMulti-threading,简称CMT,也称多簇式多线程技术。
相对于传统超线程或双核技术,Bulldozer这种设计集群化架构的理念是让双核模块在多线程运算中更高效。Bulldozer每一个模块中加入了额外的执行单元,每一个模块都具备可以将一个大任务细分为多个并行任务的能力,这些生产线可以按需要任意整合,不会对整个装配线的效能造成影响。因此CMT技术的效能要高于传统的多线程方案。模块化设计加多簇式多线程技术,令推土机拥有了超强的多线程性能。
除了核心微架构之外,推土机在其他方面也有诸多改进,并加入了新的技术。具体内容包括:
Turbo Core 2.0技术。在推土机架构处理器上,AMD将Turbo Core技术升级到第二代:Turbo Core 2.0。既然是第二代,改进也是非常值得期待的。首先,Turbo Core 2.0的频率提升空间有了明显提高,也就是所有核开启时,最高能自动超频500MHz,不像Phenom II X6,只有一半核能超500MHz。其次,在只有部分核心满载的情况下,尤其是在运行某些对频率要求比较敏感的程序时,其余低负载核心状态可以达到Core C6(CC6)接近关闭状态,从而使活动核心加速超过500MHz甚至更高。比如,FX-8150的默认频率为3.6GHz,全核心加速最高可至3.9GHz,部分核心关闭可提升至4.2GHz。最后,也是非常明显的一个改进,那就是Turbo Core 2.0加速只受限于TDP,而不再束缚与CPU温度。所以只要在安全设计范围内,即便是CPU处于较高温度,依然可以保持加速。而且从目前得到的信息来看,不仅是高端的8核,中低端的部分6核甚至4核都能享受到urbo Core 2.0。这一点,AMD显然比Intel更为厚道。
新增指令集。指令集对于CPU性能的影响非常之大。推土机自然也少不了指令集的优化和扩充。包括原有的MMX、SSE、AES、x64,并新增了XOP、FMA等。由于Bulldozer的每个模块还具备两条128Bit FMAC(乘法累加运算)流水线,能够满足Bulldozer中新加入的XOP指令集扩展的需求,这种指令集扩展中包含了大量的128Bit多媒体指令集,这样以来,推土机的整数和浮点运算性能皆有提升。
32nm全新工艺。推土机采用32nm制造工艺,SOI(Silicon On Insulator,绝缘硅)技术和HKMG(High-K Metal K,高K金属门)工艺皆为首次使用。HKMG工艺可以减少栅极的漏电量,降低栅极电容,11个铜金属层和低K电介质、基于硅锗的拉伸硅、第二代沉浸式光刻等技术都使得晶体管的尺寸进一步缩小,减小核心面积并降低整体功耗。借助于新工艺,AMD FX处理器在发布之前便创造了超频世界记录。
加强的内存控制器。推土机集成了DDR3双通道内存控制器,最高支持1866MHz频率,同时,总线也由HT 3.0提升为HT 3.1,可提供29.8GB/S的带宽。
更改为AM3+接口。CPU架构的改变通常都会导致CPU接口的变更。推土机的针脚数量由938个增加为942个,接口也升级为AM3+。
AMD 9系列芯片组有990FX北桥芯片和SB950南桥组成。其中990FX支持两条PCI-E 2.0 x16全速插槽并可拆分为四条PCI-E 2.0 x8半速插槽,可组建双路到四路CrossFireX,另支持一条PCI-E 2.0 x4插槽,六条PCI-E 2.0 x1插槽。而SB950支持四条PCI-E 2.0 x1插槽、PCI总线,14个USB 2.0接口,六个SATA 6Gbps接口,支持RAID 0/1/5/10,可搭配990FX、990X、970。
AMD 9系列芯片组提供强大的平台,以彻底释放AMD台式机的强悍性能。9系列芯片组是AMD的新一代台式机平台“Scorpius”的核心组件,此平台还包含八核心“Zambezi”处理器以及AMD Radeon HD6000系列独立显卡,将带来身临其境般的高画质娱乐与游戏体验,极致多任务性能,性能调节以及超频功能。
AMD 9系列芯片组率先支持AMD AM3+插槽处理器,并可以向下兼容AM3接口。通过支持AMD的交火(CrossFireX)技术,最多能安装4块AMD Radeon 显卡,以及通过AMD的OverDrive软件来管理时钟速度,基于AMD 9系列芯片组的主板能打造出极致的高性能。此外,AMD 9系列芯片组还提供最多6个3.0的SATA 6Gbps的硬盘接口、千兆乙太网络、超传输总线(HyperTransport)3.0技术,以及新一代的PCI Express2.0,为工作与娱乐创造极致运算体验。
AMD为新产品进行了全新的命名,摒弃了以往的“龙”系列命名,而将推土机核心架构处理器定名为“FX”系列。处理器名称为4位数字,首位代表核心数量,第二位则目前皆为1,意味第一代FX处理器,后边两位数字越高则意味频率越高。
首批发布的产品包括7款,核心数量、频率本次送测的产品包括FX-8150和FX-6100,其中FX-8150为八核心,默认频率3.6GHz,全核心加速最高至3.9GHz,部分核心加速最高为4.2GHz,TDP为125W;FX-6100为六核心,默认频率3.3GHz,全核心加速可至3.6GHz,部分核心加速最高为3.9GHz。
来看看推土机实物吧,尽管核心面积和晶体管数量都大幅增加,但是针脚仅多了4个,封装好之后的大小也和目前的AMD处理器产品没有区别。
正面图,和以往产品区别不大
背面针脚数量有所增加
FX-8150与FX-6100
FX-8150水冷套装
测试产品除了首批送测的“推土机”FX-8150/6100之外,还加入了Phenom II 1090T、Core i5 2500K/2300的对比。我想一定会有读者关心为何没有加入Core i7的对比,在此需要说明的是:首先,FX-8150的价格为245美元,FX-6100的价格为165美元,而Core i5-2500K和2300的价格则为216美元、177美元,相比之下,i7-2600K的价格则在317美元。从价格上来看,FX-8150与i5-2500K更为接近。
推土机处理器的非常好的搭档,自然是AMD 9系列芯片组了,再加上一块Radeon HD 6000系列显卡,组成了代号为“Scorpius”(天蝎座)平台。而Intel平台则使用了P67芯片组主板。具体配置如下:
SuperPI是由东京大学Kanada Lab.所制作的一款通过计算圆周率的来检测处理器性能的工具,在测试里面可以有效的反映包括CPU在内的运算性能。在玩家群中,Super PI更是一个衡量CPU性能的标尺之一。直至今天,SuperPI依然做为超频玩家CPU超频性能的第一道检测程序。其测试对CPU性能的意义可见一斑。
测试成绩如下:
推土机的模块化设计使得单核性能很低,因此本来就不擅长的SuperPI又更加慢了。
wPrime是一款质数计算软件,与Super Pi只能支持单线程不同的是,wPrime可以支持多线程,可以测试多核心处理器性能的计算能力,可以看做是一款多核版的SuperPi,而且全新的算法效率更高。
测试成绩如下:
不过好在多核效率还不错,在多线程运算方面能力比较突出。
这是一款国际象棋测试软件,但它并不是独立存在的,而是《Fritz9》这款获得国际认可的国际象棋程序中的一个测试性能部分。由于国际象棋的运算大致仍旧是依靠电脑CPU的高速处理能力,将每一个可能的走法以穷举算法预测,从中选择胜算最大的非常好的走法。所以用它来衡量对比不同的PC系统中CPU的多线程运算能力也是有参考价值的。
测试成绩如下:
多核运算效率相当不错,FX-8150成为测试中最快的产品,不过并没有超过1090T多少。
SiSoftware Sandra是一套功能强大的系统分析评比工具,拥有超过30种以上的分析与测试模组,还有CPU、Drives、CD-ROM/DVD、Memory 的Benchmark工具,它还可将分析结果报告列表存盘。SiSoft Sandra除了可以提供详细的硬件信息外,还可以做产品的性能对比,提供性能改进建议。本次测试项目包括:CPU算术性能、多媒体性能两个项目。
无论算术处理器还是多媒体处理器,推土机的性能均有提高,已经超过了i5,相比上代Phenom II有巨大提高。
AIDA64除了检测硬件型号、查看硬件信息之外,还具有基础性能测试功能。其中的CPU测试组件可以针对CPU各个方面的性能进行专门测试。
亮相测试中FX推土机处理器都表现出了不错的效能,超过了对手i5的表现。
CineBench使用针对电影电视行业开发的Cinema 4D特效软件引擎,可以测试CPU和显卡的性能。最新的R11.5版改进了多线程渲染的方式,渲染效率大大提高。可以更好的检测多核心CPU的性能。
推土机的单核性能较一般,但是多核效率很高。在多线程应用中性能表现不错。
AIDA64除了检测硬件型号、查看硬件信息之外,还具有基础性能测试功能。我们用其中自带的内存性能测试组件进行内存读写性能测试。另外使用Sandra2011测试内存带宽和延迟。
相比Phenom II,FX系列处理器的内存效能进步不小,不过比起Intel的Core i5仍然存在差距。
WinRAR是目前使用最广泛的压缩解压缩软件,而且它自带性能测试工具,可以为广大用户提供系统性能参考,WinRAR压缩/解压缩的运算主要依赖于CPU的性能以及内存性能。
推土机的压缩/解压缩性能还是很不错的。
讯连科技(5203.TW)全新推出由「MediaShow Espresso」重新命名而来的「MediaEspresso 6」快速 影片转文件软件。新版「MediaEspresso 6」可将影像丶相片及音乐档案输出至行动装置播放,例如iPhone及Google Android等智能型手机丶iPods及iPads等媒体播放器以及Xbox 360丶PlayStation 3等游戏机。「MediaEspresso 6」内建TrueTheater Technology全新功能,影片转文件时仍可强化影像质量功能。
转码测试中,FX处理器表现出了其多核效能的优势。
3D Studio Max,常简称为3ds Max或MAX,是Autodesk公司开发的基于PC系统的三维动画渲染和制作软件。其前身是基于DOS操作系统的3D Studio系列软件,最新版本是2011。在Windows NT出现以前,工业级的CG制作被SGI图形工作站所垄断。3D Studio Max + Windows NT组合的出现一下子降低了CG制作的门槛,首选开始运用在电脑游戏中的动画制作,后更进一步开始参与影视片的特效制作,例如X战警II,最后的武士等。
推土机与i5-2500K的成绩基本持平。不过其性能已经高于AMD上代旗舰了。
屡获殊荣的 Autodesk Maya 软件是一个强大、集成的三维建模、动画、视觉特效和渲染解决方案。由于 Maya基于开放结构,因此您的所有工作都可以利用文档齐全的综合 API(应用程序编程接口)或两种嵌入式脚本语言之一(Maya 嵌入式语言 (MEL) 或 Python®)进行脚本处理或编程。这种开放程度与业界领先的三维工具套件相结合,使你能够在电影、电视、游戏开发和设计项目中实现自己的创想。
在3D渲染测试中,八核推土机表现不错,打败了i5。
在经历跳票风波之后,全球著名图形及系统测试软件开发公司Futuremark为我们带来了新一代的整机性能测试工具——PCMark 7。和历代前辈一样,PCMark 7也是一套针对PC系统进行综合性能分析的测试套装,不过这次需要操作系统是微软windows7,Windows Vista/XP完全被淘汰。
PCMark 7包含大量不同的测试项目,用于从不同角度衡量系统性能,我们测试时选择了轻量级综合性能测试,测试内容包括:存储:Windows Defender、图片导入、游戏、视频播放与转码、图片处理、网络浏览与解密等等,最终获得一个综合成绩。
在大多日常应用中,推土机依然不及i5。
3DMark Vantage所使用的全新引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨,号称“显卡危机”的Crysis也不得不甘拜下风。
i5表现更好,3D图形性能依然是Intel更强。相比Phenom II,FX的提升也不算大。
3DMark11是一款纯DX11 Benchmark,如果需要测试DX9C或者DX10性能,3DMark06和Vantage依然健在,3DMark将会出现三代并存的现象,因为目前的游戏也是如此。
3DMark11在很多方面的设计理念,都与3DMark Vantage类似,比如Futuremark并不急于紧跟微软推出DX11 Benchmark,而是等待DX11游戏走向普及之后才发布,这样就避免了滥用并不实用的新技术新特效,从而出现不公平、权威性遭到质疑的情况。
对于HD6990来说,CPU成为其发挥的瓶颈,推土机的性能要稍低于i5,不过FX-8150超过了上代旗舰Phenom II X6。
万众期待的暴雪神作《星际争霸》,在10年之后终于迎来的3D版本,目前暴雪已经正式开放了《星际争霸2:自由之翼》的Beta测试。虽然该游戏并不支持时下流行的DX10、10.1甚至DX11,但暴雪凭借成熟的DX9C技术,也将画面做的非常完美,大量HDR及SSAO特效的应用导致要求也比较高。
星际争霸2本来就是一款很吃CPU的游戏,尤其强调单核性能,AMD处理器一项不擅长这种类型的游戏,而推土机也未能改变这一状况。
自《孤岛惊魂》系列的版权被UBI购买之后,该公司蒙特利尔分部就已经开始着手开发新作,本作不但开发工作从Crytek转交给UBI,而且游戏的故事背景也与前作毫无关系,游戏的图形和物理引擎由UBI方面完全重新制作。
借助于蒙特利尔工作室开发的全新引擎,游戏中将表现出即时的天气与空气效果,所有物体也都因为全新的物理引擎,而显得更加真实。你甚至可以在游戏中看到一处火焰逐渐蔓延,从而将整个草场烧光!而且首次对DX10.1提供支持,虽然我们很难看到。
大幅落后于i5的帧数,CPU严重阻碍了这块显卡在游戏中的发挥。
09年末,其前作《尘埃2》带着首款DX11游戏的光环强势出击,成为众多DX11游戏中的经典。如今,新作《尘埃3》将在诸多DX11游戏特效的力助下,使得游戏画质的表现更加出色、完美。
i5速度更快,推土机的成绩要快于羿龙,可以看出有了些进步。
《孤岛危机2》在游戏内容上与一代有很大变化,已经从秘密的丛林作战转向了公开、大规模的现城市战争。故事发生在距一代3年后的2023年。外星人在地球上的大片区域挑起了战争,各大城市都遭到攻击,人口锐减,玩家将要进行捍卫地球的末日战争。孤岛危机2将不同于原作,原作中调查了神秘的陨石后,最后美军舰队全数击沉,主角Nomad携科学家海伦娜逃离之后,外星人入侵了世界的各个地点,并极大的改变了环境,幸存的人类不得不联手起来对抗入侵者。孤岛危机2的主战场因此改变至纽约(的曼哈顿岛上,因此Crysis2依然是“孤岛危机”、而不是“城市危机”),同时更有神秘势力Crynet出现,孤岛危机2的世界将比起原作更加的凶险和刺激。
差异不大,瓶颈依然在显卡。
使用功耗仪测量并记录系统待机和CPU满载时的功耗。
FX系列处理器的功耗很高,远高于i5和羿龙。
在水冷的状态下,FX-8150很轻松的达到4.4GHz,电压为1.32V,频率为220x20。此时性能也直线上升。CineBench R11.5成绩达到了6.87分。
通过AMD Over Drive超频
时间关系,没有进行进一步超频调节,请期待今后的详细测试。
让我们等待了4年的推土机让我们寄予了太多希望,不过最终的结果还是一半欢喜一半愁。为了追求多核心性能,其采用模块化设计,多达8核心确实带来了很好的多线程效能,但是单线程效能没有得到提升,加上目前应用软件还跟不上,多数应用对单线程提出了较高要求,导致推土机FX处理器在一些测试中的表现一般。
另外现有操作系统的多核管理机制并未对推土机进行足够的优化,毕竟推土机内部的4模块和8颗核心是不对等的,如果让同意模块内部的两颗核心干同一件事的话,性能肯定不如不同模块里面的两颗核心强。因此推土机和Intel的HT超线程技术一样,需要系统和软件的优化支持,HT技术经过多年的发展已经很成熟了,而推土机模块化的架构还是头一次。据AMD表示,在微软下代Windows 8系统中,推土机会有更佳的表现,今后更多的软件也会对推土机提供优化支持。
Windows 8将会让推土机在不同应用中的性能得到较大提升
造成这一结果的根本原因还是来自于推土机模块化设计的架构,FX-8150虽说是一颗原生8核心处理器,但它只有整数运算单元是8核心的,而浮点运算单元其实仅为4核心,如此一来在强调浮点运算的应用当中其效能就不是很好了。
AMD之所以将推土机架构设计成整数和浮点分离式的设计,是AMD经过多年的分析,认为CPU浮点运算的重要性正在逐年降低,渐渐的将会被运算能力恐怖的GPU所取代。不过目前CPU+GPU异构计算的应用范围还是不够广,尤其是在民用桌面级平台,看来AMD的架构还是设计得太超前了。
FX处理器+9系列芯片组+HD6000显卡构成了天蝎座平台,便宜的价格使得其具备不错的性价比,搭建平台的成本得到良好控制,对于视频转换、渲染、多任务运用需求高的用户来说,FX也是个很不错的选择。■<