推土机强拆沙桥 AMD下代平台模拟测试
泡泡网主板频道8月6日 从双核到四核再到六核,在这几年处理器从核心数量以及性能方面一直在大跨度的前进,当然这样迅速的进步首先要感谢桌面处理器的两大厂商Intel与AMD的竞争。
不过在经历了无数次的较量之后,AMD优异桌面产品在性能方面逐渐被Intel甩开,尤其是在Intel推出了32nm工艺的新一代SandyBridge处理器之后,AMD在高端平台性能方面的劣势更加明显,因此AMD即将推出蓄力已久的新一代产品“推土机”——Bulldozer桌面处理器。
自从我们关于“推土机”的消息放出之后,关于它的众多信息就被陆续透露出来。首先是其新架构的革新,其次是性能方面的大跨度前进。当然新一代产品即将推出不管是AMD还是我们消费者固然愿意看到新平台在性能方面有大跨度提升,而AMD也放言“推土机”将比Intel的Core I7 四核心产品性能快50%!
从Intel推出了Core 2处理器之后,笔者也一直在关注AMD的动向,希望AMD能借新一代全新架构再现当年的K8雄风,不过直到 Phenom II 的发布AMD也未能挽回劣势的局面,虽然Phenom II 相比老一代的产品已经有了不小的改进,但它改进的还不够彻底。
“推土机”的发布已经日益临近,相比大家对它也有了不少期待以及猜测,虽然AMD也放言“推土机”将比Intel的Core I7 四核心产品性能快很多,但是要做什么样的改进才能超越Core I7 呢?下面笔者就带着大家展望一下未来的“推土机”,以及“推土机”平台需要做出的改进。
Bulldozer推土机可以说既是AMD官方也是很多网友寄予厚望的一代架构,Intel的酷睿2处理器在市场风光多年就是得益于当初相比上代性能提升40%、功耗降低40%的全新架构,AMD也确实需要类似的架构来提振“士气”。
推土机架构采用模块化设计
在AMD官方文档上表述了推土机架构带来了很多全新的特性,比如采用模块化设计,传统的核心被模块取代,并且配有16MB的L3级缓存。
每个模块设计方面共享了一个浮点调度器可以节省大量的晶体管,有效降低处理器核心面积进而降低成本,此外功耗也更好控制。每个模块的两个128bit FMAC单元既可以被每个核心(每个模块可以简单看做现在的两个核心)单独使用,也可以合并成一个256bit FMAC。此外,推土机新架构讲支持全新的X86指令集,包括SSE4.1、SSE4.2、AVX、XOP。
相比SMP和CMP,Bulldozer的共享模块化设计执行效率更高
AMD推土机架构可以说是AMD彻底重新设计,共享、专用单元结合和模块化设计让这一架构相比Intel Sandy Bridge有着很多大不一样的诱人特性,但是相信这些规格上的改进并不能说明“推土机”一定一扫之前的颓势,因为高规格需要高效能才会匹配!就像AMD Phenom II 产品虽然有着6MB的L3级缓存但是他的效率仍然不尽人意,下面笔者就进行深入分析!
既然AMD表示“推土机”相比Phenom II 产品有着巨大的改进,那么我们以目前的Phenom II 产品作为基准,来谈论“推土机”在Phenom II 性能的基础上应该有哪些改进,当然还要加入Intel Core 2产品作对比,因为“推土机”要超越的的并不仅仅是自家的Phenom II ,而是Intel目前的高端I7系列处理器。
根据笔者的经验来看,“推土机”想要超越Intel Core I7 必须要做到一下几点改进:
1.单线程性能
已经进入了多核心时代以后,核心数量成为了一个衡量处理器性能的重要指标,以至于让大家逐渐忽视了单线程性能,其实在多核心的时代单线程性能依然对处理器性能有着不小的影响。
2.L3缓存容量
对于处理器内部的缓存来说,AMD处理器核心相对于Intel的需求相对要小一些,由于I/A处理器架构不同缓存的链路速度也不同并且非常复杂,因此至于原因下面的文章里仅会简单说明。
3.内存带宽性能
虽然AMD内存控制器很早就融入了处理器中,并且在当时也发挥出了很好的效能,但是Intel后来者居上,目前在内存带宽方面已经大幅度超越了AMD,因此“推土机”必须在此方面大幅度提升性能!
4.处理器、内存控制器、L3缓存的频率还有功耗。
说起频率这一直是AMD的痛处,Intel凭借迅速提升工艺来大幅度减少漏电革新架构以至于目前在频率方面奄然没有任何压力,反观AMD虽然Phenom II 965以及六核心1100T在频率方面已经提高到了3.4GHz左右,但是其功耗颇高以至于很难再有发幅度提升。
上面笔者已经提出了“推土机”想要超越Intel Core I7 需要做到的改进,那么下面我们就来用测试数据来深入分析“推土机”究竟在性能上提升多大的幅度才能超越Intel Core I7 !
硬件系统配置 | |
AMD Phenom II X 6 1100T (AM3 /3.3GHz)
| |
Crosshair V Formula | |
希捷 Barracuda XT 2TB | |
宇瞻猎豹 DDR3-1600 | |
ENERMAX ELT620AWT-ECO | |
AMD Radeon HD 6970(独显) | |
显示器 |
优派VX2423w(1920x1080) |
软件系统配置 | |
Windows7 RTM 7600 64BIT |
测试平台介绍
羿龙II X6 1100T基于六颗Thuban核心设计,采用了45nm制程,默认主频设置在3.30GHz,外频200MHz,倍频16.5X,支持Turbo Core技术,而且3MB二级缓存和6MB三级缓存的超大缓存量为大数据量的运算提供了支撑。
内存:宇瞻猎豹超频内存
宇瞻第二代猎豹超频采用独特的窗孔式散热鳍片,该技术主要是利用窗孔的通风从而在窗孔中加入散热鳍片,从而能够高效的使风带走散热鳍片上面的温度,使内存能够保持一个良好温度进行超频和稳定工作。窗孔式散热片在上方还有一个螺旋纽扣,使两个散热片能够和颗粒结合的更紧更牢固,从而使散热片更好的带走内存颗粒上的温度。此外,金色的散热片非常抢眼,给人的第一印象非常高端尊贵。
猎豹内存系列产品,不但有着高频率、低延迟的性能优势外,而且在产品品质上面,也采用了原厂特挑的模组颗粒,为了就是提高该产品的超频性和稳定性。
近期有消息透露AMD推土机架构处理器将在9月份发布,并且其各种规格和性能也流露了出来,但就目前的成绩并没有满足大家的希望。
AMD推土机处理器FX-8130P
上面就是被曝光的AMD推土机处理器规格以及性能,由于根据这些图片还不能确定推土机的性能,因此笔者根据推土机的规格用目前的Phenom II处理器进行了性能模拟。
由于Phenom II处理器最高仅有六核心产品因此我们将模拟推土机相对应的FX-6110,在规格表中我们看到FX-6110支持DDR3 1866的内存频率,并且推土机产品频率都较高,还支持Turbo Core动态加速,据爆出的最新消息频率应该在3.8GHz,因此我们将Phenom II超频到了类似规格。
经过调试我们将AMD Phenom II 六核1100T超频到3.8GHz,并且将内存频率调整到1866MHz,基本和推土机FX-6110的规格近,下面我们来看一下,测试成绩的对比分析。
上面笔者提出了单线程性能在处理器中影响巨大,下面我们将AMD Phenom II 1100T默认和模拟推土机FX-6110的性能进行了对比,另外我们加入的Intel 2600K的成绩对比。
图形渲染效能:CineBenchR10
CineBench使用针对电影电视行业开发的Cinema 4D特效软件引擎,可以测试CPU和显卡的性能。Maxon公司表示,相对于之前的9.x版,R10版更能榨干系统的最后一点潜能,准确体现系统性能指标。最新R10版最高支持16核处理器。
CineBench R10可以针对不同处理器选择不同的线数来进行渲染
从CineBench R10的单线程测试来看AMD确实不给力啊,虽然目前处理器都向多核心发展,但是单线程性能依然非常重要,另外我们不得不说Intel I7 2600K的单线程性能太强劲了,我们模拟出的FX-6110的性能还是不能追上2600K。
这是一款国际象棋测试软件,但它并不是独立存在的,而是《Fritz9》这款获得国际认可的国际象棋程序中的一个测试性能部分。由于国际象棋的运算大致仍旧是依靠电脑CPU的高速处理能力,将每一个可能的走法以穷举算法预测,从中选择胜算最大的非常好的走法。所以用它来衡量对比不同的PC系统中CPU的多线程运算能力也是有参考价值的。
Fritz测试
在多线程的性能时我们看到了模拟出的FX-6110的性能列为第一,而2600K屈居第二,1100T排位第三名,从多线程的测试来看AMD推土机超越Intel的I7系列产品还是没有问题的。
2600K内存读取成绩都在一万六以上
而1100T的带宽还在一万以下徘徊
模拟出的FX-6110也仅有一万一千分左右
通过内存的性能测试来看,AMD平台的瓶颈确实不小,搭配1866MHz频率的平台内存带宽也仅有一万一千分左右,为什么都是双通道AMD平台的内存效率不高呢?下面我们来为大家解答
如果你是一位长期玩超频、并且细心观察的玩家,你会发现在AMD推出Phenom II以后其L3级缓存的性能基本是和内存的读写性能没有太大差别的,而Intel却完全相反,其实这个原因就出自内存控制器和L3级缓存的频率上!
首先我们来看一下Intel的缓存,大家仔细看其L2以及L3级缓存的标注是On-Die ECC Full-Speed,这个意思就是On-Die(核心内部)ECC(支持ECC校验)Full-Speed(全速运行)!
其实前两个规格已经不太重要了,因为不论AMD还是Intel的缓存早就被封装在了核心内部,并且都支持了ECC校验技术,而Full-Speed(全速运行)才是重点,Intel Full-Speed(全速运行)就代表着L3级缓存适合主频的速度完全同步的,换句话说就是主频是多少L3级缓存的速度就是多少,另外Intel的内存控制器也是Full-Speed! 好下面我们来看看AMD的缓存!
AMD处理器内部的L2级缓存和Intel一样On-Die ECC Full-Speed,但是L3级缓存我们看到了差异!
L3级缓存的标注是On-Die ECC NB-Speed !大家肯定要问这NB-Speed是个什么速度? 好下面我来为大家解释!
AMD处理器内部其实是以两个频率在运行的,L1以及L2级缓存和运算核心的速度是一致的,也就是主频的速度!
而L3级缓存和内存控制器的速度是一致,并且以另外一种频率运行,上面说的NB-Speed其实就是内存控制器(NB是内存控制器)的速度,这个速度就是我们在CPU-Z内存页面看到的“注:后面”的这个频率。
NB-Speed这个频率其实是以一个较慢的速度运行的,1100T的主频为3.3GHz,但是L3级缓存和内存控制器的速度确仅为2000MHz,也就2Ghz。
Intel的处理器都以全速运行包括缓存和内存控制器,而AMD确不同,到这里大家明白为什么AMD的内存性能比较低了吧。好下面我们继续来看游戏性能测试。
3DMark Vantage所使用的全新引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨,号称“显卡危机”的Crysis也不得不甘拜下风。
画面设置:3DMark Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级),只有在这四种模式下才能跑出总分,如果自定义模式就只能得到子项目分数了。
3DMark Vantage
从3DMark Vantage的测试成绩来看,AMD平台的差距就显露了出来,虽然模拟出的FX-6110相比1100T有些提升,但是由于单线程性能不济,因此整体成绩被Intel 平台拉开了差距!
时至今日,依然没有任何一个测试软件或者游戏能够取代3DMark在游戏玩家心目中的地位,因为3DMark的魅力就在于它所带来的不仅仅是惊艳的画面,更重要的是向广大玩家提供了一种权威、系统、公正衡量显卡性能的分值。
3DMark11的测试重点是实时利用DX11 API更新和渲染复杂的游戏世界,通过六个不同测试环节得到一个综合评分,藉此评判一套PC系统的基准性能水平。
● 3DMark 11的特色与亮点:
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面细分、计算着色器、多线程。
2、原生支持64bit,保留32bit:原生64位编译程序,独立的32位、64位可执行文件,并支持兼容模式。
3、全新测试场景:总计六个测试场景,包括四个图形测试(其实是两个场景)、一个物理测试、一个综合测试,全面衡量GPU、CPU性能。
4、抛弃PhysX,使用Bullet物理引擎:抛弃封闭的NVIDIA PhysX而改用开源的Bullet专业物理库,支持碰撞检测、刚体、软体,根据ZLib授权协议而免费使用。
● 3DMark 11 Extreme模式:
虽然在3DMark Vantage的测试中AMD平台的性能稍弱,但是在高分辨率特效下得3DMark 11 Extreme模式中我们看到了I7 2600K和模拟出的FX-6110以及1100T的性能相差无几!
游戏介绍:《冲突世界》将带领玩家返回著名的冷战时期,玩家每一个决定均影响游戏中人物和情节。可于游戏中感受不一样的团队精神,与队友于阴森恐怖的战场上一同作战。《苏联进攻》是其最新的资料片,收录全新角色、扮演苏联军队、10套新影片和全新多人联机地图等等。
画面设置:《冲突世界》是首批DX10游戏之一,采用了自行研发的MassTech引擎,支持多种当前的主流显示特效,如容积云,景深效果,软阴影等,光照系统也表现出色,尤其是半透明的容积云特效营造出了十分逼真的户外场景,物理加速结合体积光照渲染出了最逼真的爆炸效果。
测试方法:内置Benchmark是一段非常华丽的过场动画作为测试程序,最终得出最大、最小和平均FPS,测试结果非常精确。
在《冲突世界:苏联进攻》这款游戏中我们看到了AMD 1100T在性能方面确实和I7平台有些差距,但是模拟出的FX-6110以及将差距追平,看来AMD推土机还是会有不错的表现!
游戏介绍:《鹰击长空》由Ubisoft旗下的Bucharest Studio工作室所研发制作而成,以汤姆克兰西最擅长的近现代国际冲突为背景,加上现代化的军事武器,和五角大厦不愿证实的开发中的先进武器,交织出最激烈的高科技攻防战。而《鹰击长空》也脱离前面几项作品的框架,将战争从地面拉拔到空中,享受广大无界限的战斗空间。
鹰击长空的游戏测试中我们看到,我们模拟出的FX-6110和I7平台的性能是比较接近的,而默认的1100T平台的性能稍弱。
赛车游戏中,轰鸣的发动机声、风驰电掣的急速快感,足以让无数玩家肾上腺素飙升。也许正是如此,才使得赛车类游戏在众多游戏中备受广大玩家的青睐。继4月初,EA早早推出了《优品飞车15》之后,今天,另一款赛车类经典力作《科林麦克雷:尘埃3》也正式发布。
09年末,其前作《尘埃2》带着首款DX11游戏的光环强势出击,成为众多DX11游戏中的经典。如今,新作《尘埃3》将在诸多DX11游戏特效的力助下,使得游戏画质的表现更加出色、完美。
经典新作《尘埃3》的游戏实测中我们看到其测试成绩三个平台都是比较接近的,看来在高画质的游戏方面AMD即将推出的推土机性能还是可以满足我们需求的!
上面笔者进行的模拟性能测试虽然不能完全代表AMD即将推出的推土机以及整体平台的性能,但是相信大家还是可以看到一些有用信息。
比如在多线程应用方面目前的1100T经过超频已经可以具备挑战2600K的能力,相信AMD推土机经过了改良必然要再前者的性能之上!
说道改进,我们不得不说目前AMD的最具瓶颈的单线程以及内存带宽的效能,希望推土机在这两点上能有大跨度的进步。
其实单单处理器性能有提升还不够,平台整体的性能还需要主板芯片组的支持,当然我们现在已经看到了推土机御用的9系列芯片产品,剩下的就是等待AMD新一代“推土机”在短时间内登台。 ■<