双核才是王道!AMD X2 4800+深度测试
目前两家世界上最大的处理器制造厂商都遇到了一个难题,那就是“频率”。频率做为衡量处理器好坏的标准已经成为了大多数人的定论。低频率就代表着一颗处理器性能的滞后,而如今不管是Intel还是AMD都同时遇到了“频率”这个难题。
1965年Intel公司的总裁Gordon Moore提出了Moore定律,他说晶体管会每24个月增长一倍,虽然这个定律或多或少有点吹牛的性质,但Intel却是追随着这个定律足足40年。要做到这点可真不简单,一方面是人类对性能追求的日益高涨,另一方面x86处理器的技术却已然渐渐走到尽头,要像过往数年由1GHz转眼变成3GHz的光景已不再可能,频率的提升仿佛已经走到了瓶颈,这也令目前市场上的处理器频率停滞不前,这在短期内是无法解决的。
处理器工作频率停滞不前的主要原因,要因为频率越高工作温度越高,加上整合的功能越来越多令良品率大大降低,与此同时制程的进步令漏电情况更加严重,几方面因素直接导致了处理器的频率无法大副提升,结果连Intel原本的4GHz计划也要搁置,这也直接促成了CEO贝瑞特无奈单膝跪地希望技术人员原谅的一幕。
其实x86处理器多年来除了频率外,在架构上并没有什么大进步,就拿目前的AMD和Intel处理器来说,虽然x86是CISC的处理器,但却拥有不少RISC处理器的特性,例如SuperScalar(超纯量运算)、SuperPipeline(超级执行管线)及Dynamic Execution(动态执行),这些革新早在Pentium Pro中就已经出现了,这颗94年发表的架构竟然用到今时今日,再也没有更令人震惊的处理器新技术出现了,就连目前最新的Pentium 4和Athlon 64,也只不过是Pentium Pro的加强版而已,例如频率、Cache及Pipeline方面的加强,但却走不出Pentium Pro架构的小框框。
为了令处理器频率可以大幅提升,各处理器厂商都增加了SuperPipeline的数目,而Intel的Pentium 4 Prescott核心更高达31条SuperPipeline,为什么增加Pipeline Stage可增加频率呢!?首先我们要浅谈Pipeline原理,Prescott 有31个进程Pipeline,代表CPU可以把一个指令分为31份进行,而每一个Mhz可以运作两个进程,而CPU可以同一时间做数十个指令,但新的指令要等上一个指令的进程完成后才能开始,故此如果进程分得细一点的话,即每个频率所工作的份量就会较少,工作也就能够尽快完成并开始下一个指令,这样就会较易增加频率。
但是这个理论是假设CPU的工作永不出错才能成立,但现在的CPU都是利用预支结果(Branch Prediction)来提高效率,但预支的结果达不到100%的准确率,如果其中一个进程出错的话,工作就需要重新进行,而其它需要得到这个相关这个工作的指令也很可能要重新进行,进程越多预支结果出错时所做成的牵连及延误要比进程较少的处理器更多。
虽然增加进程可以让频率及性能得以提升,但关键还要看预支结果(Branch Prediction)的准确度,但某CPU厂的工程师表示要让预支结果(Branch Prediction)不出错是非常十分困难的,这也反映了为何Pentium 4在同频率下反要比Pentium M还要差吧,因为Pentium M只有16个进程。另外处理器厂商还想通过提升处理器内部的Cache数目从而达到提升性能的目的,但事与愿违Cache并不是越大也好,当Cache已达一定数目时提升性能的效果就越来越小。
AMD Athlon64 X2处理器内部构造图
这也就造成了Intel和AMD都在追求频率以外的提升性能方案,例如增加系统带宽的速度、提升Cache的容量和命中率、加强处理器的指令集如MMX、SSE、SSE2、SSE3、3D!Now、3D!Now Pro等以优化执行效率,当各种方法都用尽后而单颗处理器走到尽头,最后业界也只好搬出Dual Core/Multi技术来,这也就是我们今天要介绍到的双核心处理器!
从05年上半年来看,AMD还算是春风得意,在DIY市场中将老对手Intel压得不能翻身,但05年4月18日,Intel为了扭转处理器频率上的瓶颈,推出了世界上第一枚桌面双核心处理器,而AMD也不可避免的和Intel一样,在频率上都遇到了同样麻烦。而接下来的6个月中,AMD难道还要再靠这几款老将来应对Intel猛烈的反扑攻势吗?没有更先进的“武器”怎能对付Intel率先推出的Pentium D双核处理器?
经过一段时间的摔打,AMD终于把自己未来处理器接口的发展方向确定下来了。他们的处理器产品线划分也更加明朗。
Socket A终于告别了众多喜爱他的用户,而以前的Socket 940等接口也会随着时间的推移慢慢推出这个DIY市场。由AMD精心架设的Socket754 Sempron和Socket939 Athlon 64处理器市场配比结构取得了很好的反馈,而AMD也将这两种接口做为今后发展的重点。Socket939 Athlon 64处理器会在今年的下半年提升市场占有比率,Socket754 Sempron则会是现有入门级别消费市场的唯一产品线。
为了能够解决频率上的问题,并且能够阻挡Intel双核心的攻势,AMD推出了Athlon64 X2双核心处理器。虽然Athlon64 X2看似将是AMD最新最高端的处理器,但AMD却为它安排了一个中高端的定位,排在Athlon64上面,Athlon64 FX下面。将X2定位在这种承上启下的位置。
对于双核心Athlon64 X2的出现,不少人都认为它会取代Athlon64 FX,其实这个想法十分错误,由于Athlon64 X2拥有两个核心,因此它在处理多线程运算、媒体压缩方面优势十分明显,但由于Athlon64 FX转为3D游戏而生,因为大部份游戏在双核心下没有太大的效能提升,相反频率的提升会比较重要,因此Athlon64 FX的定位和Athlon64 X2都不会发生任何冲突。
而身为入门级的Sempron定位维持不变,主要为预算有限的用家而设立,并提供非常好的的高性价比的性能,而Athlon64处理器则为主流产品级别,提供有竞争力的功能、性能及超频能力。
对于AMD公开透露的2006年处理器改革方向,其中最受注目的,肯定是Socket将会有大的改动。
目前桌面处理器Socket为754及939,但到了06年第三季将会被Socket M2取代,Socket M2的针数为940,但与目前的Socket 940定义有所不同,Socket M2版Athlon 64将采用双核心版代号Windsor,支持DDR2双通管内存技术、支持Security及Virtualization,而单核心版代号为Orleans,同样支持DDR2双通管内存技术、支持Security及Virtualization。Socket M2版的Sempron代号为Manila,它是Orleans的简化版,Cache的数目可能只有Orleans的1/4,而且还不支持Security及Virtualization,但却同样支持DDR2双通管内存技术。
就连Intel也会承认,Pentium D的构架照现在这个样子把两个Pentium 4核心简单地粘合在一起并不是最令人满意的。从功耗的角度来说,两个核心几乎不能被独立地控制(它们仍然被分派相同的电压,并必须以相同的功率状态运行),而且核心之间的所有通信必须在外部FSB上实现。下面的图表可以很好地阐明后面这一点。
Intel的Pentium D双核心构架
AMD的Athlon64 X2的双核心构架
两个核心之间的任何通信不得不通过外部FSB来完成,而在外部总线上核心对核心的通信显然是较慢的。由于两个核心是在同一个Die上的,所以这显然没有意义。连Pentium D的65nm继任者(Presler)也同样会有这样的局限性。
由于K8构架的On-Die北桥,AMD的构架要精密复杂得多。虽然我们通常只讨论K8的On-Die内存控制器的好处,但对于双核心来说On-Die北桥才是极其重要的。与把核心之间的所有通信放在外部的FSB上不同,每个核心会把它的请求放在System Request Queue(SRQ)上,而当资源可用时,请求会被发送到适当的执行核心 - 完全不用超出CPU Die的范围。AMD的实现有许多的好处,而在多线程/多任务处理繁重的场景中,仅仅是由于这个执行细节就有可能让AMD拥有对Intel的性能优势。
AMD和Intel两家都无法消除的一个限制就是带宽。为了保持对现有Socket 940和Socket 939主板的兼容性,AMD不能增加它们的双核心处理器的针脚数量。这样的好处是AMD的双核心CPU可以在几乎所有的Socket 940和Socket 939主板上运转,但缺陷是内存总线保存在128-bit宽度下无变化,支持的最大内存速度仍是DDR400。所以当单核心Athlon 64和Opteron CPU获得了完整的6.4GB/s内存带宽时,双核心CPU却不得不让两个核心共享相同的内存带宽,而不是每个独占6.4GB/s。
AMD对这个问题的解决方案将诉诸于DDR2和新的底座,但目前并没有解决内存带宽限制。从内存带宽的观点来看,Intel如今处于更好的位置。在这一点上,它们的芯片组通过双通道DDR2 667控制器提供了比单个核心所需的更多的内存带宽。但问题是Intel双核心CPU仍然运行在64 bit 800MHz FSB上,那使得Intel的问题集中在了FSB带宽限制上,而不是内存带宽限制。
● AMD很厚道 X2可以向下兼容性
Intel的双核心Pentium D和Extreme Edition不能在任何以前的主板中运转,必需使用最新的945/955主板才能正常使用,而AMD的惊喜来自于对单核心主板几乎100%的向下兼容性。这个问题我们在测试阶段已经充分验证,我们使用了基于nForce4 SLI芯片组的华硕A8N SLI做为测试平台。
对于桌面系统用户而言,能够使用已有的Socket 939主板来支持未来的双核心是AMD送上的一份大礼,至今我们以前从未见过CPU厂商会这么照顾它们的用户。
按照AMD的规划,Athlon 64 X2应该在今年的第二季度推出。虽然AMD有意识地在它们的上市问题上含糊其词,但看起来它们的计划是在今年的第三季度向整机制造商和OEM提供Athlon 64 X2系统,而在今年的第四季度才会推出零售产品。
对于AMD而言,Athlon 64 4000+将是它们制造的最后一款单核心Athlon 64了,在4000+之后的所有型号数字都将代表双核心Athlon 64 X2。从4200+开始直到4800+,Athlon 64 X2延续了AMD基于时钟速度和缓存大小确定型号数字的做法。下面可以看到逐条列出的数据:
Athlon 64 X2
首先,Athlon 64 X2的时钟速度与当前的单核心Athlon 64相比不算太低。优异Athlon 64 FX 55运行在2.6GHz下,只比Athlon 64 X2 4800+快了200MHz。这与Intel的桌面双核心产品形成了鲜明的对比,后者运行在2.8到3.2GHz之间,比最快的单核心CPU整整少了600MHz。
AMD和Intel的双核心桌面产品之间的另一个重要差异是在定价上。让我们看一看Athlon 64 X2核心的造价:
Athlon 64 X2
我们看到AMD的桌面系统定价比它们的双核心Opteron定价要合理得多,但这次的双核心处理器在第四季度以前基本上是有价无市。
接下来让我们把它跟Intel的定价做个比较:
跟Intel的定价做比较
目前Intel正在出货的只是频率较低的双核心CPU,所以Intel的芯片价格要低上不少,更不用说Intel的制造能力远远超过AMD的了。从百分比看,Pentium D 3.2为第二个核心支付了最高的额外费用,但总的来说价格还是相当合理的。最快的Pentium D仍然比最慢的Athlon 64 X2 4200+要便宜,而最慢的Pentium D与AMD的双核心产品相比便宜得让人忍不住苦笑。
面对Intel咄咄逼人的定价,AMD的回应由两部分组成。最终所有的AMD CPU都将是双核心的,因此价格会回落到单核心的水平。
目前AMD对于它们的单核心CPU快到足以与Intel的低频Pentium D竞争感到信心十足。我们通过对以前的Intel双核心的测试证明了这个想法,并得出结论:那实际上取决于用户使用的范围。如果用户倾向于许多的多任务处理或运行许多的多线程应用程序的话,那较慢的Intel双核心处理器也可以满足需要了;否则,更快的单核心AMD就是非常好的的选择。
这次为大家介绍的双核心为AMD Athlon64 X2 4800+,是目前AMD推出的较高级别的双核心CPU。
Athlon64 X2 4800+的主频2.4G,每个核心拥有512KB二级缓存
图为Athlon 64 X2 4800+双核心处理器,05年第13周出厂
目前AMD推出共四个Athlon64 X2型号,包括4200+、4400+、4600+及4800+,其中4200+和4400+频率为2.2GHz,而4600+和4800+则为2.4GHz。为何两者型号不同但频率却又一样呢?原来4200+及4600+和4400+及4800+核心有所不同,4400+及4800+核心代号为Toledo,核心集成了1MB×2的L2 Cache,而4200+及4600+核心代号为Manchester,虽然两者同为双核心处理器,但核心集成的L2 Cache相对较少,只有512KB×2,核心的不同成为了两者性能上有所差异的原因。
要分别Toledo及Manchester核心其实十分简单,在处理器表面的OPN号码上,第一行的最后两个字“CD”代表核心版本为E6,即拥有1MB×2 L2 Cache的Toledo,如果是“BV”的话,核心版本则为E4,即是拥有512KB×2 L2 Cache的Manchester。除了L2 Cache的数量外,两者并没有任何分别,同样为90奈米SOI程制,支持SSE3指令集,电压为1.35~1.4V,最高工作温度为65°C,最高功耗为110W。
虽然AMD的双核处理器能够在目前的939主板上使用,但这个使用的过程并不轻松。首先你的主板必需更换最新的BIOS,然后还需要在Windows XP SP2系统中安装X2的补丁,这样你的X2才会被真正识别!
安装相应的补丁后,Athlon64 X2终于被系统所识别
接下来的“设备管理器”也识别出了双核处理器
在“任务管理器”中的Y“CPU 使用记录”中也正确识别出了双核处理器
最后我们在用最新版本的CPU-Z来看看这个处理器。在核心名称中软件识别出该X2 4800+的核心为Toledo,频率为200×12,L2缓存1M.
● 测试平台
在测试平台中,我们选择了和4800+频率相同的单核心4000+进行对比(2.4 GHz),这样才能让用户更加直观的了解Athlon64 X2 4800+的真实性能。
Athlon64 4000+
Athlon64 X2 4800+
测试平台 | |
处 理 器 | AMD Athlon64 X2 4800+(2.4 GHz) |
AMD Athlon64 4000+(2.4GHz) | |
主 板 | 华硕A8N SLI Deluxe |
显 卡 | 七彩虹GeForce 6800Ultra |
内 存 | 海盗旗DDR400 256MB×2 |
硬 盘 | 希捷酷鱼7200.7 |
显 示 器 | 爱国者 998FD |
驱动程序 | |
主板驱动 | 主板自带 |
显卡驱动 | Forceware 71.89 WHQL |
操作系统 | 英文Windows XP + SP2 |
在此次测试中,我们全部使用了最高端的产品,CPU自然不用说了,主板使用的是华硕A8N-SLI Deluxe。该款主板采用了NVIDIA nForce4 SLI芯片组,支持Socket939接口的Athlon64/FX处理器,经过更新BIOS可以正常识别Athlon64 X2双核心处理器;4个内存插槽配合Athlon64处理器内部集成的内存控制器可以支持双通道DDR400内存,最大容量为4GB。
除了搭载SLI平台所具备的两条PCI-EXPRESS X16接口外,主板还提供2个PCI Express x1,3个传统PCI接口。4个SATA,2个PATA接口及4个SATAII接口,支持RAID 0/1/0+1/JBOD等存储功能,另外它还集成了2个千兆网卡和2个1394接口,无论是存储还是可扩展性能这款主板在目前来说都算是最豪华的。
而内存我们选择了Corsair Pro SeriesCMX512-3200XL内存,这款内存带有特制的黑色铝制散热片,散热面积要比以前大许多,在内存条顶部还有9盏LED指示灯,并排两行红、黄和绿色LED灯可以显示内存的工作状态。
看了上面这套配置,小遍不禁想起了一个成语“双喜临门”正好可以完美的来形容这套优异配置。双核心处理器、双显卡、双内存再加上双通道内存技术,众多“双”字打造了这套最尖端的测试平台!
SiSoft Sandra是一款测试参数的软件,我们使用这款软件测试处理器的算术运算性能和内存的带宽。
在SiSoft Sandra 2005的测试中我们惊喜的发现,在主频相同的情况下,双核心Athlon64 X2 4800+全面领先3.4E,甚至在前四项目测试中4800+即将超越4000+一倍,也许超频后的830能够实现我们的这一愿望。而内存测试如我们所料,没有出现明显的分数差异。
在PCMark04的测试用,双核心4800+渐渐显示出王者风范,在这样的多任务测试中4800+怎会手下留情!
虽然Aquamark3名声在外,但它毕竟是很早的测试软件了,显得有些落伍。在测试中,双核没有发挥出自己的优势,完全是被当成一颗单核心的处理器进行测试。
Winstone 2004是一款和SYSmark类似的测试软件,分为两个部分,分别为考察商用软件的Business Winstone和考察多媒体内容制作的Multimedia Contencreation Winstone。
从上面的柱撞图可以看出4800+和4000+在频率上完全形通,所以在Business Winstone测试中平起平坐。
可换做考察多媒体内容制作的Multimedia Contencreation Winstone测试项目后情况又是怎样的呢?我们可以看到在4项有关多进程的测试中,4800+几乎全部胜出,这主要得益于4800+强劲的双核心处理能力才使4800+脱影而出。
由于我们使用的测试显卡为双GeForce 6800 Ultra,在低分辨率下并不能体现两颗同频处理器的差异,所以我们下面的游戏测试分辨率全部定格在了1600×1200上!
看来在上面三个测试软件中,4000+和4800+都表现平平,没有拉开距离,其中的原因主要是这三款游戏还没有开始支持多核心处理器,所以两颗CPU的得分接近也就不足为奇了!
接下来我们将要进行的测试是以往测试中很少用到的多任务测试。在以往的测试中我们总是为了测试出最准确的数字将硬盘格式化然后装上最新的系统,关上所有可能会影响测试成绩的软件,在最干净的环境中进行测试并得出最准确的得分。但这次我们不再这样测试了,因为这样的测试对双核心4800+来说毫无意义,而双核心的意义就在于它可以同时处理多个任务且不会出现性能下降的问题!
在该项测试中我们放弃了常用的测试方法,而改为多种测试软件同时测试的BT方法,虽然看似BT,但只有这种BT的招数才能逼出Athlon64 X2 4800+双核心处理器的精髓所在。● DOOM3测试双核心
最后是游戏的测试,而测试项目我们只选择了DOOM3做为唯一的游戏测试项目。
最后,我们还是同时开启了3个程序进行测试,而最后的结果想必大家也能猜到。4000+在DOOM3的测试中的帧数出现了大幅度下降,而4800+总共只下降了10帧左右!
看过前面的测试后,你一定对双核心处理器有了一个更深刻的印象。不论是早已推出的Athlon64单核处理器,还是Athlon64 X2双核处理器,在测试中都表现出了很好的竞技状态,虽然Athlon64单核处理器在最后的多任务测试中被双核心渐渐甩在后面,但我们可以看出单核心的性能依然强大!
另外我们要说说双核心的应用。从测试中得出的结论是双核心并不适合玩游戏,而且它的价格也不是一般的玩家能够用得起的。
它和Intel的定位相同,都主要致力于工作站,或是有特殊需要的专业人士,因为双核正好可以帮助它们同时进行多任务的工作,来换取宝贵的工作时间。