AMD完胜!尖峰上的对决Opteron比拼
本文转自GamePC.com,并不代表本站观点。
2004年的下半年时间里,工作站市场的发展似乎不是那么地平衡。Intel和AMD都在不断地推出更新更快的Xeon和Opteron的处理器和芯片组,但是处理器和芯片组的发展都不平衡。
双核心的AMD Opteron 250 (2.4 GHz) 与双核心的Intel Xeon 3.6 GHz处理器
Intel的Nocona Xeon处理器发布时为3.6GHz,比AMD现在市场上的的Opteron要快出了1000 MHz。除了在速度上要优于AMD的Opteron处理器外,Nocona Xeons在整个生产线的性能上也要超过AMD,而且Xeon还有一个比AMD Opteron要好的地方,就是它会生产与之相配套的主板平台,这项技术目前来说还是比较先进的。Xeon系统在6个月前就已经能够使用PCI Express显卡和原生SATA设备,但Opteron似乎在这些方面不及Xeon,至少是晚了几个月。
尽管如此,AMD仍在不断地寻找更好的芯片组和主板,以使其Opetron能够正好地运行。但如果你现在还想使用Opteron系统,你不得不使用AGP 8x的显卡。正是因为这样,很多曾经在Opeteron上花过很多钱的人都转向了Xeon,而且就目前来说Xeon系统的性能和价格之比仍是比较高的。
由于这两套系统使用不同的显卡,因此直到现在,我们仍无法直接对这些系统进行对比。不过,我们实验室刚刚拿到了能够使用同一种显卡的两款Xeon和Opteron。在测试Xeon时,我们选择了基于Intel E7525芯片组的ASUS工作站级的NCT-D平台。在Opteron,我们使用了采用NVIDIA最新nForce4 芯片组的ASUS K8N-DL 工作站板子。这两块主板都允许用户安装PCI Express x16 显卡和原生SATA RAID,均支持大容量内存,都是为工作站级用户设计的。 <
目前市场上为工作站设计的都是新的带2MB L2缓存的Intel Xeon和采用了90nm制造工艺,支持SSE-3指令集的AMD Opteron。
由于我们准备测试的处理器价格在700美元之间,因此我们选择了带有1MB L2缓存的Intel Xeon 3.6 GHz和AMD的Opteron 250 2.4 GHz处理器。这两款处理器都非常快,而且在市场上也很容易买到。它们在近两个月价格也降得很快,下面是这两款处理器的一些参数,供大家参考:
. AMD Opteron 250 Intel Xeon 3.6 GHz 开发 0.13 Micron Sledgehammer 0.09 Micron Nocona 主频 2.4 GHz 3.6 GHz 管道 12 Stage 31 Stage 接口 Socket-940 (Ceramic) Socket-604 (Organic) L1 / L2 / L3缓存 128 kB / 1,024 kB / N/A 16 kB / 1,024 kB/ N/A HyperTransport连接速度/前端总路线速度 1000 MHz HTT 800 MHz FSB 最大需要功率 89 Watts 103 Watts X86-64 (4位)支持 Yes, AMD64 Yes, EM64T 支持的指令集 MMX, 3DNow, SSE, SSE-2 MMX, SSE, SSE-2, SSE-3 NX (No-Execute) 位支持 Yes Yes
Xeon 3.6 GHz处理器采用的是Intel的Nocona设计,而Opteron 250则采用的是AMD的Sledgehammer设计(即开发代号)。各自的架构都有其优势和不足,AMD的管理并不是太多,只有12根,但它主要集成有DDR内存控制器,这样在内存速度上就会比Intel的要快一些。
比较来言,Xeon有31根管道,这对于一个时钟周期来说是会损失其性能的。Xeon在时钟速度上有很大的优势,但它在一个时钟周期里并不能够做更多的事情,这也就使它的优势不那么明显。Intel的Nocona设计允许其使用超线程技术,这样CPU就能同时处理4个线程(两个处理器+两个虚拟处理器),但AMD的Opteron则只能同时处理2个线程(在一个时钟周期里)。尽管同时处理4个线程在桌面机器,对个人用户来说没有什么,但在工作站级的机器上却有着很深的意义,可以大大提升其程序运行效能。
两块CPU都采用了1MB的L2缓存,但是Xeon似乎比Opteron快一些。Opteron的L2缓存的延迟要长一些,它还有128 kB的L1缓存,但是Xeon L2却只有16 kB,这样比起来,Opteron里的缓存就比Xeon的多了。
说到支持指令集,在他们最新版本的CPU中,两家都差不多。最新的Xeon处理器支持SSE-3,同时也支持X86-64位技术(这项技术Intel命名为EM64T ),AMD同样支持X86-64 位技术,只是将它称为AMD64,而且也支持SSE-2指令集。
AMD Opteron的下一代产品(252或更高)也将支持SSE-3指令集,不过,由于Opteron暂时还不支持SSE-3指令集,所以我们没有在这方面做测试。另外,两款CPU都支持NX (No-Execute)位技术,这样它们都可以防止一些病毒的侵袭,当然了,要使用此项技术,你必须要有操作系统的支持,比如Windows XP SP2。<
在这里我们忽略了一个问题,就是我们并没有查看这两款处理器所属的家族,就它们使用的电量来说,两款CPU都有节能的技术,这样当CPU负载不是很重时,它们都可以自行调节频率,从而少用些电能。如果你运行多台这样的机器,无疑会给你省下非常多的费用。
在这里,我们用了Rightmark CPU Clock Utility程序,也简称为RMClock,我们可以很清楚地看到每款CPU的节能的状态。Xeon使用了DBS (Demand Based Switching)和Intel C1E (Enhanced Halt State)节能模式。Opteron则支持Cool and Quiet技术,也就是大家熟知的PowerNow技术。Intel的DBS、 C1E和AMD的Cool and Quiet 技术都可以让CPU在负载不多或空闲时降频运行,从而省下更多的电能和金钱。
但可惜的是,到这篇稿件截稿时,只有Xeon的DBS节能技术工作得很好,当系统空闲时,它最多可以将3.6 GHz的处理器降到2.8 GHz,其电压也从1.38V降到1.2V。但Opteron的Cool and Quiet技术并没有能够在nForce4 PCI Express Opteron平台上工作得很好(采用了Asus K8N-E 和Tyan Thunder K8WE),只是在BIOS中有Cool and Quiet 的选项,并声称当系统空闲时,允许最多可以从2.4 GHz降到1.0 GHz。尽管如此,大家也要记好了,这项技术在很多的老的Opteron 平台上,只是在nForce4上我们没有看到罢了。而强制通过RMClock程序使其降频运行时,机器蓝屏并死机了。
我们运行了很多需要消耗大量电能的应用程序来做测试,我们通过SeaSonic的terrific PowerAngel hardware wattage monitor测试了系统的所有AC负载(包括CPU、内存、显卡、硬盘和DVD刻录机),我们测试了CPU和GPU最空闲及负载最大情况下的数值。
为了测试CPU,我们运行了多次Prime 95,以使CPU一直保持着最大输出,在GPU测试过程,我们使用了Masaki Kawase的 DirectX 9.0 HDR Shader 测试,它也是一项极其消费显卡资源的项目。当然,在进行能源测试时,所有的节能技术,如DBS和Cool and Quiet都被禁止掉了。
从上面的测试结果来看,我们得到了一个有趣的现象。以前,人们都说Opteron用电要比Xeon要少。但这次,当打开Nocona新核心Xeon处理器C1E技术时,Xeon用的电要比Opteron还要少。
除了用电多些外,Opteron的执行效率要高一些。双核心的Opteron 250处理器在峰值上其功率为263W,但是Xeon 3.6 GHz处理器却达到329W,比Xeon要少了66W。
当我们把一些高端显卡安装到机器上后,能量的消耗就变得不可思议了。Opteron 250+Radeon X850 XT 功率为311W ,而Xeon 3.6 GHz+Radeon X850 XT则为391W。有鉴于此,我们推荐大家必须使用550W以上的电源,因为这些系统已经快接近400W了,而一些电源最大值也只能够达到其70~75%,所以推荐550W电源是极其有必要的。<
在我们测试过程中用的两款主板在设计及其功能方面都相类似,因此它们也成为我们向用户们推荐的不二之选。这两款主板均由 Asus提供,有双核心CPU插槽和CI Express 插槽,而且使用了标准的ATX 架构。下面是这两块主板的主要参数,供大家参考。
. |
ASUS K8N-DL |
ASUS NCT-D |
支持处理器 |
两个 Socket-940 AMD Opteron |
两个 Socket-604 Intel Xeon |
芯片组 |
nVidia nForce4 Professional 2200 |
Intel E7525 / Intel 6300ESB |
内存支持 |
双通道 DDR-400 NUMA下可达 12.8 GB/s |
双通道 DDR-400 |
内存容量 |
6根DDR DIMM插槽 |
4根DDR DIMM插槽 最多可上8 GB 内存 |
PCI Express 显卡 插槽 |
1根 PCI Express x16插槽 |
1根 PCI Express x16插槽 |
PCI Express 扩展插槽 |
1 根 PCI Express x1 |
1 根 PCI Express x8 |
PCI-X 扩展槽 |
无 |
2 根 64位 (66 MHz) |
32位PCI插槽 |
2 根32位 (33 MHz) |
1根32位 (33 MHz) |
主板集成SATA |
nVidia "nVRAID" SATA-300 |
Intel 6300ESB SATA-150 |
主板集成网卡 |
Broadcom BCM5751KFB 千兆网卡通过PCI Express x1连接 |
Broadcom BCM5751KFB 千兆网卡通过PCI Express x1连接 |
集成音频 |
Realtek ALC850 8通道 AC''97 S/PDIF 7.1数字输出 |
Analog Devices 1980 6通道 AC''97 S/PDIF 5.1数字输出 |
主板USB 2.0 |
10个 USB 2.0 接口 |
8 个 USB 2.0 Ports 4 前4后 |
主板集成 火线接口 |
2 个400MHz火线接口 1前1后 Texas Instruments 控制芯片 |
2 个400MHz火线接口 1前1后 Texas Instruments 控制芯片 |
对于K8N-DL的设计,业界褒贬不一,支持双核心Socket 940 CPU,最多支持24GB内存,还支持PCI Express 显卡,采用ATX架构,为了节省板子的大小,使得它的设计看上去有些奇怪。
基于NVIDIA nForce4 Professional的ASUS K8N-DL
为了给CPU让出更多的空间,ASUS不得不确掉很多的扩展槽,只有一个 PCI Express x1插槽和2个32位的PCI插槽,外加一个标准PCI Express x16显卡插槽。这意味着它没有ASUSNCT-D的PCI-X高速插槽,也不支持这些设备。但是作为一款工作站级别的主板,它还可以通过nVidia 的nForce4 Pro 2200芯片提供SATA-II/300及RAID-0/1/0+1能力。该主板还支持10个USB 2.0,2个400MHz的火线口,PCI Express的千兆网卡和8个模拟/数字输出接口,的确是一款不错的板子。
不过,这款主板上的内在插槽被分为三对,一共六根(这是为了支持双通道DDR-400 内存而设计的),而且主板声称能够支持NUMA (Non-Uniform Memory Access)技术,但是给我们最新的主板中的BIOS中仍没有提供此支持,不过,Asus已经将它作为未来的计划。这样,当同时安装上4根内在时,内存的速度最多可提升到12.8 GB/s。这块主板同样支持AMD最新的PowerNow / Cool and Quiet技术,但我们并没有在BIOS中找到相应选项。
尽管有很多问题很令我们费解,但这块板子的确工作得很好,在这么小的情况下却能够完成更多的功能。<
ASUS NCT-D和上面的K8N-DL几乎一样大小,但是其设计却非常清晰。每个组件似乎都在它们该在位置上,该主板支持两个Socket-604 Xeon处理器,最多支持8GB内丰,通过Intel’s E7525芯片提供PCI Express 显卡插槽连接,当然,它也是ATX架构的。
基于Intel E7525芯片组的ASUS NCT-D
NCT-D 不仅支持PCI Express x16 显卡插槽,还支持下一代的PCI Express x8的 PCIe RAID/网卡,同时它还有2个通过Intel 6300ESB南桥提供的64位/66 MHz PCI-X 插槽,这一点比K8N-DL 更好些。
Intel 6300ESB南桥芯片也是相当强大的,ASUS NCT-D只支持两个SATA RAID连接,而且只支持4个USB 2.0接口,因此它不得不依靠VIA的芯片来提供更多的USB 支持。Asus NCT-D同样支持火线、PCI Express千兆网卡和模拟/数字音频输入输出。
对这款主板我们没有什么意见,只是它所支持的最大内存容量是小了一些,主要是由于采用了Intel的 E7525 芯片组和ECC/Registered DDR2-400内存。<
Intel测试平台
AMD测试平台
测试软件<
从上面的表格看出,两款CPU的能力都差不多。但是Opteron在计算能力方面要强一些,但在多媒体测试时Xeon又要好一些。这些数值似乎和以前测试的结果差不多,因为它们都采用了PCI Exrepss x16的显卡,对其影响不是很大。
尽管K8N-DL nForce4 Pro 2200还不支持NUMA技术,但在内存测试中, Opteron明显占了上风,因此Intel的E7525主板还要努力,Xeon''s DDR2-400内存似乎没有提供足够的数据供处理。
K8N-DL主板不久还将支持NUMA 技术,一旦采用,内存的带宽将有极大的提升。我们在Tyan Thunder K8WE nForce4 Pro 2200平台上测试(此平台支持NUMA 技术),它的内存带宽达到快12 GB/s。因此,NUMA技术一定会给nForce4 PCIe 平台更多在内存方面超越Xeon的可能。<
3D Studio Max 7.0是现在最为流行的渲染程序,它将会消耗非常多的系统处理资源和性能。
Alias|Wavefront的Maya 6.0是较为流行的3D建模软件,我们用它来渲染非常复杂的部件来测试CPU的性能。因为Maya 6.0 做过SMP优化,所以数值越少,表示CPU性能越高。
看了上面的渲染结果,我们的确有些费解。3D Studio Max 7.0,支持SSE指令集,同时支持Intel的超线程技术,因此在Intel的Xeon上运行时要好于Opteron。Opeteron只能够和3.0GHz的Xeon相当,因此我们认为Intel在这个程序上性价比较高。
但在运行Maya 6.0时,Opteron却占了上风,最快的Xeon也只能和“很老”的 Opteron 244相当,当然这样我们真的没有办法说出到底谁快,只能说,当你运行支持多线程程序时,Intel的Xeon一般会比Opteron快。<
Adobe Creative Suite(简称Adobe CS)是世界上最新的图像创作软件,我们应用很多的滤镜效果,因此所花时间较长。当然了,时间越少,性能越高。
Photoshop用户一定会选择Xeon,尽管Photoshop没有沾上Xeon的超线程的光,但是我们“最慢”的Xeons 3.0 GHz还是要比Opterons 2.4 GHz要好。
在Flash MX MPEG导入和编码测试中,Intel的Xeon的性能表现也很卓越。<
微软Windows Media Encoder 9是免费的编码工具,我们用它将一个200MB .mpg 转换成为.wmv 文件,同时我们还选择了DVD的视频质量 和CD的音频 质量。
MP3编码对于CPU是一个极大的考验,对于GPU并没有太多影响 。我们采用了LAME 3.97,该版本的LAME对MMX、3DNow和SSE指令集进行了优化,我们将一个200MB的.wav文件编码成了160 kbps的MP3文件。
Xeon处理器在媒体编码上占了绝对的优势,但Opteron在MP3编码上却胜过了Xeon。<
Doom3是一款对CPU/GPU有着很大消耗的游戏,我们运行了两次,只记下了第二次运行结果。
Valve的Half-Life 2也是比较流行的测试游戏,因为里面人物动作较多,所以可以用于测试CPU。
Xeon处理器在媒体编码上占了绝对的优势,但Opteron在MP3编码上却胜过了Xeon。<
Sciencemark主要用来进行数值或物理计算,这样也可以考验CPU。
从上面的表格来看,Opteron在科学数学和物理计算方面占了很大的优势,比Xeon强了很多。
● 结论
考虑到购买何种工作站平台的确是一个很难的问题。现在Intel的Xeon和AMD的Opteron 都支持64位技术,都支持PCI Express显卡,价格上来讲,两个都差不多。到底买哪一个呢?这的确是一个问题。
在性能方面,我们还是能够分辨出Xeon和Opteron的区别的。Intel的Xeon处理器在图像制作上要好些,这是因为其超线程技术的缘故。而Opteron则在数值计算和游戏上要好一些。从电源消耗上来说,Opteron是一个比较快的处理器,对于程序员和游戏玩家来说,Opteron是一个比较好的选择。 <