都是延迟惹的祸 DDR3内存比DDR2慢3%
如果说现在是DDR2内存的时代,那么这个时代会不会在DDR3到来的时候被PK掉呢?就如DDR2内存干掉DDR一样。
DDR3内存走势
● 为什么要推出DDR3内存
现在随着高端处理器的陆续上市,DDR2 667内存已经渐渐不能满足高端处理器对内存带宽的需求,DDR2 800内存将逐渐替代DDR2 667成为市场的主流。但随着处理器频率的不断提升,即便是DDR2 800内存也会逐渐成为系统性能提升的瓶颈。由于DDR2的数据传输频率发展到800MHz时,其内核工作频率已经达到了200MHz。
因此受到DDR2内存本身设计的限制,其频率不能满足更高带宽的平台的使用,再向上提升较为困难。这就需要采用新的技术来保证速度的可持续性发展,所以早在几年前便被提出的DDR3内存呼之欲出,用以满足更高带宽的需求。
【文章导航】
● DDR3内存全面分析
『DDR3比DDR2:四点优势』
『DDR3与DDR2:六点区别』
『Intel力推DDR3内存』
『AMD处理器能支持DDR3』
『各内存厂商积极量产DDR3』
『内存成本影响DDR3发展』
● 实际测试比较
『DDR3 1066对决DDR2 800/1066』
『理论性能测试:DDR3输』
『实际应用测试:持平』
『实际游戏测试:DDR3慢』
● 写在最后
● DDR3比DDR2好在哪里?1. 8bit预取设计,而DDR2为4bit预取。
相对于DDR2内存的4bit预取机制,DDR3内存模组最大的改进就是采用了8bit预取机制设计,也就是内部同时并发8位数据。在相同Cell频率下,DDR3的数据传输率是DDR2的两倍。这样DRAM内核的频率只有接口频率的1/8,DDR3-800的核心工作频率只有100MHz,当DRAM内核工作频率为200MHz时,接口频率已经达到了1600MHz。而当DDR3内存技术成熟时,相信有实力的内存厂商将推出DDR3-2000甚至2400的频率更高的内存。
内存规格对比表
2. 采用点对点的拓朴架构,以减轻地址/命令与控制总线的负担。
这是为了提高系统性能而进行的重要改动,也是DDR3与DDR2的一个关键区别。在DDR3系统中,一个内存控制器只与一个内存通道打交道,而且这个内存通道只能有一个插槽,因此,内存控制器与DDR3内存模组之间是点对点(Point-to-Point,P2P)的关系(单物理Bank的模组),或者是点对双点(Point-to-two-Point,P22P)的关系(双物理Bank的模组),从而大大地减轻了地址/命令/控制与数据总线的负载。而在内存模组方面,与DDR2的类别相类似,也有标准DIMM(台式PC)、SO-DIMM/Micro-DIMM(笔记本电脑)、FB-DIMM2(服务器)之分,其中第二代FB-DIMM将采用规格更高的AMB2(高级内存缓冲器)。
3. 采用100nm以下的生产工艺,将工作电压从1.8V降至1.5V,在DDR3系统中,对于内存系统工作非常重要的参考电压信号VREF将分为两个信号,即为命令与地址信号服务的VREFCA和为数据总线服务的VREFDQ,这将有效地提高系统数据总线的信噪等级。
4. 增加异步重置(Reset)与ZQ校准功能。重置是DDR3新增的一项重要功能,并为此专门准备了一个引脚。这一引脚将使DDR3的初始化处理变得简单。当Reset命令有效时,DDR3内存将停止所有操作,并切换至最少量活动状态,以节约电力。在Reset期间,DDR3内存将关闭内在的大部分功能,所有数据接收与发送器都将关闭,所有内部的程序装置将复位,DLL(延迟锁相环路)与时钟电路将停止工作,而且不理睬数据总线上的任何动静。这样一来,将使DDR3达到最节省电力的目的。
除了以上几天明显的改进外,DDR3与DDR2相比还有一些不同的地方。
● DDR3与DDR2的不同之处1、逻辑Bank数量
DDR2 SDRAM中有4Bank和8Bank的设计,目的就是为了应对未来大容量芯片的需求。而DDR3很可能将从2Gb容量起步,因此起始的逻辑Bank就是8个,另外还为未来的16个逻辑Bank做好了准备。
2、封装(Packages)
DDR3由于新增了一些功能,所以在引脚方面会有所增加,8bit芯片采用78球FBGA封装,16bit芯片采用96球FBGA封装,而DDR2则有60/68/84球FBGA封装三种规格。并且DDR3必须是绿色封装,不能含有任何有害物质。
3、寻址时序(Timing)
就像DDR2从DDR转变而来后延迟周期数增加一样,DDR3的CL周期也将比DDR2有所提高。DDR2的CL范围一般在2至5之间,而DDR3则在5至11之间,且附加延迟(AL)的设计也有所变化。DDR2时AL的范围是0至4,而DDR3时AL有三种选项,分别是0、CL-1和CL-2。另外,DDR3还新增加了一个时序参数——写入延迟(CWD),这一参数将根据具体的工作频率而定。
4、新增功能——重置(Reset)
重置是DDR3新增的一项重要功能,并为此专门准备了一个引脚。DRAM业界已经很早以前就要求增这一功能,如今终于在DDR3身上实现。这一引脚将使DDR3的初始化处理变得简单。当Reset命令有效时,DDR3内存将停止所有的操作,并切换至最少量活动的状态,以节约电力。在Reset期间,DDR3内存将关闭内在的大部分功能,所以有数据接收与发送器都将关闭。所有内部的程序装置将复位,DLL(延迟锁相环路)与时钟电路将停止工作,而且不理睬数据总线上的任何动静。这样一来,将使DDR3达到最节省电力的目的。
5、根据温度自动自刷新(SRT,Self-Refresh Temperature)
为了保证所保存的数据不丢失,DRAM必须定时进行刷新,DDR3也不例外。不过,为了最大的节省电力,DDR3采用了一种新型的自动自刷新设计(ASR,Automatic Self-Refresh)。当开始ASR之后,将通过一个内置于DRAM芯片的温度传感器来控制刷新的频率,因为刷新频率高的话,消电就大,温度也随之升高。而温度传感器则在保证数据不丢失的情况下,尽量减少刷新频率,降低工作温度。不过DDR3的ASR是可选设计,并不见得市场上的DDR3内存都支持这一功能,因此还有一个附加的功能就是自刷新温度范围(SRT,Self-Refresh Temperature)。通过模式寄存器,可以选择两个温度范围,一个是普通的的温度范围(例如0℃至85℃),另一个是扩展温度范围,比如最高到95℃。对于DRAM内部设定的这两种温度范围,DRAM将以恒定的频率和电流进行刷新操作。
6、局部自刷新(RASR,Partial Array Self-Refresh)
这是DDR3的一个可选项,通过这一功能,DDR3内存芯片可以只刷新部分逻辑Bank,而不是全部刷新,从而最大限度的减少因自刷新产生的电力消耗。这一点与移动型内存(Mobile DRAM)的设计很相似。
从技术角度上看,DDR3内存确实比DDR2改进不少,自身条件已经达到普及的标准。但是如果要更好的发展还要外部支持才行。
● 厂商对DDR3的影响◎ Intel力推DDR3
Intel可谓是产品推广的专家,这次它又将力推最能的P35芯片组。可喜的是这款芯片组支持频率更高、电压更得的DDR3内存标准。从Rembus推广未果,到支持DDR2到支持DDR3,Intel的新款芯片组的发布,带来的都是产业的整体升级,这次也不例外。
Intel将会于五月推出Bearlake系列芯片组,其中P35以及G33芯片组同时内建DDR2及DDR3内存控制器,因此支持DDR3的主板以及DRAM模块将会在今年第二季就会出现在市场上。随着此款芯片组的普及,想不用DDR3都是不可能的。
◎ 支持DDR3的P35主板已经在村里上市
国内已经有支持DDR3的P35上市销售,首先是一款型号为技嘉P35C-DS3R。已经看出技嘉P35C-DS3R主板,它采用了P35芯片组,它搭配的是ICH9R南桥芯片。虽然没有夸张的热管散热器,但是SATA接口下空出的蓝色PCB板,表明了主板支持的规格,让人一眼就能区分开来。
从AMD早期公布出的AMD K8L架构细节来看,AMD下一代K8L架构最主要的特点是采用模块化设计,从三级缓存到内存控制器,K8L核心内的每个组件都采用模块化设计,K8L的组件模块化设计将带来更强壮的性能和优化的连接界面。
AMD K8L处理器的每个核心都具备32KB+32KB的一级缓存,256KB的二级缓存和2MB的三级缓存,并且根据AMD的蓝图显示,三级缓存容量还将进一步提升。AMD表示,一级缓存容量减半是考虑到三级缓存加入的优化做法。
K8L架构采用DICE动态独立核心管理,ACPI层可以单独动态的控制每个核心功耗,在系统不使用该核心的情况下,可以将该核心完全关闭。
基于K8L架构的Opteron处理器将集成4条16-bit HyperTransport-3连接,并且可以转变成8条8-bit HyperTransport连接,以达到8个处理器插座达到最大32个完全互连核心的目的。
未来Intel的坚决推行,加上AMD处理器的支持,DDR3得到快速发展是迟早的事,并且现在各大内存厂商都在抓紧时间推出DDR3内存。
● 各大内存厂商态度
两大处理器厂商巨头的支持,让内存厂商获得了最大的动力,明显加快DDR3内存的量产及上市。据近期消息显示,多家内存厂商的DDR3内存芯片和模组已经通过了英特尔(Intel)的认证。
● 三星:六月底量产DDR3内存芯片
三星电子(Samsung Electronics)宣布,旗下的21款DDR3内存芯片和模组已经通过了英特尔(Intel)的认证,和英特尔的PC芯片组兼容,这是该内存芯片走向商业发布的最后一道程序。
三星计划在6月底之前开始DDR3芯片的量产,07年下半年启动销售业务。在本周举行的微软WinHEC大会上,该公司还展出了8GB的DDR3内存模组。
“三星DDR3内存芯片和模组在英特尔桌面平台上的出色性能预示着DDR3将成为2007年重要的桌面技术。”三星半导体内存市场部副总裁Kevin Lee说。
● 海力士:07年底采用66nm工艺
在5月1日时,海力士半导体(Hynix Semiconductor)就宣布该公司的DDR3内存芯片和模组通过了英特尔验证。海力士计划在今年第三季度量产基于80nm工艺的1Gb DDR3芯片,2007年底制程将过渡到66nm。
“采用小型封装(Small Form-factor Package)海力士1Gb DDR3芯片可以有效减少生产商的成本,使高密度内存模组成为可能。”海力士DRAM开发部门副总裁Kih Joong Sik博士说。
● 尔必达:70nm 1GB DDR3 1600即将投产
5月14日,日系DRAM厂商尔必达(Elpida Memory)的DDR3也通过了英特尔G33平台的认证,芯片型号包括:尔必达同时宣布,70nm制程的1Gb DDR3将很快投入生产,最高速度可达DDR3 1600。
● 美光:08年初2Gb DDR3出击
美国爱达荷州(Idaho)当地时间5月14日,美光(Micron Technology)也宣布其1Gb DDR3内存成功地通过英特尔桌面平台认证。预计到08年年初,美光2Gb DDR3芯片也将投入使用。
“美光在DRAM技术方面的努力使我们走在了高密度内存方案的行业领先地位,很高兴我们的DDR3内存技术在英特尔桌面平台上运行正常。”美光内存群组副总裁Brian Shirley说。
● 金士顿:2007年开发支持Intel的高性能电脑平台的DDR3技术
金士顿近日宣布其DDR3 1066MHz内存模组通过了intel平台认证。而金士顿亚太业务行销副总裁陈思轲表示。“对于正在准备迈向新一代DDR3内存技术的金士顿来说,通过Intel平台认证是一个关键,证明我们已经为PC系统制造商、主机板制产商和抢先一族用户准备好了解决方案。”
ValueRAM DDR3模组
金士顿新推出的HYperX和ValueRAM DDR3 1066MHz模组是尖端科技的产品,首先推出的是512MB和1GB容量单片装,以及1GB和2GB容量的双通道套装。金士顿目前所挑选出的最高达1GB容量的内存产品限量供应,将可支持2007年下半年度推出的下一代电脑平台。
● DDR3内存发展面临的问题
在产业方面,主板芯片组、处理器、内存厂商的支持,使得DDR3内存出现势在必行。但是要快速的发展,甚至取代DDR2内存的地位还有很长一段路要走。
◎ 内存成本问题
任何产品的成本问题都会影响产品的上市时间及流行速度,DDR3的发展同样面对着成本增加的问题。从设计的角度上来看,因为DDR3的起始工作频率是1066MHz,线路间的电磁干扰控制和信号同步问题就直接摆在了面前。这对电路布局的设计能力是很大的挑战,很可能需要在PCB上增加一些额外的控制电路,因此将影响到整体的成本。DDR3 PCB电气性能的提高大概要比DDR2 PCB的价格多出了30%~40%,模块的结构成本也会增加。
而由此可见DDR3的普及还要走漫长的道路。从iSuppli于2006年第三季作出的DDR3对比DDR2出货量与价格预估报告可以看出,2007年DDR3内存模组出货仅占DDR3与DDR2内存模组市场总和不足一成,而DDR3内存模组售价平均比DDR2高出约五成。2008年DDR3内存模组出货将会提升至25%,而售价将会大幅贴近DDR2内存,但预计要直至2009年,市场才可能出现交替。
但同时我们也要看到,受Vista操作系统的影响,今后内存的大容量趋势已经不可阻挡。随着高密度的DDR3内存颗粒的普及应用,对于降低高容量内存成本以及减少封装成本都是大有帮助的,这将会推动DDR3内存的普及速度。
从各个角度来看DDR3的普及趋势已定,也只是时间早晚的问题。就目前市场情况看,已经有DDR3内存开始生产,并且DDR3内存也开始陆续出现,芯片厂商开始出货送测,内存厂商也拿出了各自的试验性产品。
首批上市的DDR3内存价格
泡泡网评测室近期拿到一款DDR3内存,并且做了相应的测试。在上面大家想必都了解DDR3内存的特点,那么如果与现在DDR2内存相比,在实际的性能上会有什么差异呢?下面我们就一同来看看。
◎ 测试平台PCPOP.COM泡泡网内存硬盘评测室 | |
硬件系统配置 | |
处理器 | Intel Core 2 Q6600 |
主板 | 技嘉 P35C-DS3R |
内 存 | 黑金刚 DDR2 金士顿 DDR3 |
显卡 | 8800GTS |
硬 盘 | 希捷Seagate ST3 |
光 驱 | 三星Samsung TS-H352 (DVD-ROM 16x) |
TT Toughpower 750AP, 750W | |
软件系统配置 | |
操作系统 | Windows XP Professional SP2 |
DirectX | 9.0c |
DDR3信息
DDR3 1066在默认情况下,内存时序为7-7-7-20。那么其性能与DDR2相比会有怎样的区别呢?接下来一同进入测试阶段。
● 理论性能测试
◎ SuperPi测试
测试系统的整数运算性能,在测试CPU的时候我们经常用到。除了用来测试CPU外,它也可以从一方面反应内存的性能。
在其它硬件环境不变的情况下,内存频率的提升,对于此项目成绩的提升意义不大。
● Sisoftware Sandra Pro Home 2007
SiSoftware Sandra(the System Analyser Diagnostic and Reporting Assistant)是现在公认权威的系统分析评测工具,1995年诞生,到今天已走过了10余年的发展历程,拥有超过30种以上的基准测试项目。在测试项目中SISoftware Sandra 2007加入了最新的iSEE4多媒体指令集的支持。
由于专门针对内存项目带宽性能的测试,对内存频率的变化特别敏感,频率的提升对于得分差异是很明显的。从DDR 2 800提升到DDR 2 1066尤为明显,最大提升为6%。而DDR3 1066比DDR2 1066低了3%。
● PC Mark05 Memory部分
虽然同为针对内存性能的测试,不过这只是PC Mark05这个整体项目测试中的一个子项目。就得分来看,内存性能提升不如在Sisoftware中那么明显,DDR3还是有些不足。
● EVEREST Ultimate Edition
专项测试软件,对内存性能有比较详细的测试。这里我们取的是内存的读性能测试和写性能测试。
仍然是内存专项性能测试,在内存读取上得分差别比较明显。很显然,在这个平台,内存读取性能随内存频率的提升变化明显,最高达11.4%。而DDR2 1066比DDR3 1066快了5.5%。而内存读取上得分差别不是明显。
● WinRAR 3.60 Multi-thread Ver-Data Compression
WinRAR作为一款目前非常流行的压缩软件,我们使用了它内置的测试功能。在这项测试中处理器高带宽显得比较重要。
可以看出,内存频率的提升,对WinRAR的压缩速率由一定的影响,提升到DDR2 1066后,速率的提升达到7%。DDR3 1066以微弱优势胜出。而在实际应用中,这样的变化对最终时间的缩短幅度很小。
● Windows Media Encoder 9.0-WMV-HDTV Encoding
这是微软官方的WMV9格式视频编码器。我们采用了一段1080P的HDTV视频,用WindowsMediaEncoder 9.0将其重新编码成1920x1080、8393Kbps的WMV-HDTV视频。
这个项目测试压缩视频的速率,测试结果上,DDR2 800和DDR2 1066没有区别,DDR3 1066与其它两个内存规格相比,只提升1分可以说没有提高,可以看作为测试误差。
● DOOM 3
推出已有数年之久的OpenGL游戏大作,通常用来测试系统的OpenGL游戏性能。为尽量减少测试误差和偶然性,测试时我们运行2到3次,取最大帧数值。
内存频率变化对游戏的帧数还是有一定的影响,但不大,DDR2 1066与DDR3 1066相比要高出3.6帧。
● Half-Life 2
D3D引擎游戏大作,通常我们用来测试整个系统的D3D游戏性能。同样,这个游戏最为敏感的还是显卡的性能。为尽量减少测试误差和偶然性,测试时我们运行2次,取平均帧数值。
DDR2 1066比DDR2 1066高出4帧,差距并不明显。
● Far Cry
Far Cry采用了稍微旧一点的图形引擎,但它仍然能够在屏幕各处产生数量惊人的多边形和渲染。CryEngine的代码基础已经较过去两年有了大规模的修正,以充分利用所有最新的GFX和CPU特性。
从Far Cry测试记过看,频率的提升成绩有很大的变化,DDR2 1066比800快了帧,而DDR3 1066比DDR2 1066慢了3%左右。
测试总结:DDR2和DDR3在P35平台上的表现并没有很显著的差别,总的来说DDR3目前还是没有DDR2快,是不是都是高延迟影响呢?
● DDR3比DDR2内存慢,是受到高延迟的影响?
Samsung半导体内存产品规划事业群高级工程师Kim Gyou Joong曾经表示:“不少消费者却被CAS延迟值数值所误导,认为DDR3内存在延迟值表现将不及DDR2,但据此说法完全是错误、无知的观念。事实上,JEDEC定下的DDR2-533的CL 4-4-4、DDR2-667的CL 5-5-5及DDR2-800的 CL6-6-6,其内存延迟值均为15ns。”
Kim Gyou Joong进一步指出,CAS Latency是指内存需要经过多少个周期,才能开始读写数据,但要计算整个内存模块的延迟值,还需要把内存颗粒运作频率计算在内。
现时,DDR3-1066、DDR3-1333及DDR3-1600的CL值分别为7-7-7、8-8-8及9-9-9,把内存颗粒运作频率计算在内,其内存模块的延迟值应为13.125、12.ns及11.25ns,相比DDR2内存模块改善约~25%(按照JEDEC官方规划),因此消费者误将CAS数值当作是内存模块的延迟值是不正确的观念。
按照按照JEDEC官方规划来看,DDR3内存延迟比DDR2要改善了,可是从测试大家都可以看出在相同平台下,相同频率下,由于DDR3延迟过高的问题使得性能比DDR2慢。可以说DDR3正走以前DDR2的老路,在DDR2刚出来的时候,DDR2延时要比DDR高,DDR2 667以前性能都没有DDR 400高,但是凭借频率的逐渐提升,渐渐超过DDR内存。
● DDR3何时才能成为主流?
要成为主流,DDR3内存想要摆脱比DDR2性能低的命运,只有出更高的频率内存才能挽回现在的劣势。
据内存大厂Micron指出,DDR3内存模块初期市场需求较低、产能相对于较少,因此售价相比同容量的DDR2模块出高50% ~ 80%不等(视乎速度),预期DDR3售价须在2008年底才能回落至与DDR2模块相约的水平;而DDR3模块需求则估计约至2009年下半年,才会一举跃过DDR2模块成为主流,2010年则可望拿下整体市场6成份额。
此外,Micron亦预期DDR3模块寿命将至2014年,次世代内存DDR4将于2011年面世,再度上演内存世代交替戏码。由于DDR2技术已十分成熟,现时各大厂商所生产的内存颗粒CAS数值,已较JEDEC规格来得更低,同样地,DDR3颗粒生产技术亦在微调中,预期在不久的将来,各大内存厂商将可推出较JEDEC规格更强的DDR3产品。<