英特尔45nm新旗舰四核QX9650解析测试
首批45nm Penryn分为三个系列:至尊四核心的Core 2 Extreme QX9050、主流四核心的Core 2 Quad Q9000、双核心的Core 2 Duo E8000。
而2008年1月,“Core 2 Quad Q9550、Q9450、Q9300”三款主流四核心跟进,主频2.83GHz、2.66GHz和2.50GHz,二级缓存前两款2×6MB、后一款2×3MB(注意编号第三位5和0的不同),热设计功耗均为95W。另外,同月发布的还有“Core 2 Duo E8500、E8400、E8300、E8200”四款主流双核心面世,主频3.16GHz、3.00GHz、2.83GHz和2.66GHz,二级缓存均为2×3MB,热设计功耗都是65W。
这些产品都采用了45nm工艺, 这使得Intel每年推出具增强微架构或全新微架构处理器产品的承诺顺利兑现,其不仅仅是单纯制程提升,更重要的是,微架构设计经全力改良后,性能更较当年Intel P4 Willamette提升至Northwood核心,有过之而无不及,同时使功耗更低。下面我们就来全面了解45nm的Penryn会带给我们怎样的惊喜。
● 45nm出现是晶体管诞生60岁最好的礼物自1947年晶体管发明迄今,科技进步的速度惊人,催生了功能更为先进强大,又能兼顾成本效益和耗电量的产品。虽然科技进展迅速,但晶体管产生的废热和漏电,仍是缩小设计及延续摩尔定律 (Moore''s Law) 的最大障碍,因此业界必须以新材料取代过去40年来制作晶体管的材料。
翻查晶体管历史,2007年正好是晶体管诞生60周年,首颗晶体管出现于1947年12月16日,贝尔实验室 (Bell Labs)的William Shockley、John Bardeen和Walter Brattain成功制作第一个晶体管,改变了人类的历史。那么,在这60周年的今天,Intel公司首次推出45nm工艺处理器,作为晶体管60周岁最好的礼物。
摩尔定律之父——戈登摩尔
这其中我们要感谢一个人,那就是Intel的创始人戈登摩尔(Gordon Moore),通过长期的对比,研究后发现:CPU中的部件(我们现在所说的晶体管)在不断增加,其价格也在不断下降。“随着单位成本的降低以及单个集成电路集成的晶体管数量的增加;到1975年,从经济学来分析,单个集成电路应该集成65000个晶体管。”Intel此后几年的发展都被摩尔提前算在了纸上,使人们大为惊奇,“摩尔定律”也名声大振。为了让人们更直观地了解摩尔定律,摩尔及其同事总结出一句极为精练的公式 “集成电路所包含的晶体管每18个月就会翻一番”。
之后的芯片内集成的晶体管数量也证实了他的这句话,并且发展速度还在加快。从芯片制造工艺来看,在1965年推出的10微米(μm)处理器后,经历了6微米、3微米、1微米、0.5微米、0.35微米、0.25微米、0.18微米、0.13微米、0.09微米、0.065微米,而0.045微米的制造工艺将是目前CPU的最高工艺。以下我们就来简单的见证一下Intel CPU工艺制程一路走来的风雨历程。
● 90nm的出现是CPU工艺一个质的飞跃奇怪的是每当新一代CPU问世时,人们都会热衷于讨论它采用了多少微米或纳米制程。的确,每一次制程(或制造工艺)的进步都会对芯片制造业产生举足轻重的影响,并演绎一个个经典的传奇。
Pentium让CPU工艺从微米时代跨入了纳米
按照摩尔老先生在文章中提出,芯片上集成的晶体管数量大约每18个月就将翻一番。从1971年Intel发布第一款处理器4004时,所采用的工艺是10微米,芯片内仅包含着2300多个晶体管,主频也非常的低。直到1995年奔腾处理器发布后,CPU的制造工艺才首次采用纳米工艺表示,第一代奔腾处理器采用的是800nm工艺,同时也标志着CPU制造工艺从微米时代跨入了纳米时代。奔腾处理器芯片内的晶体管数量为310万个,主频也有所提升,此时CPU的速度也有大幅的提升。
奔腾4E将CPU工艺带入了90nm时代
之后CPU工艺就开始飞速的发展,芯片内集成的集体管数量不断的翻倍。到2004年。CPU制作工艺发生了质的飞跃,推出了核心为Prescott的Pentium 4E处理器,在此次推出的Pentium 4E处理器中,一个显著的特点就工艺再次改进为90nm,集成了1亿个晶体管。其中首批90nm处理器型号为3.40E GHz、3.20E GHz、3.00E GHz、2.80E GHz P4(“E”后缀商标)支持超线程技术,800MHz前端总线和1MB二级缓存; 但此次工艺的提升,没有使得功耗降低,因为主频的提升,使得Prescott处理器功耗开始走高。
此时,Intel推出90nm处理器后,并且在最短的时间内宣布全面进入90nm时代。而AMD在工艺制程方面比英特尔显然慢了一大步,因此,在2004年,AMD和英特尔在制造工艺上的距离已经拉开。
● 工艺再提升 势不可挡的65nm制作工艺但随着芯片中晶体管数量增加,原本仅数个原子层厚的二氧化硅绝缘层会变得更薄进而导致泄漏更多电流,随后泄漏的电流又增加了芯片额外的功耗。此时,由于受“泄漏电流”的影响,导致后续产品频率无法提升,功耗高居不下。为了从当前的窘境中逃出来,Intel迅速部署65nm产品计划。迅速在2005年推出了Pentium Extreme Edition 955,标志着Intel进入一个新的阶段,65nm时代的来临。
Pentium Extreme Edition 955处理器基于65nm工艺,是整个Pentium D 900系列双核心产品中最高端的一款。
Pentium Extreme Edition 955
尽管新品均采用65nm工艺制造,但其TDP(Thermal Design Power)依然为130W。工作电压需要从1.2v到1.375V,机箱内部温度不能够超过68.6度。不过,Preslers无论在制造工艺还是架构变革方面都有了非常大改进,包括独立的双L2 Cache设计,以及制造工艺较90nm产品有了非常大的改观。
虽然这一代产品晶体管材质较上一代并没有太大变化,但是在漏电方面的改进还是非常显著的,起初在90nm工艺下采用的应变硅技术,在新一代65nm处理器上得到进一步发展,虽然绝缘层还是停留在1.2nm,但是晶体管扭曲提升了15%,这样的结果就是漏电减小了4分之一,这样也使的晶体管的响应速度在没有功耗提升的情况下提升了近30%,整体表现还是不错的。
● 新的工艺起点—45nm处理器登场目前Intel两年一更换工艺,在65nm工艺处理器全面上市后,Intel再次提升了CPU的制作工艺,将在本月16号推出其首款45nm Penryn处理器。全新45nm Penryn家族共有7名成员,包括双核心桌面处理器Wolfdate、四核心桌面处理器Yorkfield、双核心行动处理器 Penryn、双核心Xeon DP处理器 Wolfdate DP、四核心 Xeon DP处理器Harpertown、双核心 Xeon MP处理器Dunnington DC及四核心Xeon MP处理器Dunnington QC。
Intel首款45nm Penryn处理器QX9650
据了解,Penryn双核心版本内建 4.1 亿个晶体管,四核心则有8.2亿个晶体管,微架构经强化后,在相同频率下较上代Core产品拥有更高性能,同时L 2 Cache容量提升50%,明显提高数据读取执行的速率。此外,亦加入47条全新Intel SSE4指令,提高媒体性能和实现高性能运算应用。
CPU-Z下的QX9650
泡泡网近期有幸拿到首批Intel 45nm处理器Penryn QX9650, 其核心频率3GHz,12MB二级缓存,FSB 1333MHz,是的绝对旗舰。接下来我们将会与65nmQX6850进行对比测试。
◎ 测试平台
硬件系统配置 | |
处理器 | Intel QX9650 Intel QX6850 |
ASUS P5E3 DELUXE | |
希捷 7200.10 160G 16M | |
内存 | 芝奇 1GB DDR3 1600×2 |
Nvidia 8800 ULTRA 核心: 8800ULTRA(612MHz) 流处理器:1500MHz 显存: 768 MB GDDR3(1080MHz) | |
电源 | 海韵 S12 600W |
散热器 | Cooler Master |
软件系统配置 | |
操作系统 | Windows |
显卡驱动 | 163.71_forceware_winxp_32bit_english_whql.exe |
此次测试我们将采用技术与实际结合的方式,希望读者们能更直观的了解QX9650的特性与性能。
● 45nm采用了High-K金属栅极技术
此前我们对CPU工艺进程也有简短的回顾,细心的朋友可能会发现,从90nm工艺开始出现了严重的漏电问题,阻碍了芯片和个人计算机的设计、大小、耗电量、噪声与成本开发。因此,在新一代45nm Penryn处理器采用全新材料制作的45nm晶体管绝缘层和开关闸极,减低晶体管漏电情况。
其实晶体管就是一种简单的开关装置,可处理电子数据中的0、1组合。处理器就是含有数百万此类通过铜线以特定方式连接在一起的晶体管。而晶体管内部是由源极、漏极、栅电极、栅介质、及硅底层通道。源极是指晶体管中电流产生的部分,它包含涂层硅(doped Si),漏极是指晶体管中电流流向的部分,这部分与源极一样,都参杂了一些杂质以降低电阻。不过晶体管是绝对对称的,则电流可以从源极流向漏极,也可以从漏极流向源极。栅极电极就是晶体管顶端的区域,其电流的状态决定晶体管是打开还是闭合,传统上栅的制作材料是多晶硅或原子随意排列且不形成网格状结构的硅。栅极介质是位于栅极电极以及沟槽之间一层薄层,目前的数字芯片中晶体管栅介质是由二氧化硅组成,而二氧化硅是绝缘体材料,它的作用是隔绝来自栅极电极的泄漏电流,但如果这个栅介质层太薄其泄漏电流的电量就越大。
为了降低漏电问题,同时还要提高其性能。Intel采用了High-k的新材料制作晶体管闸极电介质,而且晶体管闸极的电极也搭配了全新的金属材料。这样,经过测试显示,不仅晶体管的性能提升了,同时漏电现象与之前相比也较少了5倍。据了解,制作闸极电介质的材料主要是二氧化硅,因为它具备了很好的易制性,能够减少厚度保持晶体管的整体性能。
由于High-k闸极电介质和现有硅闸极并不兼容,Intel全新45nm晶体管设计也必须开发新金属闸极材料,目前新金属的细节仍未有消息透露,Intel现阶段尚未说明其金属材料的组合。另与上一代技术相较,Intel 45nm制程令晶体管密度提升近2倍,得以增加处理器的晶体管总数或缩小处理器体积,令产品较对手更具竞争力,此外,晶体管开关动作所需电力更低,耗电量减少近30%,内部连接线采用铜线搭配low-k电介质,顺利提升效能并降低耗电量,开关动作速度约加快20%。
值得注意的是,Intel成功令新一代45nm制程产品的漏电情况降低逾5倍,其中晶体管闸极氧化物漏电量更降低超过10倍,相较上代65nm制程产品,在同一功耗表现下,频率下可提升约20%,或是在同一频率下功耗更低,电池续航力也明显大幅提升。
从上面的介绍我们可以看出,工艺的改进可以让处理器功耗更低,发热量也会减低,那么为了验证这一观点,我们就是用45nm的QX9650与65nm QX6850进行功耗对比。这次测试功耗我们选用了具备30年研发经验的台湾电源品牌,Seasonic(海韵)出品的电源测试仪:Power Angel。功耗测试方法非常简单,我们对整套平台的功耗进行统计。测试仪直接通过实时监控输入电源的电压和电流计算出当前的功率。这其中的功率包括,CPU、主板、内存、硬盘、显卡、电源以及线路损耗在内的主机总功率。显示器功率并不计算在内。
海韵Seasonic出品的Power Angel电源测试仪
◎ 空闲时功耗对比
提示:以下成绩左边为QX9650、右边为QX6850
电脑空闲时,在整个平台没有换的情况下,两颗处理器功率相差比较大,QX9650要比QX6850低了18W。
◎ 负载时功耗对比
从负载时功耗对比看出,45nm的QX9650表现非常不错,比65nm的QX6850功耗低了68W,就算是对于个人来说能节省不少电费,减少不必要的能源消耗。不仅如此,功耗低证明其发热量就小,那么风扇转速也可以相对的调慢,使得工作的时候更安静。因此,45nm的处理器在降低功耗的消耗确实有明显的改进。
● 新技术让Penryn优势更明显
除了采用更先进的45奈米制程外,Penryn 亦基于Intel Core微架构设计作出多项改良,称为Enhanced Intel Core Microarchitecture(加强型 Core微架构),同时采用了新的SSE4指令集,并加入了:
Fast Radix-16 Divider(快速 Radix-16 除法器)
Super Shuffle Engine(超级洗牌引擎)
Split Load Cache Enhancement(增强型缓存拆分负载)
Improved Store Forwarding(存储转发)
Faster OS Primitive Support(高速操作系统同步原始支持)
Virtualization Performance Improvements (增强的Intel 虚拟化技术)
Deep Power Down Technology(深度节能技术)
Enhanced Dynamic Acceleration Technology(增强型动态加速技术)
据了解,SSE4将分为4.1版本及4.2版本,4.1版本将会首次出现于Penryn处理器中,共新增47条指令,主要针对向量绘图运算、3D游戏加速、视像编码加速及协同处理加速动作,包括:
Penryn SSE4 Instruction summary | ||
Instruction Category | Instructions | Benefits |
Packed DWORD Multiplies | PMULLD, PMULDQ | 提升编译器矢量运算效能 |
Floating Point Dot Product | DPPS, DPPD | 3D立体制作及游戏,支持CG及HLSL等语言 |
Multi-packed sum of absolute diffs& min pos | MPSADBW, PHMINPOSUW | 视频编码处理 |
Streaming Load | MOVNTDQA | 视频编码处理、绘图及GPU数据分享 |
Floating Point Round | ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD | 视频编码处理 、绘图、影音处理、2D/3D应用、多媒体及游戏等 |
Packed Blending | BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDDW | 编译器矢量运算及影音处理、多媒体、游戏等应用 |
Packed Integer Min and Max | PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINDS, PMAXSD | |
Register Insertion/Extraction | INSERTPS, PINSRB, PINSRD, PINSRQ, EXTRACTPS, PEXTRB, PEXTRD, PEXTRW, PEXTRQ | |
Packed Format Conversion | PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ | |
Packed Test & Set | PTEST | |
Packed Compare for Equal | PCMPEQQ | |
Pack DWORD to Unsigned WORD | PACKUSDW |
而Intel资深工程师兼Penryn微架构主管Stephen Fischer表示,与上代处理器产品相比,Penryn处理器在绘图效能约超过15%、视讯编码平均可提高20%、3D内容制作可提高逾30%,3D游戏效能更可高达40%,视乎软件设计而定。
● 技术测试结合:浮点和整数的除法运算速度增加◎ Enhanced Core MA :Fast Radix-16 Divider
Penryn处理器除沿袭Core微架构的优点外,并进一步改良除法器的设计,在科学计算、三维坐标转换和其它数学运算密集型功能中,其带来约2倍的除法器速度,所包含的新一代的快速除法技术称为Radix-16,可加速浮点和整数的除法运算速度。
其实Intel在Core微架构中支持每个周期可处理多达4个指令(对比旧有处理器最多只能同时处理3个指令),且重新采用较高效率的14层Pipeline Stages,为提升分支预测的能力及准确性,Branch Predictor的Bandwitdh提升至20Byte (K8、Banias 为16B,Netburst为4B),令指令执行效率大大提高。
此外,Core微架构更加入Macro-Fusion技术,可把部份指令组合成单一Micro-Op 指令,令特定情况下每个周期可执行5个指令,更保留Micro-op Fusion技术,把相同的Macro-ops混合成单一个Micro-ops 透过Out-of-order逻辑可减少10% 的Micro-op指令执行数,除提升核心的执行效率,同时也保持高能源效益。
据了解,基数为4的算法会在每次迭代运算中计算其2位的商值,当提高到基数为16的算法时,则允许在每次迭代中计算4位的商值,进而使延迟缩减一半。
◎ 实测SiSoftware Processor Arithmetic
从实际的测试中看出,Dhrystone和Whetstone是Processor(s) Arithmetic测试项目中的整数以及浮点运算,用最终成绩来评定一款处理器性能。新的Penryn QX9650与QX6850相比,在整数以及浮点运算上QX9650分别提高了2.4%与12.6%。
● 技术测试结合:音效、视讯编码效率得到提高
◎ Penryn :SSE4指令集强化视讯编码效率
SSE4指令集进一步强讯编码效果,例如可同时处理8个4-byte宽度的SAD(Sums of Absolute Differences)运算,常用于新一代高清影像编码如VC.1及H.264等规格中,令视频编码速度进一步提升。
◎ Super Shuffle Engine
Intel在Core微架构中加入128Bit-SIMD interger arithmetic及128bit SIMD双倍精准度Floating-Point Operations单元。旧有的处理器执行128Bit的SSE、SSE2及SSE3指令时,需要把指令分拆为2个64Bit指令,在2个频率周期完成,但Core微架构则只需要1个频率周期便能完成,执行效率提升达1倍,现时SSE指令集已普遍使用于主流软件中,包括绘图、影像、音效、加密、数学运算等用途,单周期128Bit处理器能力利用频率以外的方法提升效能。
另一方面,Penryn处理器也有显著改良,其加入全新Super Shuffle Engine,令SSE 指令运算更具效率,以往处理Unpacking、Packing、Align Concatenated Sources、Wide Shifts、Insertion及Horizontal Arithmetic Functions Setup等128Bit宽度的字节、字及Dword SSE数据时,均无法在单一周期内完成,但Super Shuffle Engine设计除可让这些不同性质的128Bit SSE指令,在1个周期内便可完成,减低延迟及吞吐量外,更不用在软件端中作出改良即可实现。
◎ 音频、视频编码测试
以上两款测试是针对音频、视频的转码速度测试,在固定的文件下进行转码,耗时多少,用的时间越短证明性能越好。因为QX9650新增了多种技术,因此成绩比QX6850高出不少。
据了解,SSE4将分为4.1版本及4.2版本,4.1版本将会首次出现于Penryn处理器中,共新增47条指令,主要针对向量绘图运算、3D游戏加速、视像编码加速及协同处理加速动作,包括:
Penryn SSE4 Instruction summary | ||
Instruction Category | Instructions | Benefits |
Packed DWORD Multiplies | PMULLD, PMULDQ | 提升编译器矢量运算效能 |
Floating Point Dot Product | DPPS, DPPD | 3D立体制作及游戏,支持CG及HLSL等语言 |
Multi-packed sum of absolute diffs& min pos | MPSADBW, PHMINPOSUW | 视频编码处理 |
Streaming Load | MOVNTDQA | 视频编码处理、绘图及GPU数据分享 |
Floating Point Round | ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD | 视频编码处理 、绘图、影音处理、2D/3D应用、多媒体及游戏等 |
Packed Blending | BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDDW | 编译器矢量运算及影音处理、多媒体、游戏等应用 |
Packed Integer Min and Max | PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINDS, PMAXSD | |
Register Insertion/Extraction | INSERTPS, PINSRB, PINSRD, PINSRQ, EXTRACTPS, PEXTRB, PEXTRD, PEXTRW, PEXTRQ | |
Packed Format Conversion | PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ | |
Packed Test & Set | PTEST | |
Packed Compare for Equal | PCMPEQQ | |
Pack DWORD to Unsigned WORD | PACKUSDW |
● SSE4 :向量、浮点运算专门化 加入串流式负载指令
在应用SSE4指令集后,Penryn增加了2个不同的32Bit向量整数乘法运算支持,引入了8 位无符号 (Unsigned)最小值及最大值运算,以及16Bit 及32Bit 有符号 (Signed) 及无符号运算,并有效地改善编译器效率及提高向量化整数及单精度代码的运算能力。同时,SSE4 改良插入、提取、寻找、离散、跨步负载及存储等动作,令向量运算进一步专门化。
SSE4加入了6条浮点型点积运算指令,支持单精度、双精度浮点运算及浮点产生操作,且IEEE 754指令 (Nearest, -Inf, +Inf, and Truncate) 可立即转换其路径模式,大大减少延误,这些改变将对游戏及 3D 内容制作应用有重要意义。
此外,SSE4加入串流式负载指令,可提高以图形帧缓冲区的读取数据频宽,理论上可获取完整的快取缓存行,即每次读取64Bit而非8Bit,并可保持在临时缓冲区内,让指令最多可带来8倍的读取频宽效能提升,对于视讯处理、成像以及图形处理器与中央处理器之间的共享数据应用,有着明显的效能提升。
◎ 实测SiSoftware Processor Multi-Media
从测试结果看,多媒体运算能力上QX9650只比QX6850高出一点,优势不是很明显,普通消费者在使用时并不能体会出区别,只能使用专门软件才能区别开。
◎ Cinebench图形渲染测试
CINEBENCH RELEASE 10主要考察处理器在进行图形渲染任务时的性能,并且支持多线程的软件。此次测试中QX9650比QX6850提高9%,显示出新款45nm处理器拥有超强的图像处理器能力
◎ CPUMark99测试
CPUMark 99是最原始的CPU性能测试软件,对主频、外频和二级缓存容量都比较敏感。而在这个传统的测试项目中,QX9650以8分的优势胜出。
◎ SuperPI 测试
著名的SuperPI测试,主要考察处理器浮点运算性能,我们选择了常见的1M位运算模式。QX9650由于在技术与工艺上比QX6850先进,在跑PI上要快2秒左右。◎ WinRAR 3.60文件压缩性能测试
这次使用目前最流行的WinRAR压缩软件来进行数据压缩测试,其3.60版本之后加入了对多线程的支持。新款QX9650由于在运算能力上的出色表现,使其在数据压缩测试中高出QX6850 14%的压缩能力。
◎ EVEREST Ultimate Edition
测试小结:总的来说,在实际应用测试中,各个项目的成绩变化还是蛮大的。特别是数据压缩与内存读写速度测试上,QX9650都以较大的优势胜出。
◎ 3D Mark03:
3DMark03引入了画质过滤测试,并且提供了纹理过滤的选项,提供了并非默认的FSAA抗锯齿选项。3DMark03受到处理器、内存和主板的影响更小,并且专注于显示卡着色能力的测试,显示卡的效能高低将成为3DMark03得分的主要瓶颈。
◎ 3D Mark05:
Dmark05一共使用三个游戏进行测试,Game1测试的舞台是一个未来太空基地,主体动态光影采用了高达2048x2048的纹理,因此对于显卡的像素填充率以及显存带宽有着很高的要求。
◎ 3D Mark06:
测试小结:游戏理论性测试部分,QX9650与QX6850在成绩总分上并没有太大的区别,因为他们直接构架都相同,同时频率之类的区别也不大,但是由于QX9650加入新的指令集,因此在CPU运算成绩上要高出一些。
◎ Crytek
◎ Company of Heros
◎ COJ
◎ Half-Life2——EPISOOE TWO
◎ Farcry
游戏测试总结:实际游戏测试中,我们都把画质开到最高下进行测试。从一些DX10的游戏测试上看,这两款处理器的差距并不大,只有1至2帧的差距。而在一些DX9游戏测试中,差距就很明显,比如Half-Life2—EPISOOE TWO QX9650比QX6850提升8%。
◎ 45nm新工艺让处理器功耗降得更低
目前从整个DIY行业来说,大家都在提倡节能环保的原则。那么,对于电脑中的核心——CPU来说当然也不例外,低功耗的CPU将成为未来处理器市场的主流,因此采用最新工艺,最新架构和最新的节能技术的CPU,都是厂商追求的目标,因为只有这些新技术可以确保高性能低能耗技术的实现。而Intel 45nm处理器的出现正是顺应了追求低功耗时代的产品。
从前面的功耗测试中我们就有深刻的体会,在平台相同、处理器满负载的情况下,45nm处理器比65nm处理器的平台低了68W,这个数值是相当可观的,如果是普通消费者使用那么一天就能节省1.6度电(如果是多人使用,那么节省的能源就相当可观了)。
◎ 台式机:45nm的QX9650打败市场最高性能产品
PCPOP.COM泡泡网CPU评测室 测试时间: | ||||
测试项目 | Intel Core 2 QX 9650 | Intel Core 2 QX 6850 | 提升幅度 | |
8800Ultra 1024x768 | ||||
理论性测试 | ||||
Processor Arithmetic | Dhrstone | 56013 | 54626 | 2.4% |
Whetstone | 41276 | 36042 | 12.6% | |
Processor Multi-Media | Integer | 332689 | 332229 | 将近0% |
Fioating | 173356 | 173153 | 将近0% | |
Memory Bandwidth | Int AUU | 7264 | 6896 | 5% |
Float FPU | 7118 | 6762 | 5% | |
PCMark | 9652 | 9632 | 将近0% | |
3D理论性测试 | ||||
3DMark | Overall | 43850 | 42835 | 2.3% |
CPU项 | 2345 | 2201 | 6% | |
3DMark | Overall | 18342 | 18192 | 将近0% |
CPU项 | 20873 | 19895 | 4.6% | |
3DMark | Overall | 13548 | 13533 | 将近0% |
4428 | 4420 | 将近0% | ||
实际应用测试 | ||||
SuperPI | 15.37 | 17.67 | 13% | |
WinRAR 3.60文件压缩性能 | 1937 | 1654 | 14.6% | |
Cinebench图形渲染 | 11759 | 10676 | 9.2% | |
视频编码测试 | 44秒 | 47秒 | 6.3% | |
音频编码测试 | 单线程 | 171秒 | 183秒 | 6.5% |
多线程 | 108秒 | 117秒 | 7.6% | |
EVEREST Ultimate | 内存写入速度 | 8578 | 8388 | 2.2% |
内存读取速度 | 7103 | 6094 | 14.2% | |
实际游戏测试 | ||||
Crytek | 26.5 | 25.13 | 5.1% | |
Company of Heros DX10 | 57.6 | 56.2 | 2.4% | |
Half-Life2 EPISOOE TWO | 185.4 | 169.29 | 8.6% | |
COJ | 31 | 30.9 | 将近0% | |
Farcry | 182.8 | 179.86 | 1.6% |
市场上,规格、性能最高的就属QX6850,但是45nm的QX9650的出现将会替代其性能第一的霸主地位。从测试结果看,不管是功耗、处理器运算性能、游戏测试等方面QX9650都要高于65nm的QX6850。可以说Intel Penryn处理器的出现将继续稳坐最高性能处理器的宝座。
◎ 笔记本:性能更高,功耗更低
Penryn移动版还会加入两项新颖的省电技术——C6 State和EDAT。C6 State可让笔记本处理器的功耗在空闲状态下降到非常低的水平,核心电压也会根据情况大大降低,同时缓存彻底转移其中的数据并完全关闭。从这种状态中恢复需要一点点时间,而且会对性能产生一定的影响,但对笔记本用户来说,电池续航时间的重要性显然更大。EDAT可以单独提高某个处理核心的频率,并将其他暂时不使用的核心关闭,以适应单线程任务或者只能利用一个核心的多线程任务。
可以说Intel 45nm处理器面对着AMD全新K10微架构来袭,单纯以微架构而论或许在效能表现略有不及,但由于拥有更为先进制程、核心频率及成本等优势,整体而言,AMD K10未必能占得上风,还是让我们共同把目光聚焦在第四季度,期待这场具有划时代意义的大战。<