泡泡网主板频道 PCPOP首页      /      主板     /      评测    /    正文

破解Intel倍频魔咒!P67超2600到4.4G

    泡泡网主板频道3月19日 Sandybridge(SNB)是Intel 2011年的一次重大架构更新,官方称为“2011年第二代Intel Core处理器家族”,主要针对性能级和主流市场。这次新产品的发布,包含桌面及移动版本共29款处理器、10款芯片组,相关产品超过500款。数量和规模超越了Intel过去任何一次新产品发布。

i72600不带K上4.4G!SNB Turbo巧超频

    除了处理器,配套的芯片组、主板、散热器等也会一并更新,其中芯片组是6系列,桌面上主要有P67、H67、H61等型号,原生支持最多两个SATA 6Gbps接口,但没有原生USB 3.0,仍需要依赖第三方控制器,另外还有PCI-E 2.0 5GT/s高速总线。

i72600不带K上4.4G!SNB Turbo巧超频

6系列主板的插座将改为LGA1155,不兼容当前的LGA1156

i72600不带K上4.4G!SNB Turbo巧超频

    原装散热器也随着处理器功耗的降低而瘦身,特别是45W低功耗版本会搭配半高式矮版散热器。

    从高级层面角度看,SNB架构只是一次进化,但是如果看看Nehalem/ Westmere以来晶体管变化的规模,绝对是一次革命。

SandyBridge

    老的Core 2引入了一种叫作循环流检测器(LSD)的逻辑块,检测到CPU执行软件循环的时候就会关闭分支预测器、预取/解码引擎,然后通过自身缓存的微指令(micro-ops)供给执行单元。这种做法通过在循环执行的时候关闭前端节省了功耗,并改进了性能。

    而SNB里又增加了一个微指令缓存(直接映射),用于在指令解码时临时存放。指令只要在解码就会放入缓存,预取硬件获得一个新指令的时候,会首先检查它是否存在于微指令缓存中,如是则由缓存为其余的管线服务,前端随之关闭。解码硬件是x86管线里非常复杂的部分,关闭它能够节约大量的功耗。

    这个缓存是直接映射的,能存储大约1.5K微指令,相当于6KB指令缓存。它位于一级指令缓存内,大多数程序的命中率都能达到80%左右,而且带宽也相比一级指令缓存更高、更稳定。当然真正的一级指令和数据缓存并没有变,仍然都是32KB,合计64KB。

    这看起来有点儿像Pentium 4的追踪缓存,但最大的不同是它并不缓存追踪,而是一个指令缓存,存储的是微指令,而非x86指令(macro-ops)。

    与此同时,Intel还完全重新了一个分支预测单元(BPU),精确度更高,并在三个方面进行了创新。

SandyBridge

    第一,标准的BPU都是2-bit预测器,每个分支都使用相关可信度(强/弱)进行标记。Intel发现,这种双模预测器所预测的分支几乎都是强可信度的,因此SNB里多个分支都使用一个可信度位,而不是每个分支对应一个可信度位,结果就是在分支历史表中同样的位可以对应更多分支,进而提高预测精确度。

    第二,分支目标同样做了翻新。之前的架构中分支目标的大小都是固定的,但是大多数目标都是相对近似的。SNB现在支持多个不同的分支目标大小,而不是一味扩大寻址能力、保存所有分支目标,因而浪费的空间更少,CPU能够跟踪更多目标、加快预测速度。

    第三,提高分支预测器精度的传统方法是使用更多的历史位,但这只对要求长指令的特定类型分支有效,SNB于是将分支按照长短不同历史进行划分,从而提高预测精度。

    类似于AMD的推土机、山猫,Intel SNB也使用了物理寄存器文件。Core 2、Nehalem架构中,每个微指令需要的每个操作数都有一份拷贝,这就意味着乱序执行硬件(调度器/重排序缓存/关联队列)必须要足够大,以便容纳微指令和相关数据。Core Duo时代是80-bit,加入SSE指令集后增至128-bit,现在又有了AVX指令集,并且位宽翻至256-bit。

    RPF在寄存器文件中存储微指令操作数,而微指令在乱序执行引擎中只会携带指向操作数的指针,而非数据本身。这就大大降低了乱序执行硬件的功耗(转移大量数据很费电的),同时也减小了流水线的核心面积,数据流窗口也增大了三分之一。

    SNB允许256-bit AVX指令借用128-bit的整数SIMD数据路径,这就使用最小的核心面积实现了双倍的浮点吞吐量,每个时钟可以进行两个256-bit AVX操作。另外执行硬件和路径的上位128-bit是受电源栅极(Power Gate)控制的,标准128-bit SSE操作不会因为256-bit扩展而增加功耗。

    最后,Intel给出了在如前所述的4种常见运算下的AVX指令集加速比(AVX vs SSE over Sandy Bridge)。可以看出,在硬件环境不变的情况下,如果软件支持AVX指令集的话,速度提升可达1.5-2.5倍之多!

    AMD推土机架构对AVX的支持则有所不同,使用了两个128-bit SSE路径来合并成256-bit AVX操作,即使八核心(四模块)推土机的256-bit AVX吞吐量也要比四核心SNB少一半,不过实际影响完全取决于应用程序如何利用AVX。

    SNB的峰值浮点性能翻了一番,这就对载入和存储单元提出了更高要求。Nehalem/Westmere架构中有三个载入和存储端口:载入、存储地址、存储数据。SNB架构中载入和存储地址端口是对称的,都可以执行载入或者存储地址,载入带宽因此翻倍。

    SNB的整数执行也有了改进,只是比较有限。ADC指令吞吐量翻番,乘法运算可加速25%。

    之前的Nehalem/Westmere每个核心都与三级缓存单独相连,都需要大约1000条连线,而这种做法的缺点是如果频繁访问三级缓存,效果可能不会太好。

    SNB又整合了GPU图形核心、视频转码引擎,并共享三级缓存。Intel并没有沿用此前的做法,再增加2000条连线,而是像服务器版的Nehalem-EX、Westmere-EX那样,引入了环形总线(Ring Bus),每个核心、每一块三级缓存(LLC)、集成图形核心、媒体引擎、系统助手(System Agent)都在这条线上拥有自己的接入点,形象地说就是个“站台”。

SandyBridge

SandyBridge的环形总线

    这条环形总线由四条独立的环组成,分别是数据环(DT)、请求环(QT)、响应环(RSP)、侦听环(SNP)。每条环的每个站台在每个时钟周期内都能接受32字节数据,而且环的访问总会自动选择最短的路径,以缩短延迟。随着核心数量、缓存容量的增多,缓存带宽也随时同步增加,因而能够很好地扩展到更多核心、更大服务器集群。

    这样,SNB每个核心的三级缓存带宽都是96GB/s,堪比高端Westmere,而四核心系统更是能达到384GB/s,因为每个核心都在环上有一个接入点。

    三级缓存的延迟也从大约36个周期减少到26-31个周期。此前预览的时候我们就已经感觉到了这一点,现在终于有了确切的数字。三级缓存现在被划分成多个区块,分别对应一个CPU核心,都在环形总线上有自己的接入点和完整缓存管线。每个核心都可以访问全部三级缓存,只是延迟不同。此前三级缓存只有一条缓存管线,所有核心的请求都必须通过它,现在很大程度上分而治之了。

    和以前不同的是,三级缓存的频率现在也和核心频率同步,因而速度更快,不过缺点是三级缓存也会随着核心而降频,所以如果CPU降频的时候GPU又正好需要访问三级缓存,速度就慢下来了。

    SNB的CPU性能相比现在提升了10-30%,进化到第六代的GPU图形性能则会轻松翻好几番。

    不过这么做并没有说起来这么简单。NVIDIA GF100核心费了九牛二虎之力,SNB其实也差不多,同样进行了全新设计。

    可编程着色硬件被称为EU,包含着色器、核心、执行单元等,可以从多个线程双发射时取指令。内部ISA映射和绝大多数DX10 API指令一一对应,架构很像CISC,结果就是有效扩大了EU的宽度,IPC也显著提升。

    抽象数学运算由EU内的硬件负责,性能得以同步提高。Intel表示,正弦(sine)、余弦(cosine)操作的速度比现在的HD Graphics提升了几个数量级。

    体现在规格上,芯片组集成时代,每个线程平均64个寄存器,Westmere HD Graphics提高到平均80个,SNB则每个线程固定为120个。

SandyBridge

    所有这些改进加起来,SNB里每个EU的指令吞吐量都比之前的HD Graphics增加了一倍。

    而SNB集成的GPU图形核心分为两大版本,分别拥有6个、12个EU。首批发布的移动版全部是12个EU,桌面版则根据型号不同而有两种配置,高端12个、低端6个。得益于每个EU吞吐量翻番、运行频率更高、共享三级缓存等特点,即使只有六个的时候性能也会相当令人满意。

    而且SNB中还有一个媒体处理器,专门负责视频解码、编码。新的硬件加速解码引擎中,整个视频管线都通过固定功能单元进行解码。Intel据此宣称,SNB在播放视频的时候功耗可降低一半,速度却是大幅提升。

     英特尔在最新一代的英特尔® 微体系架构(代号 Sandy Bridge)上对英特尔® 睿频加速技术进行了优化,以便在需要时提供更高的性能。英特尔® 睿频加速 2.0 技术可以在处理器内核低于功率、电流和温度规范限制条件下运行时,使处理器内核自动以比基准频率更快的速度运行。

    当处理器在低于这些限制条件的情况下运行并且用户工作负载需要额外的性能时,处理器频率将动态增加,直到达到频率上限。英特尔® 睿频加速 2.0 技术可同时运行多种算法来管理电流、电源和温度,以便最大程度地提高性能和能源效率。注意:英特尔® 睿频加速 2.0 技术允许处理器在短时间内以高于其额定上限功率 (TDP) 的功率级别运行,以便实现性能最大化。

    Lynnfield Core i7/i5首次引入了智能动态加速技术“Turbo Boost”(睿频),能够根据工作负载,自动以适当速度开启全部核心,或者关闭部分限制核心、提高剩余核心的速度,比如一颗热设计功耗(TDP)为95W的四核心处理器,可能会三个核心完全关闭,最后一个大幅提速,一直达到95W TDP的限制。

SandyBridge

    现有处理器都是假设一旦开启动态加速,就会达到TDP限制,但事实上并非如此,处理器不会立即变得很热,而是有一段时间发热量距离TDP还差很多。

    SandyBridge利用这一点特性,允许功耗控制单元在短时间内将活跃核心加速到TDP以上,然后慢慢降下来。控制单元会在空闲时跟踪散热剩余空间,在系统负载加大时予以利用。处理器空闲的时间越长,能够超越TDP的时间就越长,但最长不超过25秒钟。

SandyBridge

    之前我们也已经说过了,SandyBridge GPU图形核心也可以独立动态加速,最高可达惊人的1.35GHz。如果软件需要更多CPU资源,那么CPU就会加速、GPU同时减速,反之亦然。

SandyBridge

无法再进行外频超频:

    由于SandyBridge的整合度非常高,UnCore部分和内存控制器以及QPI总线的频率都与处理器外频相关,可以说外频是牵一发而动全身,为了防止用户超频外频时出现意外情况(官方说法,笔者不信),Intel此次将外频锁定在了约105MHz——基本上超到105MHz还很稳定,106MHz以上就连Bios都进不去……

    对我们来说,Sandybridge有惊喜,也有遗憾。尽管早有传言,但是到了验证真相的这一刻,还是不免令人感叹:过去可以随心所欲的进行超频的时代不复存在了。只有特定的型号(后缀带K字)才开放了倍频,这也就意外着以后用户想要超频的话,必须购买价格更高的“K”系列处理器,而普通版SandyBridge则完全无法超频。

    果真是这样么?方法还是有的,虽然不能手动调整倍频,但是我们可以充分挖掘睿频的潜力。

    支持1333以上内存,现在i7 2600K非常好的搭档无疑是B3步进的P67芯片组。

PCPOP.COM评测室

硬件系统配置

处理器

Intel Core i7 2600

4 / 8线程 / 100MHz*34=3.4GHz / 8MB共享缓存)

主  板

ASUS P8P67

Intel SandyBridge +Realtek ALC889 8声道音效芯片)

内   存

DDR3 1600 4GB(2GB×2条)

(9-9-9-24-1T)

硬   盘

日立 7200.12 SATA

(1TB / 7200RPM / 32M缓存  / 30GB NTFS系统分区)

电   源

Tagan BZ1100W

六路+12V联合输出功率960W,单路+12V最大电流20A

显示器

DELL 3007

30英寸LCD / 2560*1600分辨率)

操 作 系 统 

操作系统

Microsoft Windows 7 

(中文版 / 64BIT 旗舰版)

i72600不带K上4.4G!SNB Turbo巧超频

硬件测试平台

    之前所有的Intel官方文档都显示i7 2600(K)倍频34,最大睿频38倍。如果不在主板里做设置,确实也是这样。所以很多人都认为SNB i7 2600的极限频率就是3.8G。

击败全国99%电脑?P67+2600狂超4.4GHz

首发桌面平台SNB处理器,官方注明Max Single Core Turbo 3.8G

i72600不带K上4.4G!SNB Turbo巧超频

淘宝商家也宣称最高睿频3800MHz

    但我们发现以下各项可在指定的工作负载上设定采用英特尔® 睿频加速 2.0 技术的上限:

1、活跃内核的数量 2、预估的电流消耗 3、预估的功耗 4、处理器温度,如果几个条件都满足,是否能Turbo到更高的水准呢?

i72600不带K上4.4G!SNB Turbo巧超频

1、进入显卡bios高级模式,在Ai Twerker中,Turbo倍频 选择“操作系统中最大的Turbo”

2、 将Turbo值设置为42(Intel隐藏睿频的最大值)

i72600不带K上4.4G!SNB Turbo巧超频

3、Ai 超频调整设为手动。

4、外频设置为105(再大可能会被Intel禁止使用导致不稳定)

i72600不带K上4.4G!SNB Turbo巧超频

    外频改变对内存频率也产生了影响,华硕p67中可以直观的看到。

击败全国99%电脑?P67+2600狂超4.4GHz

四核八线程可以睿频到4.2G,几十秒后稳定到4.1G

i72600不带K上4.4G!SNB Turbo巧超频

三核六线程满载睿频(点击放大)

击败全国99%电脑?P67+2600狂超4.4GHz

双核四线程可以稳定到4.3G

i72600不带K上4.4G!SNB Turbo巧超频

单核双线程满载稳定到睿频4.4G!

    媒体送测的CPU均为ES版,请注意,正显的SNB i7 2600是锁倍频的,请不要怀疑因为是ES版才能超,这点上和市售版是一样的。

i72600不带K上4.4G!SNB Turbo巧超频

    不打开睿频的时候i7 2600约250秒,破解睿频之后达到了214秒,性能提升明显。

击败全国99%电脑?P67+2600狂超4.4GHz

看完枯燥的数据和理论,放个360轻松一下~勿怪

击败全国99%电脑?P67+2600狂超4.4GHz

移动平台处理器是否也能破解Turbo?

● 全文总结:

    虽然SNB并不像Intel宣称的那样是一个全新架构,严格来说只是现有架构的改进和增强,本质并没有变,但很多模块也进行了彻底重新设计,细节之处的优化和增强也大大提高了执行效率,SNB在功能特性、性能、功耗等各方面的表现较之前的酷睿都更加出色。

    Intel决定将一些产品的倍频锁死,这样一来改进的Turbo 2.0动态加速技术就显得更有意义。它意味着我们可以在不同情况下都能很好地释放多核心、高频率处理器的潜力,不会面临性能紧缺、不会造成资源浪费,还能很好地协调CPU、GPU资源。

    如果在主板中进一步打开设置,睿频的潜力则能完全被释放,如此睿频的普通版处理器和超频版2XXXK差距进一步缩小,尤其是单核(双线程)可达4.4G的高频对于游戏玩家非常实用。而Intel采取固执的市场策略,在之后的产品中禁止额外的睿频呢?只能看推土机是否给力了。■<

0人已赞

关注我们

泡泡网

手机扫码关注