泡泡网CPU频道 PCPOP首页      /      CPU     /      评测    /    正文

CPU/GPU真融合!Intel新酷睿权威评测

第三章/第二节 SandyBridge架构解析:指令缓存和分支预测

    从高级层面角度看,SandyBridge架构只是一次进化,但是如果看看Nehalem/Westmere以来晶体管变化的规模,绝对是一次革命。

    Core 2引入了一种叫作循环流检测器(LSD)的逻辑块,检测到CPU执行软件循环的时候就会关闭分支预测器、预取/解码引擎,然后通过自身缓存的微指令(micro-ops)供给执行单元。这种做法通过在循环执行的时候关闭前端节省了功耗,并改进了性能。Core i系列处理器沿用了这种设计。

SandyBridge

    SandyBridge里面又增加了一个微指令缓存,用于在指令解码时临时存放。这里没有什么严格的算法,指令只要在解码就会放入缓存。预取硬件获得一个新指令的时候,会首先检查它是否存在于微指令缓存中,如是则由缓存为其余的管线服务,前端随之关闭。解码硬件是x86管线里非常复杂的部分,关闭它能够节约大量的功耗。

    这个缓存是直接映射的,能存储大约1.5K微指令,相当于6KB指令缓存。它位于一级指令缓存内,大多数程序的命中率都能达到80%左右,而且带宽也相比一级指令缓存更高、更稳定。真正的一级指令和数据缓存并没有变,仍然都是32KB,合计64KB。这看起来有点儿像Pentium 4的追踪缓存,但最大的不同是它并不缓存追踪,而更像是一个指令缓存,存储的是微指令,而非x86指令(macro-ops)。

SandyBridge

    与此同时,Intel还完全重新了一个分支预测单元(BPU),精确度更高,并在三个方面进行了创新。

第一,标准的BPU都是2-bit预测器,每个分支都使用相关可信度(强/弱)进行标记。Intel发现,这种双模预测器所预测的分支几乎都是强可信度的,因此SNB里多个分支都使用一个可信度位,而不是每个分支对应一个可信度位,结果就是在分支历史表中同样的位可以对应更多分支,进而提高预测精确度。

第二,分支目标同样做了翻新。之前的架构中分支目标的大小都是固定的,但是大多数目标都是相对近似的。SNB现在支持多个不同的分支目标大小,而不是一味扩大寻址能力、保存所有分支目标,因而浪费的空间更少,CPU能够跟踪更多目标、加快预测速度。

第三,提高分支预测器精度的传统方法是使用更多的历史位,但这只对要求长指令的特定类型分支有效,SNB于是将分支按照长短不同历史进行划分,从而提高预测精度。

1人已赞
第1页:前言:Intel正式发布全新酷睿处理器第2页:酷睿架构大变身 酷睿一代第3页:酷睿二代真正发力!一二代对比(1)第4页:酷睿二代真正发力!一二代对比(2)第5页:三大领域跨平台!酷睿2性能提升40%第6页:酷睿2的黄金岁月!新奔腾再续辉煌第7页:酷睿i系列到来!高端用户首选i7第8页:丰富产品线!LGA1156接口酷睿i系列第9页:Intel处理器微架构和核心代号解析第10页:Bloomfield核心:首次整合内存控制器第11页:Lynnfield核心:首次整合PCI-E控制器第12页:Clarkdale核心:CPU首次整合GPU第13页:SandyBridge核心:首次原生整合GPU核心第14页:SandyBridge核心架构改进总览第15页:SandyBridge架构:指令缓存和分支预测第16页:SandyBridge架构:AVX高级矢量扩展指令第17页:SandyBridge架构:新增物理寄存文件第18页:SandyBridge架构:环形总线与三级缓存第19页:SandyBridge架构:革命性的整合GPU第20页:SandyBridge架构:多媒体处理器第21页:SandyBridge架构:更加给力的睿频加速第22页:SandyBridge家族产品定位于布局第23页:SandyBridge家族产品命名规则及特点第24页:SandyBridge桌面版本处理器规格表第25页:SandyBridge移动版本处理器规格表第26页:SandyBridge处理器精美图赏第27页:6系与5系芯片组的差异第28页:PCH升级为PCI-E 2.0第29页:不再提供对PCI设备的支持第30页:加入SATA 6Gbps支持第31页:Intel原厂主板解析:DH67-BL第32页:Intel原厂主板解析:DP67-BG第33页:P67主板曝光之昂达魔剑P67第34页:P67主板曝光之华擎P67 Extreme4第35页:P67主板曝光之华擎Fatal1ty P67第36页:P67主板曝光之华硕P8P67 Deluxe第37页:P67主板曝光之技嘉GA-P67A-UD4第38页:P67主板曝光之主板技嘉GA-P67A-UD3R第39页:P67主板曝光之技嘉GA-P67A-UD7第40页:P67主板曝光之捷波悍马HI08第41页:P67主板曝光之精英P67H2-A第42页:P67主板曝光之微星P67A-GD65第43页:P67主板曝光之七彩虹战旗C.P67 X5第44页:P67主板曝光之映泰TP67XE第45页:H67主板曝光之富士康H67MP-S第46页:H67主板曝光之华硕P8H67-M EVO第47页:H67主板曝光之技嘉GA-H67A-UD2H第48页:H67主板曝光之精英H67H2-M第49页:H67主板曝光之七彩虹战旗C.H67 X5第50页:H67主板曝光之索泰H67 ITX U3 WIFI第51页:H67主板曝光之映泰TH67+第52页:CPU性能测试说明第53页:CPU基准:SuperPI第54页:CPU基准:wPrime第55页:CPU基准:Fritz第56页:CPU性能:SisoftwareSandra第57页:内存性能:Everest & Sisoftware第58页:CPU渲染:Cine Bench第59页:文件压缩:WinRAR第60页:视频转码:Media Coder第61页:3D渲染:Maya2009第62页:3D渲染:3DS MAX 2010第63页:综合性能:PCMark Vantage第64页:3D性能:3DMark Vantage第65页:游戏:使命召唤7第66页:游戏:星际争霸2第67页:游戏:文明5第68页:《3DMark06》:稳定的DX9C权威第69页:《街头霸王IV》:最低画质依然卡第70页:《波斯王子5》:新架构优势明显第71页:《使命召唤7》:大家都跑不动第72页:《3DMark Vantage》:DX10权威第73页:《孤岛危机》:集显也能流畅跑第74页:《冲突世界》:运行压力不大第75页:《孤岛惊魂2》:intel优势很大第76页:《战地:叛逆联队2》:颠覆对集显的认识第77页:《失落的星球2》:新架构发挥出色第78页:《地铁2033》:越级挑战第79页:《鹰击长空》:独显依然不给力第80页:《魔兽世界》:AMD终于爆发第81页:《黑暗虚空》:互有胜负第82页:《文明5》:依然蓝色天下第83页:《英雄连》:不挑显卡的游戏第84页:视频转码利器:Media Espresso 第85页:MediaConverter7论剑:硬件编码才是王道第86页:CPU功耗测试第87页:GPU功耗测试第88页:CPU性能对比:i7 2600K vs i7 870第89页:CPU性能对比:i5 2500K vs i5 760第90页:CPU性能对比:i3 2100 vs i3 530第91页:GPU性能对比:HD2000 vs GMA HD第92页:GPU性能对比:HD3000 vs HD4250第93页:GPU性能对比:HD3000 vs HD5450第94页:编辑测试心得第95页:全文总结&展望未来

关注我们

泡泡网

手机扫码关注