CPU/GPU真融合！Intel新酷睿权威评测-泡泡网

泡泡网CPU频道 PCPOP首页 / CPU / 评测 / 正文

CPU/GPU真融合！Intel新酷睿权威评测

2011年01月05日 09:00作者：泡泡网评测室编辑：陈骋文章出处：泡泡网原创

第三章/第四节 SandyBridge架构解析：新增AVX高级矢量扩展指令集

Westmere相比Nehalem，唯一的改进就是新增AES加密解密指令集，在特定应用下速度提升非常显著，但由于一般人很少用到加密和解密应用，因此这一改进几乎可以被忽视了。

现在SandyBridge相比Westmere，在AES指令集的基础上，又新增了AVX（高级矢量扩展）指令集，这个指令集就非同一般了，Intel打算用它来逐步取代已经服役几十年的SSE（单指令多数据流式扩展）指令集，AVX指令集的重要性可见一斑！

所谓的矢量，就是带有方向的标量……在数学上的表现就是多个参数的代数式，也就是多个标量的集合。为了更好地表示多个标量，AVX高级矢量扩展将原有的128位浮点指令扩展到了256位，可以同时处理8个32位（4字节）的浮点数或者一个256位的数：

AVX指令集是和SandyBridge微架构紧密结合的，因此，微架构的浮点寄存器也要从128位扩展到256位，此外，Load单元也要适应一次载入256位的能力，SandyBridge没有直接扩展原有Load单元的位宽，而是通过增加了一个Load单元来达到256bit Load的能力，如下图所示：

可以看到，在0、1、5端口都增加了256位宽度AVX指令执行单元。

最后，Intel提到了，由于128位SSE指令与256位AVX指令位宽不同，在混合编码的时候，指令切换需要进行额外的寄存器高位保留操作，因此混用SSE/AVX将会导致性能损失。应尽量向新指令集进行迁移。

最后，Intel给出了在如前所述的4种常见运算下的AVX指令集加速比（AVX vs SSE over Sandy Bridge）。可以看出，在硬件环境不变的情况下，如果软件支持AVX指令集的话，速度提升可达1.5-2.5倍之多！

看来Intel是铁定决心要改进CPU的浮点运算能力，SandyBridge的下一代IVYBridge将会新增FMA指令集，FMA是同时进行一个乘法和一个加法的运算，在图形操作上很是常见，相信关注GPU图形技术的朋友们已经会比较熟悉。看得出来未来的处理器，CPU与GPU之间的界限将会非常模糊了。

1人已赞

第1页：前言：Intel正式发布全新酷睿处理器第2页：酷睿架构大变身酷睿一代第3页：酷睿二代真正发力！一二代对比（1）第4页：酷睿二代真正发力！一二代对比（2）第5页：三大领域跨平台！酷睿2性能提升40%第6页：酷睿2的黄金岁月！新奔腾再续辉煌第7页：酷睿i系列到来！高端用户首选i7 第8页：丰富产品线！LGA1156接口酷睿i系列第9页：Intel处理器微架构和核心代号解析第10页：Bloomfield核心：首次整合内存控制器第11页：Lynnfield核心：首次整合PCI-E控制器第12页：Clarkdale核心：CPU首次整合GPU 第13页：SandyBridge核心：首次原生整合GPU核心第14页：SandyBridge核心架构改进总览第15页：SandyBridge架构：指令缓存和分支预测第16页：SandyBridge架构：AVX高级矢量扩展指令第17页：SandyBridge架构：新增物理寄存文件第18页：SandyBridge架构：环形总线与三级缓存第19页：SandyBridge架构：革命性的整合GPU 第20页：SandyBridge架构：多媒体处理器第21页：SandyBridge架构：更加给力的睿频加速第22页：SandyBridge家族产品定位于布局第23页：SandyBridge家族产品命名规则及特点第24页：SandyBridge桌面版本处理器规格表第25页：SandyBridge移动版本处理器规格表第26页：SandyBridge处理器精美图赏第27页：6系与5系芯片组的差异第28页：PCH升级为PCI-E 2.0 第29页：不再提供对PCI设备的支持第30页：加入SATA 6Gbps支持第31页：Intel原厂主板解析：DH67-BL 第32页：Intel原厂主板解析：DP67-BG 第33页：P67主板曝光之昂达魔剑P67 第34页：P67主板曝光之华擎P67 Extreme4 第35页：P67主板曝光之华擎Fatal1ty P67 第36页：P67主板曝光之华硕P8P67 Deluxe 第37页：P67主板曝光之技嘉GA-P67A-UD4 第38页：P67主板曝光之主板技嘉GA-P67A-UD3R 第39页：P67主板曝光之技嘉GA-P67A-UD7 第40页：P67主板曝光之捷波悍马HI08 第41页：P67主板曝光之精英P67H2-A 第42页：P67主板曝光之微星P67A-GD65 第43页：P67主板曝光之七彩虹战旗C.P67 X5 第44页：P67主板曝光之映泰TP67XE 第45页：H67主板曝光之富士康H67MP-S 第46页：H67主板曝光之华硕P8H67-M EVO 第47页：H67主板曝光之技嘉GA-H67A-UD2H 第48页：H67主板曝光之精英H67H2-M 第49页：H67主板曝光之七彩虹战旗C.H67 X5 第50页：H67主板曝光之索泰H67 ITX U3 WIFI 第51页：H67主板曝光之映泰TH67+第52页：CPU性能测试说明第53页：CPU基准：SuperPI 第54页：CPU基准：wPrime 第55页：CPU基准：Fritz 第56页：CPU性能：SisoftwareSandra 第57页：内存性能：Everest & Sisoftware 第58页：CPU渲染：Cine Bench 第59页：文件压缩：WinRAR 第60页：视频转码：Media Coder 第61页：3D渲染：Maya2009 第62页：3D渲染：3DS MAX 2010 第63页：综合性能：PCMark Vantage 第64页：3D性能：3DMark Vantage 第65页：游戏：使命召唤7 第66页：游戏：星际争霸2 第67页：游戏：文明5 第68页：《3DMark06》：稳定的DX9C权威第69页：《街头霸王IV》：最低画质依然卡第70页：《波斯王子5》：新架构优势明显第71页：《使命召唤7》：大家都跑不动第72页：《3DMark Vantage》：DX10权威第73页：《孤岛危机》：集显也能流畅跑第74页：《冲突世界》：运行压力不大第75页：《孤岛惊魂2》：intel优势很大第76页：《战地:叛逆联队2》：颠覆对集显的认识第77页：《失落的星球2》：新架构发挥出色第78页：《地铁2033》：越级挑战第79页：《鹰击长空》：独显依然不给力第80页：《魔兽世界》：AMD终于爆发第81页：《黑暗虚空》：互有胜负第82页：《文明5》：依然蓝色天下第83页：《英雄连》：不挑显卡的游戏第84页：视频转码利器：Media Espresso 第85页：MediaConverter7论剑：硬件编码才是王道第86页：CPU功耗测试第87页：GPU功耗测试第88页：CPU性能对比：i7 2600K vs i7 870 第89页：CPU性能对比：i5 2500K vs i5 760 第90页：CPU性能对比：i3 2100 vs i3 530 第91页：GPU性能对比：HD2000 vs GMA HD 第92页：GPU性能对比：HD3000 vs HD4250 第93页：GPU性能对比：HD3000 vs HD5450 第94页：编辑测试心得第95页：全文总结&展望未来