泡泡网CPU频道 PCPOP首页      /      CPU     /      评测    /    正文

CPU/GPU真融合!Intel新酷睿权威评测

第三章/第四节 SandyBridge架构解析:新增AVX高级矢量扩展指令集

    Westmere相比Nehalem,唯一的改进就是新增AES加密解密指令集,在特定应用下速度提升非常显著,但由于一般人很少用到加密和解密应用,因此这一改进几乎可以被忽视了。

    现在SandyBridge相比Westmere,在AES指令集的基础上,又新增了AVX(高级矢量扩展)指令集,这个指令集就非同一般了,Intel打算用它来逐步取代已经服役几十年的SSE(单指令多数据流式扩展)指令集,AVX指令集的重要性可见一斑!

SandyBridge

    所谓的矢量,就是带有方向的标量……在数学上的表现就是多个参数的代数式,也就是多个标量的集合。为了更好地表示多个标量,AVX高级矢量扩展将原有的128位浮点指令扩展到了256位,可以同时处理8个32位(4字节)的浮点数或者一个256位的数:

    AVX指令集是和SandyBridge微架构紧密结合的,因此,微架构的浮点寄存器也要从128位扩展到256位,此外,Load单元也要适应一次载入256位的能力,SandyBridge没有直接扩展原有Load单元的位宽,而是通过增加了一个Load单元来达到256bit Load的能力,如下图所示:

    可以看到,在0、1、5端口都增加了256位宽度AVX指令执行单元。

    最后,Intel提到了,由于128位SSE指令与256位AVX指令位宽不同,在混合编码的时候,指令切换需要进行额外的寄存器高位保留操作,因此混用SSE/AVX将会导致性能损失。应尽量向新指令集进行迁移。

    最后,Intel给出了在如前所述的4种常见运算下的AVX指令集加速比(AVX vs SSE over Sandy Bridge)。可以看出,在硬件环境不变的情况下,如果软件支持AVX指令集的话,速度提升可达1.5-2.5倍之多!

    看来Intel是铁定决心要改进CPU的浮点运算能力,SandyBridge的下一代IVYBridge将会新增FMA指令集,FMA是同时进行一个乘法和一个加法的运算,在图形操作上很是常见,相信关注GPU图形技术的朋友们已经会比较熟悉。看得出来未来的处理器,CPU与GPU之间的界限将会非常模糊了。

1人已赞
第1页:前言:Intel正式发布全新酷睿处理器第2页:酷睿架构大变身 酷睿一代第3页:酷睿二代真正发力!一二代对比(1)第4页:酷睿二代真正发力!一二代对比(2)第5页:三大领域跨平台!酷睿2性能提升40%第6页:酷睿2的黄金岁月!新奔腾再续辉煌第7页:酷睿i系列到来!高端用户首选i7第8页:丰富产品线!LGA1156接口酷睿i系列第9页:Intel处理器微架构和核心代号解析第10页:Bloomfield核心:首次整合内存控制器第11页:Lynnfield核心:首次整合PCI-E控制器第12页:Clarkdale核心:CPU首次整合GPU第13页:SandyBridge核心:首次原生整合GPU核心第14页:SandyBridge核心架构改进总览第15页:SandyBridge架构:指令缓存和分支预测第16页:SandyBridge架构:AVX高级矢量扩展指令第17页:SandyBridge架构:新增物理寄存文件第18页:SandyBridge架构:环形总线与三级缓存第19页:SandyBridge架构:革命性的整合GPU第20页:SandyBridge架构:多媒体处理器第21页:SandyBridge架构:更加给力的睿频加速第22页:SandyBridge家族产品定位于布局第23页:SandyBridge家族产品命名规则及特点第24页:SandyBridge桌面版本处理器规格表第25页:SandyBridge移动版本处理器规格表第26页:SandyBridge处理器精美图赏第27页:6系与5系芯片组的差异第28页:PCH升级为PCI-E 2.0第29页:不再提供对PCI设备的支持第30页:加入SATA 6Gbps支持第31页:Intel原厂主板解析:DH67-BL第32页:Intel原厂主板解析:DP67-BG第33页:P67主板曝光之昂达魔剑P67第34页:P67主板曝光之华擎P67 Extreme4第35页:P67主板曝光之华擎Fatal1ty P67第36页:P67主板曝光之华硕P8P67 Deluxe第37页:P67主板曝光之技嘉GA-P67A-UD4第38页:P67主板曝光之主板技嘉GA-P67A-UD3R第39页:P67主板曝光之技嘉GA-P67A-UD7第40页:P67主板曝光之捷波悍马HI08第41页:P67主板曝光之精英P67H2-A第42页:P67主板曝光之微星P67A-GD65第43页:P67主板曝光之七彩虹战旗C.P67 X5第44页:P67主板曝光之映泰TP67XE第45页:H67主板曝光之富士康H67MP-S第46页:H67主板曝光之华硕P8H67-M EVO第47页:H67主板曝光之技嘉GA-H67A-UD2H第48页:H67主板曝光之精英H67H2-M第49页:H67主板曝光之七彩虹战旗C.H67 X5第50页:H67主板曝光之索泰H67 ITX U3 WIFI第51页:H67主板曝光之映泰TH67+第52页:CPU性能测试说明第53页:CPU基准:SuperPI第54页:CPU基准:wPrime第55页:CPU基准:Fritz第56页:CPU性能:SisoftwareSandra第57页:内存性能:Everest & Sisoftware第58页:CPU渲染:Cine Bench第59页:文件压缩:WinRAR第60页:视频转码:Media Coder第61页:3D渲染:Maya2009第62页:3D渲染:3DS MAX 2010第63页:综合性能:PCMark Vantage第64页:3D性能:3DMark Vantage第65页:游戏:使命召唤7第66页:游戏:星际争霸2第67页:游戏:文明5第68页:《3DMark06》:稳定的DX9C权威第69页:《街头霸王IV》:最低画质依然卡第70页:《波斯王子5》:新架构优势明显第71页:《使命召唤7》:大家都跑不动第72页:《3DMark Vantage》:DX10权威第73页:《孤岛危机》:集显也能流畅跑第74页:《冲突世界》:运行压力不大第75页:《孤岛惊魂2》:intel优势很大第76页:《战地:叛逆联队2》:颠覆对集显的认识第77页:《失落的星球2》:新架构发挥出色第78页:《地铁2033》:越级挑战第79页:《鹰击长空》:独显依然不给力第80页:《魔兽世界》:AMD终于爆发第81页:《黑暗虚空》:互有胜负第82页:《文明5》:依然蓝色天下第83页:《英雄连》:不挑显卡的游戏第84页:视频转码利器:Media Espresso 第85页:MediaConverter7论剑:硬件编码才是王道第86页:CPU功耗测试第87页:GPU功耗测试第88页:CPU性能对比:i7 2600K vs i7 870第89页:CPU性能对比:i5 2500K vs i5 760第90页:CPU性能对比:i3 2100 vs i3 530第91页:GPU性能对比:HD2000 vs GMA HD第92页:GPU性能对比:HD3000 vs HD4250第93页:GPU性能对比:HD3000 vs HD5450第94页:编辑测试心得第95页:全文总结&展望未来

关注我们

泡泡网

手机扫码关注