CPU/GPU真融合!Intel新酷睿权威评测
第三章/第七节 SandyBridge架构:革命性的整合GPU
Intel以往的集显都给人一种鸡肋的感觉,高不成低不就,3D性能非常可怜,2D视频部分的功能也残缺不全,与NVIDIA和AMD的整合产品相比,差距非常大。
即便是上代的Clarkdale核心,虽然将CPU和GPU封装在了一起,但实际物理架构和Core 2 + G45时代的模式并没有不同,只是通过45nm工艺、更多的着色单元和更高频率提升了些许性能,并没有革命性的改进。
SandyBridge微架构最革命性的部分,非整合GPU部分莫属了。通过前文中的介绍大家应该知道,SandyBridge当中GPU和CPU计算单元已经实现了无缝融合,单一芯片都使用了目前非常先进的32nm工艺制造。
SandyBridge GPU有自己的电源岛和时钟域,也支持Turbo Boost技术,可以独立加速或降频,并共享三级缓存。显卡驱动会控制访问三级缓存的权限,甚至可以限制GPU使用多少缓存。将图形数据放在缓存里就不用绕道去遥远而“缓慢”的内存了,这对提升性能、降低功耗都大有裨益。
可编程着色硬件被称为EU,包含着色器、核心、执行单元等,可以从多个线程双发射时取指令。内部ISA映射和绝大多数DX10.1 API指令一一对应,架构很像CISC,结果就是有效扩大了EU的宽度,IPC也显著提升。抽象数学运算由EU内的硬件负责,性能得以同步提高。Intel表示,正弦(sine)、余弦(cosine)操作的速度比现在的HD Graphics提升了几个数量级。
Intel此前的图形架构中,寄存器文件都是即时重新分配的。如果一个线程需要的寄存器较少,剩余寄存器就会分配给其他线程。这样虽能节省核心面积,但也会限制性能,很多时候线程可能会面临没有寄存器可用的尴尬。在芯片组集成时代,每个线程平均64个寄存器,Westmere HD Graphics提高到平均80个,Sandybridge则每个线程固定为120个。
所有这些改进加起来,SNB里每个EU的指令吞吐量都比现在的GMA HD显卡增加了一倍。 Intel将新一代的整合显卡命名为HD Graphics 3000和2000系列,其中3000拥有12个EU、2000拥有6个EU。
得益于每个EU吞吐量翻番、运行频率更高、共享三级缓存等特点,即使只有六个的时候性能也会相当令人满意,都要比上代12个EU的GMA HD显卡强悍。