英特尔SandyBridge路在脚下 独立显卡何去何从
“钟摆”定律再续传奇
按英特尔的Tick-Tock钟摆定律,2011年将是其新架构的推出年。再有1个多月时间,第二代智能英特尔酷睿处理器Sandy Bridge将发布上市。除了处理器,配套的芯片组、主板、散热器等也会一并更新,其中芯片组是6系列,桌面上主要有P67、H67、H61等型号。
Sandy Bridge从高级层面角度看,架构可以说是一次进化,但是如果看看Nehalem/Westmere以来晶体管变化的规模,绝对是一次大跃进。并且,在引入循环流检测器的逻辑快以及增加了一个微指令缓存,用于指令解码临时存放。我们不难发现,处理器越来越注重节能,在节约大量能耗的同时,处理器的性能相比现在的产品反而提升10-30%。不过,这些都不是焦点所在,真正让人激动的是其无缝融合的核芯显卡,其性能轻松提升了好几番,这对于中低端独立显卡来说绝对是一个噩耗。
无缝融合核芯显卡 图形性能再攀高峰
虽然2010年初发布的酷睿系列也自带了图形核心,但是与CPU是双内核封装——32nm的CPU和45nm的GPU。而GPU凭借45nm工艺、更多着色硬件、更高频率等提升了性能,而Sandy Bridge全新设计采用与CPU核心同步的32nm工艺制造GPU则进一步显著提高了其性能。最为关键的是GPU和CPU融为一体了,成为新一代CPU的标准组成部分,所以这样的CPU被称为核芯显卡。
目前大家熟悉的Core i5、Core i7都支持睿频加速(Turbo Boost)技术,而Sandy Bridge的核芯显卡有自己的电源岛和时钟域,同时也支持Turbo Boost技术,可以配合CPU的各个计算内核协调进行加速或降频。这种按需智能变化频率的最大好处是在不繁忙的时候可以为用户节省大量能耗,并且显著降低发热量,而在需要速度的时候迅速提速。
Sandy Bridge的GPU与一般的集成显示核心最大的不同就是显示驱动会控制访问处理器内核的三级高速缓存,GPU和CPU计算内核处于同样的位置访问可以共享的高速缓存,这也正是核芯显卡名字的由来之一。核芯显卡不等同于集成显卡,因为集成显示核心则只能将图形数据放在系统内存当中,要知道内存的速度相比三级高速缓存可就慢太多了,并且要更“遥远”一些,单是路程的时间就大大制约了其性能。如此说来,将图形数据放在高速缓存里对提升性能、降低功耗都有事半功倍的效果。
Sandy Bridge的核芯显卡全面使用固定功能硬件,功能特性和硬件单元相对应,这样的好处是性能、功耗、核心面积都大大优化。而其性能提升的重点在于广泛使用全面可编程硬件,也就是我们被称为EU的东西,包含着色器、核心、执行单元等,可以从多个线程双发射时取指令。
在此前的图形架构中,寄存器堆栈都是即时重新分配,如果其中某一个线程的需求量降低,节省的部分会分配给其他线程,这样做最大的好处是节省了核心面积,但是,在一些情况下却有发生线程没有寄存器可用的尴尬,大大降低其性能。其他集成显示核心每线程平均64个寄存器,到了Westmere 酷睿的GPU提高到平均80个,Sandy Bridge的核芯显卡则每个线程固定为120个,如此说来,性能的大幅度提升就成了必然结果。
内部ISA映射和DX10 API指令几乎一一对应,架构很像CISC,结果就是有效扩大了EU的宽度,IPC也显著提升。并且,抽象数学运算也有EU内的硬件负责,性能得到同步提升,就英特尔表示,正弦(sine)、余弦(cosine)操作的速度比现在酷睿中的高清显卡提升了几个数量级。所有这些改进加起来,Sandy Bridge核芯显卡里每个EU的指令吞吐量都比现在酷睿的高清显卡增加了一倍。
当然,Sandy Bridge的核芯显卡也会人为拉开性能差距,分为2个性能不同的版本,通过EU分成两个版本,拥有12个或者6个EU。但是即便拥有6个EU,得益于每个EU吞吐量翻番、运行频率更高、共享三级高速缓存等特点,其性能也令人相当满意。更何况拥有12个EU的性能更可以直接威胁到独立中低端显卡市场。
如果说Sandy Bridge的核芯显卡主要是提升3D性能以及画面质量只能占一半作用,那么另一半作用就是数字媒体的处理能力。目前高清视频已经非常普及,很多独立显卡也打着高清显卡的旗帜。目前的Core i3也已经可以流畅播放高清视频,所以,最基本的流畅播放已经不是技术门槛,但是英特尔还要继续研发下去,将视频以及衍生功能继续发扬光大。
Sandy Bridge中有一个媒体处理器,专门负责视频解码、编码,并且新的硬件加速解码引擎中,整个视频管线都通过固定功能单元进行解码,这样做最大的好处就是在播放视频的时候功耗可以降低一半。
全新的视频编码引擎虽然并没有对外公布其具体细节,但是在IDF现场的一个演示片段却透露了其强大的性能。一段3分钟的1080P 30Mbps的高清视频,转换成640x360的iPhone格式,如果是一般用户的电脑可能需要几分钟,但是Sandy Bridge只需要14秒,转换速度高达400FPS,而这一切发生在大约3平方毫米的核心面积之上。并且,我们可以预计的是,英特尔还会与更多软件厂商密切合作,相信这种视频转码技术会很快得到广泛支持。
融合带来革新 创新赢取未来
9月中旬的IDF上,英特尔展示了Sandy Bridge处理器,直接威胁了独立显卡的生存空间,而这一时刻现在已经不足2个月的时间了。至于其性能究竟如何,在IDF大会上英特尔首席执行官Paul Otellini展示了当下最火爆的游戏《星际争霸2:自由之翼》,并与独立显卡共同放置在一起,消费者并不能区别出哪台是独立显卡运行,而哪台是来自Sandy Bridge处理器的核芯显卡运行,这说明Sandy Bridge处理器已经可以完全取代中低端产品。市场调研机构iSuppli的数据显示,到2014年,全年出货的PC当中,大约有80%将配置这种综合处理器。
真正将CPU和GPU无缝融合,基于32nm工艺、数倍于之前产品的3D性能,更强的视频、音频回放能力和更高处理器性能的同时,在功耗和发热量上却得到更好的控制,这就是Sandy Bridge为我们打造的第二代智能英特尔酷睿处理器。