无缝融合核芯显卡 图形性能再攀高峰
泡泡网笔记本频道12月29日 虽然2010年初发布的酷睿系列也自带了图形核心,但是CPU是双内核封装–32nm的CPU和45nm的GPU。而Sandy Bridge全新设计采用与CPU核心同步的32nm工艺制造GPU则进一步显着提高了其性能。最为关键的是GPU和CPU融为一体了,成为新一代CPU的标准组成部分,所以这样的CPU被称为核芯显卡。
目前大家熟悉的Core i5、Core i7都支持睿频加速(Turbo Boost)技术,而Sandy Bridge的核芯显卡有自己的电源岛和时钟域,同时也支持Turbo Boost技术,可以配合CPU的各个计算内核协调进行加速或降频。这种按需智能变化频率的最大好处是在不繁忙的时候可以为用户节省大量能耗,并且显着降低发热量,而在需要速度的时候迅速提速。
Sandy Bridge的GPU与一般的集成显示核心最大的不同就是显示驱动会控制访问处理器内核的三级高速缓存,GPU和CPU计算内核处于同样的位置访问可以共享的高速缓存,这也正是核芯显卡名字的由来之一。核芯显卡不等同于集成显卡,因为集成显示核心则只能将图形数据放在系统内存当中,要知道内存的速度相比三级高速缓存可就慢太多了,并且要更“遥远”一些,单是路程的时间就大大制约了其性能。如此说来,将图形数据放在高速缓存里对提升性能、降低功耗都有事半功倍的效果。
Sandy Bridge的核芯显卡全面使用固定功能硬件,功能特性和硬件单元相对应,这样的好处是性能、功耗、核心面积都大大优化。而其性能提升的重点在于广泛使用全面可编程硬件,也就是我们被称为EU的东西,包含着色器、核心、执行单元等,可以从多个线程双发射时取指令。
在此前的图形架构中,寄存器堆栈都是即时重新分配,如果其中某一个线程的需求量降低,节省的部分会分配给其他线程,这样做最大的好处是节省了核心面积,但是,在一些情况下却有发生线程没有寄存器可用的尴尬,大大降低其性能。其他集成显示核心每线程平均64个寄存器,到了Westmere酷睿的GPU提高到平均80个,Sandy Bridge的核芯显卡则每个线程固定为120个,如此说来,性能的大幅度提升就成了必然结果。
内部ISA映射和DX10 API指令几乎一一对应,架构很像CISC,结果就是有效扩大了EU的宽度,IPC也显着提升。并且,抽象数学运算也有EU内的硬件负责,性能得到同步提升,就英特尔表示,正弦(sine)、余弦(cosine)操作的速度比现在酷睿中的高清显卡提升了几个数量级。所有这些改进加起来,Sandy Bridge核芯显卡里每个EU的指令吞吐量都比现在酷睿的高清显卡增加了一倍。
当然,Sandy Bridge的核芯显卡也会人为拉开性能差距,分为2个性能不同的版本,通过EU分成两个版本,拥有12个或者6个EU。但是即便拥有6个EU,得益于每个EU吞吐量翻番、运行频率更高、共享三级高速缓存等特点,其性能也令人相当满意。更何况拥有12个EU的性能更可以直接威胁到独立中低端显卡市场。
如果说Sandy Bridge的核芯显卡主要是提升3D性能以及画面质量只能占一半作用,那么另一半作用就是数字媒体的处理能力。目前高清视频已经非常普及,很多独立显卡也打着高清显卡的旗帜。目前的Core i3也已经可以流畅播放高清视频,所以,最基本的流畅播放已经不是技术门槛,但是英特尔还要继续研发下去,将视频以及衍生功能继续发扬光大。
Sandy Bridge中有一个媒体处理器,专门负责视频解码、编码,并且新的硬件加速解码引擎中,整个视频管线都通过固定功能单元进行解码,这样做最大的好处就是在播放视频的时候功耗可以降低一半。
全新的视频编码引擎虽然并没有对外公布其具体细节,但是在IDF现场的一个演示片段却透露了其强大的性能。一段3分钟的1080P 30Mbps的高清视频,转换成640×360的iPhone格式,如果是一般用户的电脑可能需要几分钟,但是Sandy Bridge只需要14秒,转换速度高达400FPS,而这一切发生在大约3平方毫米的核心面积之上。并且,我们可以预计的是,英特尔还会与更多软件厂商密切合作,相信这种视频转码技术会很快得到广泛支持。
如果您有任何意见或建议,或者有问题需要向编辑咨询以及投递相关新闻线索,欢迎通过邮件(nb@pcpop.com)或微博(http://t.sina.com.cn/nbpop)与我们联系。期待与您的沟通,感谢您支持泡泡网笔记本电脑频道。■