落后Intel一步 AMD集显CPU如何大翻身
泡泡网CPU频道5月20日 去年2月,Intel突然起诉NVIDIA公司,理由是双方于4年前签署的芯片组授权协议不再适用Intel新的集成内存控制器处理器(Nehalem微架构),这也就意味着Core i7/i5/i3处理器不能再搭配NVIDIA芯片组了。
i7已不可能登陆NVIDIA nForce芯片组
之后Intel与NVIDIA开始了口水战,Intel称NVIDIA芯片组违反协议,NVIDIA反驳说Intel妨碍消费者选择GPU,一时闹得满城风雨,而现在Intel集成显示核心的Westmere架构处理器已经销售多日,而NVIDIA则在桌面级显卡上忙得焦头烂额,口水战也就告一段落。
NVIDIA GTX465由GTX470阉割而来
然而随着集成了显示核心的i3-530和大受欢迎的HTPC的逐渐风靡,我们不得不思考,未来的电脑运算核心究竟是CPU将GPU收归旗下还是在并行计算方面大胜的GPU将CPU并入囊中?
2009年处理器领域逐渐显现出处理器集成GPU的方向,各大媒体也不断造势,而且在这一方面Nvidia与AMD走在了前面。
在集成GPU概念上NVIDIA与AMD走在了前面
作为处理器行业的霸主——Intel岂能坐视不管,凭借着自身的强大研发实力和雄厚的资金,Intel推出了集成了显示核心的Westmere微架构处理器,并且Clarkdale处理器目前已经销售了一个多月。
Clarkdale处理器是销售多日
尽管GPU+CPU的概念虽不是Intel第一个提出来,但Intel却是第一个做出来的,虽然Clarkdale处理器集成的显示核心是相对较弱的Intel Graphics Media Accelerator。
虽然Intel最先一批推出了相关产品,经过详细分析Clarkdale处理器的结构后,我们可以看到,这颗整合式处理器中,GPU芯片只是处在CPU芯片的一侧,换句话说,这只是简单地将CPU+GPU两颗芯片封装在了一起,而不是像AMD提出的那样把两颗芯片“融合”在一起。
Clarkdale处理器仅是简单封装
从芯片集成的大趋势上讲,这显得进步不是很大,而且与此前45nm工艺Nehalem架构的Bloomfield及Lynnfield处理器也完全不同。Bloomfield(Core i7 9XX)整合了三通道内存控制器,Lynnfield(Core i7 8XX和i5 7XX)整合了双通道内存控制器以及PCI-E控制器,而Clarkdale(Core i5 6XX和i3 5XX)除了显示核心什么都没有整合。
三大核心类型结构解析
这样说来,Clarkdale处理器实现的仅是CPU“吃”下了一半的GPU,而没有完全吞进去,而真正意义上的集成或者用说没达到AMD宣称的“融合”,看来GPU还有可能反咬一口,那么未来的“融合”又是怎样的呢?
2006年业界最大的新闻要数AMD斥重金收购了当时经营惨淡的ATI,而且在四年过去后,AMD将AMD-ATI显卡做的相当成功,目前HD 5XXX系列在桌面级显卡市场可谓是呼风唤雨。
率先支持DX11的AMD-ATI HD5870
然而AMD的处理器近期却一直未出现大的技术进步,通俗来讲,K10仅仅是K8架构的加强版,而目前的K10.5也仅仅是对K10的超频版,在市场中AMD比较大的动作要数开核了,不过这并不能算是新技术,反而更像是在Intel的步步紧逼下的无奈表现。
AMD开核只能算是无奈之举
不过近年来,AMD的口号“The future is fusion”一直很响亮,加上AMD已经明确表明未来的重点就是CPU和GPU的融合计划,那么难道在将来的融合中,如火如荼的GPU要当主角?
今年Intel的CPU+GPU整合架构处理器——Core i5/i3及新奔腾双核的上市迅雷不及掩耳,而AMD一直宣传的Fusion至今还没见到实际产品,那么这个犹抱琵琶半遮面的Fusion究竟是怎样的呢?
AMD Fusion结构
在CPU的发展过程中,基于X86技术的处理器集成了越来越多的计算单元,编程上也已经非常成熟,但是目前在视频、图形计算方面的工作量越来越大,X86技术难以应对,而GPU技术却能够很好的解决这方面的负担,并且可编程性虽不如X86技术但也越来越高,这时AMD要做的就是通过融聚技术让两者实现融合互补。
AMD或将引领业界?
去年年底,AMD宣布了第一款融聚技术——LIano,届时采用了这一技术的处理器将能够提供更大的计算密度,结合良好的编程模型,需要更大计算量的新应用就可以实现。
现在我们知道了Clarkdale处理器(Core i5/i3)和面向上网本的Pineview(新Atom)处理器都不是真正的CPU+GPU整合式处理器,而AMD的融聚处理器也看起来已经具有了如此美好的远景,那么AMD的力作——代号为LIano的APU究竟是怎样的呢?
代号为LIano的APU
由于AMD有关APU的资料出于严格保密阶段,LIano的具体情况我们还不得而知,仅仅能从一些泄露出来的非官方消息中略窥一二。
非官方的LIano信息
LIano包括了一颗四核心处理器,没有L3(可能为了节约晶体管)但拥有2M L2(每颗核心512KB)。GPU部分拥有6个SIMD引擎,如果每个引擎拥有80个流处理器(HD5000就是这个规格),那么总共就是480个流处理器。他们之间直接通过高速HT总线直连,这样做就大大降低了CPU和GPU间的数据延迟,提升了计算的效率。
在将来采用融聚技术的AMD处理器中,Bobcat定位入门级,LIano定位主流中低端,而AMD另一款Bulldozer(推土机)则定位高端,它最大的亮点就是每一颗核心拥有双倍的整数运算单元,整数和浮点为非对称设计。
AMD“推土机架构”
在一个推土模块里面有两个独立的整数核心,每一个都拥有自己的指令、数据缓存,也就是scheduling/reordering逻辑单元。并且AMD提到,这两个整数单元的中的任何一个的吞吐能力都要强于Phenom II上现有的整数处理单元。相对Intel的Core构架无论整数或者浮点,都采用了统一的scheduler(调度)派发指令,AMD的构架使用独立的整数和浮点scheduler。
AMD桌面平台路线图
现在推土机将整数调度单元增长了一倍,浮点运算的部分则维持原样。因为在AMD看来,目前存在于服务器上的80%的操作都是纯粹的整数操作,而预计未来3-5年的时间内,所有浮点运算都将会交给最擅长做浮点运算的GPU,这也就是推土机加强整数运算的真正目的。
● 总结
虽然Intel抢先发布了CPU+GPU的整合式处理器,但是由于过于仓促,还不能算是真正的集成,而AMD在继64bit、整合内存控制器、HT总线、三级缓存之后,有可能像K8时代那样再次引领业界,走在巨头Intel的前面。■<