X86架构的GPU?解读Larrabee规格特性
分享
首先要说明的是,larrabee并不是传统意义上的GPU,本质上讲,它就是CPU,由多颗X86架构的CPU通过环形总线并行组成,接替传统GPU的功能。
从上图我们可以看到,在Larrabee的内部,每一个处理核心都可以发出2条指令,这种架构是继承了最初的奔腾处理器的设计。在老奔腾的基础上,Intel的工程师们也作了许多修改和提升。首先让老Pentium核心可以支持64bit指令处理,提升了x86指令集的处理,为处理核心加装了更大容量的高速缓存。另外还支持4路SMT/Hyper Threading超线程和16路矢量ALU算数逻辑单元。
类似IBM的cell处理器,Intel吸取了一些经验来设计Larrabee。为了避免高频带来的困扰,发热量加大,功耗升高等,Larrabee的设计思路是多路并行,即通过多核心来提高性能。
通过上表我们可以比较Core2与Larrabee的数据吞吐量,理论上说明每个时钟周期之内,多核心处理器可以处理更多的数据和指令。运行一个单一的指令流,例如单指令的应用程序,那么Core 2处理器每个时钟周期可以执行4次操作,每个时钟周期可以发出4条指令,但是执行单元无法在每个时钟周期内执行4条指令。在10核心的架构中,尽管它每个时钟周期仅仅可以发出2条指令。在一个单指令流的程序中,它的峰值是每个时钟周期2次操作。仅有Core 2处理器的一半。但Core 2处理器只有2个处理核心,每个核心在每个时钟周期内可以执行4个SSE指令,那么Core 2总计每个时钟周期可以进行8次操作。但是具备10核心的Larrabee就大不一样了。它每个时钟周期可以执行160次操作,这相当于20倍Core 2的数据吞吐量。
0人已赞