性能差一倍!内存对APU性能影响测试
GPU对显存带宽的渴求比CPU高,性能越强需求就越高,这也就是独显为什么需要256bit以上的显存位宽、采用GDDR5超高频率显存的根本原因。AMD要在APU当中整合主流级高性能显卡,那么就必须解决共享显存的问题。
Llano APU内部整合了一个双通道DDR3内存控制器,单条DDR3内存是64bit双通道就是128bit,基本上可以满足主流独显的位宽要求了。这个128bit控制器也要消耗不少的晶体管,CPU和GPU合用的话可以最大化资源利用。
整合式内存控制器可以将内存延迟降到最低,此前Intel和AMD都将内存控制器整合在了CPU内部,其优势是显而易见的。不过集成显卡的待遇就没有这么高了,以往的整合显卡都在北桥之中,需要往共享内存中读写数据的话,必须通过前端总线向CPU发出请求,然后再返还,数据带宽和延迟都不甚理想。
Llano APU内存控制器示意图
APU就不存在这个问题了,CPU和GPU在内存控制器面前是平等的,都是直接相连,带宽可以最大化利用,延迟可以降到最低。不过共享内存控制器的话,就涉及到争抢带宽的问题了,实际分配到的带宽要比理论值低,尤其是在CPU和GPU负载都很高的情况下。
但共享内存还有一个最大的好处,那就是APU最擅长的异构计算,当CPU和GPU做大规模并行计算的话,存取的数据都在内存当中,交换数据无需绕过漫长的总线,也无需在内存与显存之间徘徊。共享式内存可以消除CPU与GPU之间最大的瓶颈。
针对笔记本平台的Llano APU,接口封装为Socket FS1,最高可以支持到双通道DDR3-1600,最大32GB容量,理论内存带宽25.6GB/s,可兼容1.5V标准电压内存条或者是1.35V低压内存条。
针对台式机平台的Llano APU,接口封装为Socket FM1,最高可以支持到双通道DDR3-1866,最大64GB容量,理论内存带宽29.8GB/s。值得质疑的是,DDR3-1866的频率仅在插两条内存的情况下才能达到,如果插满4条内存的话,官方最高只能支持到DDR3-1600的频率。