针对AI优化,性能与能效大幅提升 Arm发布全新终端子系统
AI现在已经成为科技行业新的方向,AI智能手机以及AIPC广泛出现,为用户带来了更便捷高效的使用体验。AI体验与设备的性能有着密切的联系,今年AI终端的大量普及离不开设备性能的提升,而作为产业链最上游的Arm,则为AI终端的性能升级提供了基础。
随着AI技术的快速发展,为提供领先的AI体验,助力芯片合作伙伴更轻松、快速地构建基于Arm架构的解决方案,并加速其产品上市进程,Arm日前正式推出了全新的Arm计算平台——Arm终端计算子系统(CSS)。Arm终端CSS不仅具备更强大的CPU与GPU,同时也首次为Arm CPU 和 GPU 交付物理实现,这让构建和部署Arm架构的解决方案变得更加简单。
此前Arm大多数的IP是通过RTL形式进行交付,类似于软件,主要是对IP产品进行描述,后续还需要通过EDA工具流,方可将RTL形式变为实际的芯片布局。而Arm 所交付的物理实现则依然是近似于软件的形式,但基本上显示了设计中的晶体管和线路等,这样可以帮助合作伙伴节省时间,从而实现更佳的性能和效率。
在2021年,Arm推出了专为性能和AI而设计的Armv9构架,Armv9 在过去几年中得到了显著提升,其中包括:提高在矢量加速、机器学习 (ML) 等领域的计算能力;增强系统的安全性和稳健性;更重要的是,增加了面向 AI 的功能。
而Arm终端CSS将物理实现与Armv9的AI优势结合在一起,为合作伙伴生态系统带来所需的性能,并且加速其产品上市进程。 Arm终端CSS整合了全新的Armv9 CPU 和Immortalis GPU,新的 CoreLink 系统互连和系统内存管理单元 (SMMU),并优化到内存及 SoC 其他部分的计算路径,为业界提供领先的性能。而且,这是Arm首次在终端领域以 Arm CPU 和 GPU 的优化设计形式提供物理实现解决方案。
Arm终端CSS提升了 30% 以上的计算和图形性能,以应对要求苛刻的实际用例中的安卓工作负载,同时也提高了59%的AI推理速度,适用于更广泛的AI/机器学习 (ML)和计算视觉工作负载。
CPU方面,此次推出了 Arm Cortex-X925,该CPU针对三纳米工艺进行了优化,实现了性能和效率的提升,在3.8GHz的时钟速率和2MB缓存大小的条件下,与 2023 年旗舰智能手机的四纳米 SoC 相比,Geekbench的单线程性能提升了36%。
AI方面,得益于微架构的优势,实现了50%TOPS数的提升,以AI性能为例,与去年的Cortex-X CPU相比,词元 (Token) 首次响应时间提高了41%,从而使得LLM的初始响应能力有了显著改善。
体验方面,具备Cortex-X925的终端CSS进一步提升了安卓设备应用上的性能体验,例如在网页浏览器方面,可以带来23%的性能提升,除了Chrome,中国手机厂商也将这些提升应用到了自身的浏览器中。
同时,Arm也带来了Cortex-A725,与A720相比,Cortex-A725 的能效提高了35%,这得益于Arm对微架构的改进。随着工艺和物理实现的提升,Arm的“小核”Cortex-A520的能效也提升了15%。
GPU方面,Arm带来了性能更强、效率更高的Immortalis-G925,在各种图形应用上,Immortalis-G925的性能同比提高了37%;而在多个AI/ML网络上进行测量时,实现了约34%的性能提升。针对光线追踪技术,Immortalis-G925提高了光线追踪技术在面对复杂物体时的表现,其性能提升高达52%。
凭借着全新CPU与GPU的性能与能效提升,在游戏方面的图形效率也得到了提升,例如在提供与去年终端平台相同水平的游戏性能下,《堡垒之夜》等手游的功耗可以降低30%。
Immortalis-G925未来将面向旗舰智能手机市场,而包括Arm Mali-G725和 Mali-G625 GPU在内的全新高可扩展性GPU系列,则面向从高端手机到智能手表和 XR可穿戴设备等广泛的消费电子设备市场。
据悉,联发科将会在今年下半年推出新一代天玑9400移动平台,该芯片将会搭载Arm Cortex-X925 CPU和Arm Immortalis-G925 GPU。
针对开发者,Arm也带来了Arm Kleidi,其中包括面向AI工作负载的KleidiAI和面向计算机视觉应用的 KleidiCV。KleidiAI是一套面向 AI 框架开发者的计算内核,使他们能够在各种设备上轻松获得Arm CPU上的出色性能,并支持Neon、SVE2和SME2等关键Arm架构功能。KleidiAI与PyTorch、Tensorflow、MediaPipe 等热门AI 框架集成,旨在加速Meta Llama 3、Phi-3 等关键模型的性能,并且还可前后兼容,以确保Arm在引入更多技术时依然能适用未来市场的需求。