赋能元计算多维场景!摩尔线程发布全新多功能服务器GPU产品 MTT S3000
2022年11月3日,北京——摩尔线程2022秋季发布会在北京中关村国家自主创新示范区成功举办。发布会上,摩尔线程宣布了全新的多功能GPU产品和MUSA软件栈等多项创新成果,充分展示了摩尔线程“软硬结合”的综合实力。其中,面向服务器的多功能GPU产品MTT S3000基于MUSA架构打造,能够支持DirectX、OpenGL、OpenGL ES、Vulkan、OpenCL等主流图形和计算接口,兼容CUDA,可为AI推理和训练、云游戏、云渲染、视频云、数字孪生、数字内容创作等场景提供通用智能算力支持,旨在为数据中心、智算中心和元计算中心的建设构建坚实算力基础,助力元宇宙多元应用创新和落地。
算力升级,助力元计算加速
MTT S3000搭载了摩尔线程全新的第二颗多功能GPU芯片“春晓”,包含了4096个MUSA流处理核心及128个专用张量计算核心,晶体管规模达到220亿,运行频率为1.9GHz,显存位宽256bit;搭配32GB GDDR6显存;支持FP32、FP16、INT8等多种计算精度,其中FP32算力可达15.2TFLOPS。
MTT S3000率先采用了PCIe 5.0接口,是目前GPU行业中首款支持PCIe 5.0标准的产品。PCIe 5.0所提供的高带宽不仅能提升GPU与CPU的通讯效率,更能在“多卡”部署时提供更大的核间通讯带宽,提升GPU集群的整体运算效率和性能。
MTT S3000内置MUSA智能多媒体引擎2.0和硬件虚拟化功能,能够从多个维度增强显卡的应用范围和用户的应用体验。同时,MTT S3000还提供了两组DP 1.4a显示输出接口,由此增加的显示输出能力将进一步拓展MTT S3000的业务适应性。
训推一体,为AI计算铺平道路
从数据中心向智算中心和元计算中心演进是行业算力需求发展的主流趋势,人工智能和元宇宙应用负载对GPU算力的强烈需求是推动这一演进趋势的关键力量。专为提升智能算力而设计的摩尔线程MTT S3000,在与之配套的MUSA软硬件计算平台的加持下,AI应用性能相比 “苏堤”可实现平均4倍提升。
—— MTT S3000及其配套软硬件产品,实现从算法模型到应用部署的全流程覆盖,能够为AI用户提供友好丰富的一揽子解决方案。在算法层面,摩尔线程不仅可以支持用户的自定义算法模型,同时也提供丰富的预训练模型库,赋能广大AI开发者,提升开发效率;在应用解决方案层面,摩尔线程可提供数字人、数字客服、内容生成等行业解决方案,服务金融保险、教育、医疗等相关的行业用户。
—— 在深度学习训练方面,MTT S3000兼具易用性、扩展性和兼容性等多维优势。基于MUSA软件栈,MTT S3000可实现现有算法的全面支持;能够支持包含单机单卡、单机多卡、多机多卡在内的多种训练模式。不仅如此,MTT S3000还兼容PyTorch、TensorFlow、百度飞桨(PaddlePaddle)、计图(Jittor)等多种主流深度学习框架,并实现了对Transformer、CNN、RNN等数十类AI模型的优化。
—— 在深度学习推理方面,MTT S3000支持视觉、语音、自然语音理解及多模态等多个领域主流AI模型。摩尔线程还对MUSA软件栈持续进行深度性能优化,并推出自研AI推理引擎TensorX,利用任务并发、自适应算法寻优、访存优化、算子优化等技术,大幅提升推理性能。MTT S3000可满足生物医疗、金融保险等特别强调高精度推理的行业需求,并提供出色性能。
—— 同时,借助摩尔线程开发的CUDA ON MUSA兼容方案,用户可以将CUDA上开发的代码无缝迁移到MTT S3000。
云原生GPU,算力调用更灵活高效
GPU是当前数据中心需要的关键算力,云原生技术应用在云计算、云桌面、云游戏等领域也越来越普遍。为此,摩尔线程发布一系列基于摩尔线程创新性MT Mesh 2.0的GPU云原生方案。
MT Mesh 2.0可以根据云端中心应用负载,自动化分配GPU计算和显存资源,实现GPU算力弹性伸缩。既可以将一张GPU随意切分给多个容器或虚机,也可以支持一个容器或者虚机调度多个GPU。
—— 弹性容器化GPU (sGPU):基于Kubernetes生态,使用MT Mesh 2.0实现灵活和有效调配容器化GPU资源。
—— 弹性虚拟化GPU(vGPU):使用MT Mesh 2.0,率先于行业开创了资源弹性切分技术,无需重启即可动态调配和修改GPU虚拟化资源,实现算力按需调用、动态伸缩、用完释放;引入全新的“时空切分”特性,支持硬件虚拟化(SR-IOV),安全物理分割,至高支持32路虚拟化,支持Windows云桌面GPU虚拟化,以及统信和麒麟操作系统GPU直通。
—— 安卓容器云加速技术ACX:使用GPU安卓容器透传技术和渲染编码一体化技术,可以加速安卓云手机解决方案,减少应用延迟,增加并发路数。通过原生支持OpenGL ES、OpenGL渲染框架,和ETC、ETC2等安卓游戏材质压缩算法硬件加速,可以提供更佳的安卓云游戏渲染效果和兼容特性。
视频云,助力高清视频应用和处理
MTT S3000具备强大的视频处理能力,集成了摩尔线程第二代智能多媒体引擎(MT Smart Media Engine 2.0),可以加速云端的多种音视频应用,如视频AI分析、视频会议、云游戏、云桌面和实时互动等,至高能够支持8K超高清HDR视频实时处理。
MTT S3000支持包括FFmpeg和GStreamer在内的主流音视频框架,以及不同操作系统下的通用视频加速API。摩尔线程将多功能GPU中的智能多媒体引擎与图形引擎、AI计算引擎等结合,提供丰富的SDK开发套件,大幅降低CPU负载与数据拷贝,方便开发者轻松调用,为视频云场景所需的超高清转码、智能内容生成、AI画质增强、老片修复、数字孪生、数字人等方案提供可靠支持。
软硬结合,构筑元宇宙应用基石
发布会现场,摩尔线程还发布了专为元宇宙应用构建的MTVERSE元宇宙平台及众多软硬件产品,包括基于MTT S3000打造的MCCX元计算一体机等。
MTVERSE以摩尔线程MUSA GPU集群为算力基础,为用户提供计算基础架构及服务,包括大数据、AI训练与推理、图形渲染和物理仿真三大平台,提供从硬件集群、软件基础架构到SDK工具链的全栈式解决方案,涵盖元宇宙中的人、场景和内容等多个核心要素。而上层的海量SDK工具则能帮助开发者和应用程序方便地调用这些能力,实现数字人、文献理解、语音识别、视觉识别、自然语义理解、对话交互、物理仿真、AIGC内容生成等一系列功能,进一步简化应用和解决方案的开发难度,缩短开发周期。
元宇宙将引领未来全球数字经济的发展,目前仍处在早期阶段,但随着众多商业巨头入局,中国各地政府也先后出台相关政策支持,前景无限广阔。展望未来,元宇宙必定是以图形和AI计算为核心基石的集成式应用,物理引擎、渲染引擎和AI技术的发展,很大程度上决定了元宇宙的应用演进步伐。摩尔线程将继续保持高速的GPU产品迭代创新模式,持续完善软硬件能力,通过广泛的生态合作,助推元宇宙应用创新,最终服务数字经济高质量发展。