国产深度握手:摩尔线程全功能GPU获得百度飞桨III级兼容性认证
摩尔线程旗下AI训推一体智算卡MTT S5000已成功完成与百度飞桨(PaddlePaddle)深度学习平台的III级兼容性测试,双方系统运行稳定可靠。当前Paddle-MUSA算子适配率高达91%,覆盖大语言模型、OCR、图像分类、目标检测、图像分割、推荐系统等主流应用场景,为上述核心领域提供了稳定的运行基础。
百度飞桨(PaddlePaddle)是百度自主研发的产业级开源深度学习平台,也是国内首个自研深度学习框架。该平台致力于降低深度学习技术的创新与应用门槛,提供从模型训练到多端部署的全流程支持,截至2025年底已拥有超过2300万开发者,服务76万家企业。

本次适配工作完整覆盖了PaddlePaddle主框架的最新接口及算子注册体系,加深了Paddle-MUSA与飞桨主线开发版本的协同能力。
在工程效率方面,Paddle-MUSA现支持PaddlePaddle最新联合编译模式,开发者可在同一工程流程中完成主框架与MUSA后端的协同编译、安装与验证,有效降低构建成本,提升版本联调效率。
在技术架构方面,Paddle-MUSA建立了规则化适配机制,用轻量、可复用、可回放的规则替代传统大规模补丁或整文件覆盖方式,系统性地解决MUSA算子库与CUDA生态接口间的差异化适配难题。该机制使PaddlePaddle主线版本升级时只需维护必要的MUSA语义差异,无需引入大量上游源码副本,降低了代码合并冲突和回归风险。
凭借上述能力,本次PaddlePaddle最新版本适配周期已缩短至约2人天,大幅提升版本跟进效率和工程交付确定性。
目前,Paddle-MUSA已完成多类典型模型的适配与验证,部分代表性模型包括:
- 大语言模型与多模态模型:ERNIE-4.5、LLaMA、PaddleOCR-VL等;
- OCR系列模型:PP-OCRv3、PP-OCRv4、PP-OCRv5等;
- 视觉分类模型:AlexNet、VGG11、ResNet18、ResNet50、PP-LCNet、PP-HGNetV2等;
- 检测、分割与姿态估计模型:SOLOv2、OCRNet、DMNet、UNet、PP-TinyPose等;
- 检索与识别模型:PP-ShiTuV2、MobileFaceNet等;
- 推荐系统模型:DLRM、DeepFM等。
此次III级兼容性认证标志着国产算力与国产深度学习平台的技术协同实现实质性突破,Paddle-MUSA持续拉近摩尔线程全功能GPU与飞桨开发者的距离,为国内AI社区提供了自主可控、高效稳定的开发方案。摩尔线程将继续深化与飞桨的合作,推动国产AI生态繁荣发展。