MUSA SDK

立即下载

MUSA SDK 是摩尔线程 MUSA 软件开发集成套件,提供完整的基于摩尔线程 GPU 的 MUSA 并行计算和人工智能开发、运行环境。借助 MUSA SDK,开发者不仅可以在嵌入式系统、桌面工作站、企业数据中心及云端平台上轻松开发、优化和部署 GPU 加速的应用程序,还能构建强大的人工智能算力计算、存储和网络软件基础设施,全面提升系统的性能和效率。

MUSA SDK 架构


关键能力


AI 训练

MUSA SDK 为开发者提供了一套高效、灵活的工具集,使得在 MUSA 架构上开发人工智能应用变得更加简便。借助 MUSA SDK,开发者可以充分利用高度并行的计算能力,轻松实现深度学习模型的训练和推理。SDK 提供了丰富的 API 和示例代码,支持主流深度学习框架,帮助开发者快速上手并集成复杂的算法和模型。

AI 推理

基于 MUSA SDK 构建的 MT Transformer 和 TensorX 推理框架,开发者可以充分利用 MUSA 架构的高性能计算能力,实现快速高效的模型推理。MUSA SDK 提供了简洁易用的 API,使开发人员能够轻松加载和运行预训练模型。此外,SDK 内置的优化策略显著加速了推理过程,极大地提高了响应速度和吞吐量。
了解详情

数字孪生

基于 MUSA SDK 开发的数字孪生功能,通过创建物理实体的数字副本并结合实时数据分析,为各行各业提供深刻的洞察和支持。该功能不仅能够提高运营效率和降低成本,还能在设计和决策过程中提供有力依据,推动数字化转型与创新。

科学计算与物理仿真

通过 MUSA SDK,能够高效地执行如有限元分析、流体动力学等计算密集型模拟,显者提高仿真精度与效率。此外,MUSA SDK 生态系统中丰富的库和工具 (如 muBLAS、muFFT、muThrust 等) 简化了开发流程,帮助研究人员快速构建和验证新模型,加速科学研究和技术创新。

MUSA 开发语言

作为一种创新的并行编程模型,MUSA 开发语言旨在充分利用现代多核 CPU 和众核 GPU 的并行计算能力。GPU 凭借大规模并行计算隐匿内存访问延迟,相较于传统依赖大型缓存和复杂流量控制的方式,极大提高了数据处理效率。 为进一步提升整体性能,MUSA 支持 CPU 与 GPU 的协同运作,助力开发者打造同时包含并行与顺序部分的应用程序。MUSA 的核心设计在于可扩展性,能够无缝增强应用程序的并行能力,轻松应对处理器内核数量的不断增加。 对于熟悉 C 语言等标准编程语言的开发者而言,MUSA 提供了一个简洁易懂、易于上手的开发环境,使其能够高效开发出适配多种硬件架构的并行软件。

核心功能


CUDA 完美替代

MUSA 的编程模型与编程接口具备出色的兼容性,可无缝替代 CUDA,赋能开发者快速复用 CUDA 的知识、经验和源码

muDNN

muDNN 是基于 MUSA 开发的深度神经网络的计算加速库。在摩尔线程 GPU 上进行深度优化,显著提升了计算性能和效率

MUSA-X 计算库

一套专为开发者设计的库,旨在加速人工智能、数据科学和数学应用程序的开发与运行

了解详情
MCCL 通信库

摩尔线程集合通信库(MCCL)为摩尔线程 GPU 和网络进行了性能优化,提供了多 GPU 和多节点通信基元

MUSA 编译器

高性能 MUSA 语言编译器,能够快速生成 GPU 设备代码,加速高级语言的计算任务

支持 Triton

muTriton 实现了摩尔线程 GPU 对 Triton 语言编译器的完整支持,使用户开发的 Triton 计算核心能够高效地运行在摩尔线程 GPU 上

成功案例


MUSA 加速冷冻电镜

借助摩尔线程 MUSA 软件栈强大的 CUDA 兼容能力和完备的数学库支持,德锐特成功将冷冻电镜领域的关键软件 RELION5 迁移至 MUSA 平台上。迁移后的软件不仅实现了与国际先进 GPU 相媲美的数据精度,同时也充分验证了国产 GPU 在高端生物科技应用中的潜力。

MUSA 助力夸娥智算集群

MUSA SDK 作为夸娥智算集群的核心底层软件,有力推动了集群功能与性能的全面升级,具体优化包括:稠密模型集群训练 MFU 峰值提升至 68.3%,新增对 Triton 2.1.0 的支持及提供多项大模型训练与推理的全新特性。目前,夸娥智算集群已全面支持超过 600 种大模型的训练与推理需求。

MUSA 助力文生图应用-摩笔马良

MUSA SDK 作为摩笔马良的核心软件基础,与夸娥智算集群共同构建了强大的算力底座,赋能 AIGC 内容创作。凭借卓越的图形和 AI 计算能力,MUSA SDK 成功部署了自研大语言模型 MUSAChat,显者提升了 Prompt 工程中的文本润色和翻译精度,增强了语义理解能力。此外,MUSA SDK 灵活调用 SDXL 和 SD1.5 模型,生成细节丰富、艺术感十足的视觉作品,完美融合科学与艺术的灵感。

生态建设

摩尔线程致力于构建一个完善且好用、易用的国产 GPU 应用生态,MUSA 既可以自主发展,又兼容主流开放生态。同时,我们还在积极发布开源加速库和模版库,降低基于 MUSA 的开发门槛,提升开发效率。

了解更多

相关产品

  • MTT KUAE

    摩尔线程智算中心全栈解决方案

    基于大模型智算加速卡和 AI 大模型训推一体机,以一体化交付的方式解决大规模 GPU 算力的建设和运营管理问题。

    查看详情
  • MCCX D800 X1

    AI 大模型训推一体机

    采用 MTT S4000 高性能 GPU,支持用户在大型语言模型、自然语言处理、系统推荐、数据分析等领域的应用需求。

    查看详情
  • MTT S4000

    大模型智算加速卡

    针对万亿规模大语言模型的训练、微调和推理定制优化,融合先进图形渲染、视频编解码及超高清显示能力,助力多场景的计算加速。

    查看详情
  • MTT S3000

    从开发到部署 加速元计算全场景应用

    包含 4096 个 MUSA 核心、128 个专用张量计算单元,可为 AI 推理和训练、云手机、云渲染、视频云等场景提供通用智能算力支持。

    查看详情
人工
客服
400-667-5666

周一至周日,9:00-21:00