1. 产品
  2. 解决方案
  3. 体验中心
  4. 服务与支持
  5. 驱动下载
  6. 开发者
  7. 公司信息
MTT KUAE

MTT KUAE

摩尔线程智算中心全栈解决方案

MTT KUAE 是摩尔线程智算中心全栈解决方案,基于 MTT S4000 和双路 8 卡 GPU 服务器 MCCX D800,以一体化交付的方式解决大规模 GPU 算力的建设和运营管理问题。

快速交付

集群建设周期只需 30 天

最佳实践

计算、存储、网络的全面优化

开箱即用

完整的工具和软件栈

高性能

支持千亿规模模型的分布式训练

软硬一体 开箱即用

MTT KUAE 全栈解决方案以全功能 GPU 为底座,是软硬一体化的全栈解决方案,
包括以 KUAE 计算集群为核心的基础设施、KUAE Platform 集群管理平台以及 KUAE ModelStudio 模型服务,
旨在以一体化交付的方式解决大规模 GPU 算力的建设和运营管理问题。

核心能力

MTT KUAE 全栈解决方案能够充分发挥摩尔线程 GPU 的优势。

产品组合


MTT KUAE 核心组件


MTT KUAE Platform

MTT KUAE Platform

用于 Al 大模型训练、分布式图形渲染、流媒体处理和科学计算的软硬件一体化平台,深度集成全功能 GPU 计算、网络和存储,提供高可靠、高算力服务。
通过该平台,用户可灵活管理多数据中心、多集群算力资源,集成多维度运维监控、告警和日志系统,帮助智算中心实现运维自动化。

MTT KUAE ModelStudio

MTT KUAE ModelStudio

覆盖大模型预训练、微调和推理全流程,支持所有主流开源大模型。
通过摩尔线程 MUSIFY 开发工具,可以轻松复用 CUDA 应用生态,内置的容器化解决方案,则可实现 API 一键部署。
该平台意在提供大模型生命周期管理,通过简洁、易操作的交互界面,用户可按需组织工作流,大幅降低大模型的使用门槛。

MTT KUAE 解决的关键问题


GPU 算力的大规模搭建
模块化设计,灵活部署

GPU 算力的线性
加速比优化

高速参数传递
网络的搭建

异构计算集群的
搭建和调度

算力服务支持系统
的设计与建设

云原生 GPU 集群调度
与弹性算力

计算和存储的可靠性
与安全性

高可靠性
自动问题诊断和恢复

集群计算单元 MCCX 一体机


MTT KUAE 集群规格


GPUs

1024

FP16 算力

100P

总显存

48TB

Bi-section 带宽

25.6TB

GPUs

2048

FP16 算力

200P

总显存

96TB

Bi-section 带宽

51.2TB

GPUs

3096

FP16 算力

300P

总显存

144TB

Bi-section 带宽

76.8TB
人工
客服
400-667-5666

周一至周日,9:00-21:00