面壁智能联合清华开源首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

面壁智能携手清华大学及OpenBMB开源社区，发布了低比特大模型训练的最新成果BitCPM-CANN。作为国内首个完全在华为昇腾国产算力平台上完成端到端训练并开源的三值大模型，BitCPM-CANN包含了0.5B到8B四种不同规模模型，并在性能表现上取得了显著进步。

文 / 编辑部 · 2026/05/25 · 阅读约 2 分钟

面壁智能与清华大学、OpenBMB 开源社区今日共同宣布，正式推出并开源了其在低比特大模型训练领域的重要进展——BitCPM-CANN。

据悉，这是中国首个在华为昇腾国产算力平台实现端到端训练，并对外开放的三值（1.58-bit）大模型。从量化算子、训练算法到完整的全链路框架，BitCPM-CANN 的所有开发过程均在华为昇腾上原生完成。该系列模型涵盖了 0.5B、1B、3B、8B 四种尺寸，经与同尺寸 MiniCPM4 全精度系列的逐项对比评测，其性能表现令人瞩目。

BitCPM-CANN 在推理阶段相较于传统的 BF16 精度，能够释放约 6 倍的显存优势，同时模型能力保留率维持在 90% 至 97.2% 的高水平。

对于移动终端产业而言，这一 6 倍的显存红利意义重大。这意味着一个拥有 8B 参数的 BitCPM-CANN 大模型，将能够轻松地在当前市场主流的旗舰智能手机上流畅运行。

此外，面壁智能基于 MindSpeed 与 Megatron-LM 搭建了一套完整的低比特训练核心基础设施。这套系统集成了环境适配、32K 长序列支持、并行策略以及融合算子等全面的工程能力。自此，所有面向昇腾进行的低比特训练工作，均可依托于这一统一的公共基础设施进行。

目前，BitCPM-CANN 系列包括 0.5B、1B、3B、8B 的全系列模型权重已面向公众开源。