面壁智能与清华大学、OpenBMB 开源社区今日共同宣布,正式推出并开源了其在低比特大模型训练领域的重要进展——BitCPM-CANN。
据悉,这是中国首个在华为昇腾国产算力平台实现端到端训练,并对外开放的三值(1.58-bit)大模型。从量化算子、训练算法到完整的全链路框架,BitCPM-CANN 的所有开发过程均在华为昇腾上原生完成。该系列模型涵盖了 0.5B、1B、3B、8B 四种尺寸,经与同尺寸 MiniCPM4 全精度系列的逐项对比评测,其性能表现令人瞩目。
BitCPM-CANN 在推理阶段相较于传统的 BF16 精度,能够释放约 6 倍的显存优势,同时模型能力保留率维持在 90% 至 97.2% 的高水平。
对于移动终端产业而言,这一 6 倍的显存红利意义重大。这意味着一个拥有 8B 参数的 BitCPM-CANN 大模型,将能够轻松地在当前市场主流的旗舰智能手机上流畅运行。
此外,面壁智能基于 MindSpeed 与 Megatron-LM 搭建了一套完整的低比特训练核心基础设施。这套系统集成了环境适配、32K 长序列支持、并行策略以及融合算子等全面的工程能力。自此,所有面向昇腾进行的低比特训练工作,均可依托于这一统一的公共基础设施进行。
目前,BitCPM-CANN 系列包括 0.5B、1B、3B、8B 的全系列模型权重已面向公众开源。
