← 返回新闻列表

MiniMax 预告推出全新 M3 系列人工智能模型

上海稀宇科技有限公司(MiniMax)近日通过 X 平台发布消息,预告其即将S推出 M3 系列人工智能模型。此前,公司回顾了在学术平台上发表的关于 M2.x 系列模型的论文,该系列模型以“低激活、高智能”为特色,展现了在参数效率和智能表现上的创新。新系列模型的发布,预示着 MiniMax 在人工智能领域将有新的突破。

文 / 编辑部 · 2026/05/27 · 阅读约 2 分钟

分享:
MiniMax 预告推出全新 M3 系列人工智能模型

上海稀宇科技有限公司(MiniMax)近期在社交平台 X 上发布了一则消息,预告了其即将推出的 MiniMax M3 系列模型。此番预告也回顾了该公司于 5 月 26 日在学术平台 arXiv 上发布的一篇题为《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》的论文,该论文详细介绍了 MiniMax M2.x 系列模型的工作原理和核心技术。

该论文披露,MiniMax M2.x 系列模型虽然总参数量达到 229.9 亿,但其独特之处在于每个词元仅激活 9.8 亿参数,充分体现了“低激活、高智能”的设计理念。该系列模型配备了 192K 的上下文窗口,并使用了高达 29.2 万亿词元的预训练数据。

在模型架构方面,M2 系列采用了 62 层的解码器式 Transformer 结构,并集成了 256 个细粒度专家,实现了每个词元激活 8 个专家的并行处理模式。

针对训练系统,MiniMax 自主研发了名为 Forge 的强化学习系统。这一系统支持白盒和黑盒智能体统一接入,通过将训练、推理与智能体功能解耦,并结合窗口化 FIFO 调度、前缀树合并以及推理加速等技术,显著降低了长轨迹训练的成本。

M2.7 版本最引人瞩目的进步在于其初步展现的“自我进化”能力。该模型已经能够自主识别训练失败、解析日志、修改脚手架代码,并在内部任务中完成了多达 100 轮的自主迭代。

论文指出,这套系统目前已承担了团队日常迭代工作量的 30% 到 50%,并在内部编程脚手架优化中将性能提升了 30%,这标志着模型已开始参与到自身开发的闭环流程中。

广告位 · 文末横幅