5月27日,面壁智能公司在清华大学和OpenBMB开源社区的协作下,正式对外发布了名为ForgeTrain的创新成果。此框架的独特之处在于,它是全球第一个完全由AI独立编写,且在整个开发过程中没有人类代码介入的生产级别大型模型训练框架。
据悉,面壁智能已利用ForgeTrain框架,在华为昇腾芯片平台上成功完成了其最新一代“小钢炮”MiniCPM5-1B模型的预训练。经过性能评估,MiniCPM5-1B模型在全球同等规模模型中表现出领先的综合性能,在AA排行榜上,其在2B规模以下的模型中位列榜首。
官方指出,此次发布标志着“由AI自主生成训练框架,在国产芯片上高效运行,并最终训练出顶尖AI模型”的完整技术链条已被成功打通。
ForgeTrain框架已全面开源,其中包括完整的预训练框架代码。此外,同步发布的还有Agent Harness,这是一个用于生成ForgeTrain的完整工具链,它涵盖了评估标准、测试规范以及智能体编排方案。这意味着任何团队都可以依据此工具链,复现从逐比特对齐到超越现有性能的全过程。
