5月26日,面壁智能公司与清华大学及OpenBMB开源社区共同宣布,最新一代端侧文本大模型MiniCPM5-1B正式发布并对外开源。该模型在AI领域备受关注。
据悉,MiniCPM5-1B凭借其精简的10亿参数,在国际权威榜单AA-Index(Artificial Analysis Intelligence Index)中表现抢眼,其性能超越了所有参数量低于20亿的模型。相较于三个月前发布的Qwen3.5-2B模型,MiniCPM5-1B不仅在效果上有所提升,还将参数量削减了一半,实现了更高效的运行。
此款模型经过INT4量化后,权重文件大小仅为0.5GB,这意味着它能够在智能手机或通过浏览器流畅运行。MiniCPM5-1B的基础模型版本由面壁智能自主研发的AI训练框架ForgeTrain预训练完成,确保了其核心技术的自主性。
目前,MiniCPM5-1B已全面开放源代码,其中包括模型的权重文件、训练数据集以及详尽的部署方案,供全球开发者和研究人员使用和参考。
