中国大模型赛道资本热潮涌动，头部企业估值飙升迈向千亿规模

五月初，中国大模型赛道掀起一股强劲的融资热潮。5月7日，月之暗面宣布完成约20亿美元融资，投后估值突破200亿美元；紧随其后，DeepSeek据传正在筹划首轮外部股权融资，目标金额高达500亿元人民币，估值或将触及3500亿元。此外，阶跃星辰也传出近25亿美元的融资消息。短短不到48小时内，超百亿美元的资金信号密集释放，预示着中国大模型产业正经历一场前所未有的“资本盛宴”。

这场资本竞赛展现出中国大模型企业从“技术参数比拼”向“估值规模竞争”的转变，以及从“技术理想”到“战略资产”的逻辑跃迁。这一轮的资本注入规模，远超外界预期。

根据现有资料，过去半年里，国内大模型初创企业的估值呈现陡峭上升态势。月之暗面在C轮融资时估值为43亿美元，而在2026年5月最新一轮融资后，估值已突破200亿美元，半年内增长近五倍。其累计融资总额已超过376亿元人民币，成为国内大模型公司中的吸金王，超越MiniMax的150亿元和智谱的130亿元累计融资。

DeepSeek的动向尤为引人瞩目。这家曾坚持“不融资、不商业化”的公司，如今对外开启融资大门。若500亿元融资计划实现，不仅将创造中国AI企业单笔融资新纪录，其整体估值也将有望突破3500亿元。而在四月初，其估值仅约100亿美元，一个月内估值飙升五倍。DeepSeek此次融资潜在领投方包括国家集成电路产业投资基金，这暗示着大模型可能被提升到与芯片制造同等重要的国家战略高度。

一级市场的估值飙升迅速传导至二级市场。5月13日，港股大模型概念股表现强劲，智谱收盘大涨36.9%，市值首度突破5000亿港元；MiniMax上涨18.46%，市值达到2566亿港元。这两家公司今年一月才登陆港股，智谱股价在不到五个月内已翻近十倍。这种现象耐人寻味：智谱2025年全年营收不足8亿元，而同期行业老牌企业科大讯飞营收高达271亿元、净利润8.39亿元，当日总市值约1187亿元。尚处亏损的智谱，市值已近盈利稳健的科大讯飞四倍，这表明资本市场对大模型的定价逻辑已超越传统企业估值体系。

然而，资金流向并非均匀分布。据烯牛数据统计，2025年模型层公司全年仅完成22轮融资，总额94.16亿元。而2026年上半年，仅Kimi一家就吸金近400亿元。这反映出行业融资策略正从“广撒网”转向“集中下注”，头部企业获得绝大部分资源，市场留给后来者的空间正迅速收窄。

资本之所以敢于给出“天价”，核心在于国产大模型过去一年亮眼的技术表现。

在成本方面，DeepSeek通过“令人震撼”的API定价打破僵局。其V4预览版上线次日便宣布降价75%，V4-Flash低至0.0029美元/百万Token，标志着大模型正式进入百万Token普惠智能时代。据LiveCodeBench基准测评，DeepSeek等国产模型在编程性能上已接近GPT-5等国际顶尖水平，而评估成本不到国际模型的2%。这种“极低成本、高水平性能”的组合，不仅打破了“高端AI依赖海外技术”的固有观念，也迅速帮助国产大模型在全球开发者社区打开市场。

在模型能力方面，月之暗面发布的万亿参数思考模型Kimi K2 Thinking，训练成本仅约460万美元，刷新了DeepSeek-V3约560万美元的训练成本纪录。该模型在推理、编程等能力上已超越或接近GPT-5和Claude Sonnet 4.5，在多项基准测试中达到SOTA水平，并在Artificial Analysis智能指数评测中跃居全球第二。这种“极低预算训出顶尖模型”的能力，本身就是极具说服力的技术叙事。

多模态领域同样表现抢眼。智谱5月发布的GLM-5.1在Coding Agent基准评测中荣获开源模型全球第一，展示了国产大模型在实际编程场景下的SOTA级能力。开源证券研报指出，全球多模态AI加速发展，国产模型在视频、音频生成领域实现局部反超，商业化进程显著提速。

从整体技术跃迁来看，行业测算显示，中国AI核心产业规模已突破1.2万亿元，多模态理解精度提升50%，推理能力效率提高3倍，AI Agent商业化落地速度超预期。技术的“小步快跑”正转化为估值的坚实基础。当模型在编程、推理、多模态等方面能规模化地转化为生产力时，资本市场给予的估值溢价便有了底气。

回顾此次融资热潮，有趣之处不在于“谁拿了多少钱”，而在于“资本为何愿意给出如此高价”。DeepSeek和月之暗面在短时间内接连爆出的融资消息，恰好揭示了两种不同的估值逻辑。

月之暗面走的是高融资、快速商业化和全球扩张的典型路径。其估值主要依靠市场拓展和收入增长来支撑。Kimi的估值确实来源于可实现的收入预期，得益于模型能力的迭代，月之暗面年经常性收入（ARR）在四月已超过2亿美元，付费订阅和API收入加速增长。值得注意的是，Kimi K2.5大模型上线后，月之暗面的海外收入已全面反超国内，全球化不再是纸上谈兵，而是实实在在的收入来源。

DeepSeek则选择了一条截然不同的道路，将自身定位为大模型基础设施。开源意味着放弃模型层面的直接变现，极致低价则旨在通过规模效应绑定生态。资本市场对这种模式的定价，对标的是操作系统或云平台：开源模型免费推广，API低价走量，最终依托开发者的工具链依赖和企业级服务的增值空间构建长期护城河。然而这条路径并非没有代价：开源会持续消解技术壁垒，竞争对手可基于开源模型进行蒸馏、微调甚至直接商用。DeepSeek为保持生态主导地位，必须持续保持模型迭代速度领先，而每次迭代都需要巨额算力投入。

这两条路径的博弈，本质上是估值叙事从“技术理想”向“战略资产定价”的转变。在投资人看来，DeepSeek被视为“自主可控的AI基础设施”，承载着国产替代的战略价值；月之暗面则被视为“全球化商业变现的尖兵”，承载着收入和市场份额的增长预期。两笔融资反映出中国大模型的估值逻辑已经分层：既有押注生态的“操作系统梦想”，也有押注收入的“企业软件梦想”。资本市场愿意同时为这两种叙事买单，说明赛道正处于“故事可讲、资金充足、想象空间巨大”的黄金窗口期。

资本结构本身也在重塑这些公司的发展方向。从本轮融资的出资方来看，三类资本的交叉格局已然清晰：以国资为代表的“压舱石”资本，侧重安全可控和长期战略定位，对短期回报容忍度较高；以美团龙珠、华勤、中兴等为代表的产业资本，追求技术与自身业务的深度协同落地；以腾讯、阿里为代表的互联网战略投资方，则着眼于生态补位和算力绑定。这种多层次的资本构成，为大模型企业提供了更坚实的基础，但也意味着不同资方对回报周期和战略方向各有诉求，平衡各方利益成为创始人团队的新挑战。

尽管技术强大、估值高企，最终仍需回归一个朴素的商业问题：盈利模式何在？

从最新财报数据看，头部国产大模型已走出“纯烧钱”阶段，开始提交可量化成绩单。2025年，智谱实现营收7.24亿元，同比增长132%，成为国内收入规模最大的大模型公司。更关键的是，其MaaS API平台年经常性收入（ARR）达到17亿元，同比飙升60倍，毛利率提高近五倍至18.9%。这表明模型即服务（MaaS）的商业模式已在中国跑通，API调用正从“烧钱获客”转变为“造血增长”的正向循环。

商业模式上，两条路径日益清晰：一类是像智谱这样深耕国内企业服务，以本地化部署和垂直行业解决方案为主力营收；另一类是像MiniMax这样走全球化路线，凭借成本优势抢占国际市场，2025年该公司73%的收入来自海外。MiniMax M2.5模型发布时价格仅为Claude Opus、Gemini 3 Pro等主流模型的1/10到1/20，这种极具竞争力的定价策略，正助力国产模型在全球开发者生态中快速渗透。

从宏观层面看，过去大模型的价值主要体现在“技术突破”，现在已转向“产业落地”。2025年下半年，中国企业级大模型日均调用量飙升至37万亿Token，较上半年增长263%。当每天有数万亿Token在真实业务场景中流转，大模型的商业化不再是“概念炒作”，而是实体经济的数字血脉。

然而，我们也需保持清醒。高速增长的营收背后，亏损依然是无法回避的问题。2025年，智谱净亏损达47.18亿元，MiniMax经调整净亏损也高达17亿元。算力采购、研发投入、人才薪酬等高昂成本短期内难以大幅削减。对投资人而言，他们押注的并非当下利润率，而是未来规模效应真正发挥作用时，当前的“战略性亏损”能否转化为未来的“结构性盈利”。这场赌局的结果，可能还需要两到三年才能见分晓。

如果说前两年是大语言模型的主场，那么2026年的发展重心正向多模态和智能体两大方向延伸。

首先是多模态。从技术趋势看，以Google Gemini Omni为代表的统一基座全模态模型的问世，标志着行业进入新阶段。国内厂商也加速布局，阶跃星辰、智谱等均在多模态赛道持续发力。东吴证券认为，多模态是终端AI当前最重要的迭代方向之一，终端设备自带摄像头、麦克风等多元输入系统入口，使其多模态能力能更直接地对接真实使用场景。更重要的是，多模态正开启新的商业化空间。开源证券测算，仅国内视频消费场景每日所需Token就可能达到350万亿。多模态大模型能深度赋能内容生产、营销、工业制造等领域。只要AI在工作流中创造的价值高于Token成本，其需求潜能便无限广阔。从豆包三月实现两年千倍增长，到智谱三月ARR同比增长60倍，Token调用量的指数级增长印证了这一判断。

其次是智能体。若将大模型比作“大脑”，智能体便是“手脚”。从对话到执行，是AI从“聊天机器人”到“生产力工具”的关键跨越。无问芯穹等算力基础设施服务商正构建企业级智能体服务平台，为不同行业场景提供解决方案。智谱的企业级智能体业务收入同比增长248.8%，增速远超整体营收。Kimi K2.6模型在长程编码和Agent自主化执行能力方面显著增强。可以预见，2026至2027年，“能干活的大模型”将成为新的竞争焦点。

此外，随着国资和产业资本的深度介入，大模型的发展正从单一的“烧钱游戏”转向更具产业深度的“生态系统建设”。DeepSeek与国家集成电路产业投资基金的合作，预示着国产算力与国产模型的协同闭环正加速形成。当“国产芯片+国产模型”的自主路线打通，中国大模型的估值故事便增添了一个极具分量的战略维度。

2026年5月的这轮融资热潮，为国产大模型赛道打上了“千亿估值俱乐部”的标签。但从更长远看，这场资本盛宴的真正意义，不在于催生多少亿万富豪，而在于它标志着一个根本性转变：国产大模型正从“技术乌托邦”走向“战略资产定价”，从“实验室里的参数比拼”走向“商业世界的价值兑现”。

“高考”尚未结束，真正的考验在于：当资本热潮退去，哪些模型能构建可持续的商业模式？哪些公司在经历“烧钱换规模”后能实现盈利？国产大模型能否从“追赶者”变为“引领者”，在全球AI格局中占据一席之地？这些问题尚无定论。但有一点可以确定：中国大模型正以真金白银的估值，回应曾被无数人质疑的问题——我们不仅能实现技术突破，还能将其发展成为一个值得千亿级押注的商业领域。