大模型领域涌现投资热潮，DeepSeek等头部公司估值飙升

今年，大模型公司面临的最大变化之一是DeepSeek也开始进行融资，这标志着即使是理想主义者梁文锋，其认知也迈向了新的阶段。不过，与多数模型公司不同，梁文锋此次融资并非为了迅速商业变现。据知情人士向彭博社透露，梁文锋在与投资者沟通过程中承诺，DeepSeek将优先聚焦技术突破，致力于实现通用人工智能（AGI）这一宏伟目标，而非短期盈利或商业化。

除了DeepSeek，Kimi、阶跃星辰等公司同样受到资本的青睐，甚至已登陆二级市场的智谱和MiniMax在今年上半年也实现了估值的数倍增长。在过去三年中，大模型投资已经历了两轮资本高峰。当前这一波资本热潮无论从参与机构数量、募资金额还是决策速度来看，都显得更为迅猛和集中。尽管投资人对不同模型公司的评估标准各异，但一个共同的认知正在形成：人工智能将带来范式革命，而顶尖模型公司将成为未来产业核心。

众多投资者排队等候，希望能够入股DeepSeek。一位资深投资机构的投资人李思扬透露，近期有许多通过各种渠道找到他，表示希望投资DeepSeek的潜在有限合伙人（LP），保守估计涉及的资金规模至少有40亿元，这足以说明市场的热度。今年4月，DeepSeek融资消息传开后，立即在投资圈引起巨大反响。一线投资机构的专业人士们纷纷利用自身资源，试图打探DeepSeek融资的核心信息。甚至许多对融资细节知之甚少的DeepSeek普通员工，也收到了大量投资人的会面请求，梁文锋本人更是如此。一位DeepSeek员工表示，他甚至不敢轻易外出。

高信资本的创始合伙人兼董事长曹斌在接受采访时直言不讳地表示：“如果有机会投资DeepSeek，我们非常乐意。”然而，大部分财务投资者并未进入DeepSeek的考虑范围。据4月23日的独家报道，DeepSeek本轮融资估值高达3000亿元人民币，约合440亿美元。此次融资并非面向普通财务投资者，主要以国家定向基金为主，对LP的身份设定了特定要求。李思扬所在的投资机构曾通过高层渠道了解DeepSeek的融资情况，但因其严苛的融资条件而被拒之门外。

李思扬指出：“如果DeepSeek降低门槛，无论需要多少资金，都能轻易找到。谁都清楚，DeepSeek在3000亿估值下，仍具备巨大的投资价值。”她拥有海外名校计算机专业背景，凭借敏锐的技术洞察力，近年来积极参与了国内外多家头部模型公司的融资。去年Kimi宣布融资时，她就积极推动其所在机构连续多轮认购Kimi的股份。大模型的竞争核心在于人才、资金、算力等全方位的较量。一个万亿参数级别的模型训练，涉及硬件、算法、数据和电力等诸多方面，仅GPU硬件投入就需数亿美元起步。经过三年多的激烈竞争，能够继续在牌桌上坚持下来的独立通用模型厂商寥寥无几，除了DeepSeek和Kimi，还包括AI“六小虎”中的阶跃星辰，以及已上市的智谱和MiniMax。未来很难再有新的模型公司能够加入战局。对于充满错失恐惧感（FOMO）的投资者而言，顶级模型公司的稀缺性意味着，无论最终抓住哪一家，都可能代表着这一轮AI时代最后的上车机会。

今年3月，Kimi启动新一轮融资，原计划募资10亿美元，最终超募至20亿美元，估值在短短三个月内翻了四倍多。4月，一家专注于汽车科技领域的产业投资机构合伙人四处打听印奇的联系方式，希望直接投入一亿元参与投资。尽管他没有进行尽职调查，对AI了解也不多，但他坚信“只要上市，阶跃星辰的估值就能达到2000亿。”智谱和MiniMax上市后，资本市场对“大模型核心资产”的追捧进一步升温。这两家公司在二级市场的估值一度飙升5至7倍，再次点燃了整个行业的FOMO情绪。目前国内尚未上市的几家头部模型公司中，除了DeepSeek之外，Kimi和阶跃都已不同程度地释放了IPO计划或资本化信号。

随着二级市场不断给出高溢价反馈，一级市场对大模型公司的估值逻辑也因此水涨船高。阶跃星辰紧随Kimi的融资步伐，于5月8日宣布完成最新一轮25亿美元融资。加上今年1月启动的Pre-IPO轮融资获得的50亿人民币，阶跃星辰的估值在短短三个月内实现了翻倍。募资流程中弥漫着乐观情绪，投资决策速度也显著加快。传统的风险投资通常需要漫长的周期和详尽的尽职调查，但现在从LP到GP，尽调时间都非常有限。市场上能够直接获得份额的大型投资机构，不得不先行锁定部分份额，一边进行尽调一边募资，甚至被迫参与两轮乃至多轮投资。

去年底，一家投资机构已获得一家模型公司的部分份额，仅差800万美元即可完成。为此，他们举办了一次路演，路演结束后不到24小时，所有资金便已到位。现场LP的热情高涨，甚至在尚未签署投资协议的情况下便完成了打款。投资者几乎没有犹豫的时间，如果事先没有充分了解，只能选择盲目投入或错失良机。市场上甚至罕见地出现同一轮融资中存在双估值结构，约定好的份额价格也随时波动。阶跃星辰今年启动Pre-IPO，产业资本和与公司关系良好的投资者以40亿美元的估值买入，而财务投资者则进入下一轮。原本约定的估值价格是60亿美元，但实际上，4月份进入的财务投资者购买时的价格已高达80亿、90亿美元，足足上涨了两倍。

不少投资者抱怨“这太疯狂了”，并批评阶跃星辰创始人印奇坐地起价。达晨财智的董事总经理张英杰解释说，这是由供求关系决定的。市场上资金充裕，但可供投资的优质模型标的屈指可数，大多数投资机构的心态是只要能抢到名额就会毫不犹豫地投入。他举出的最明显例子是，今年以来，头部公司在基本业务没有实质性变化的情况下，估值却增长了3-5倍。对于许多投资者而言，Kimi和阶跃星辰是当前市场上仅有的两大可供投资的基础模型标的。相比之下，DeepSeek无疑更具吸引力，但由于其融资节奏、对外开放程度及份额稀缺性，普通投资者几乎没有接触的机会。

在仅有的两家公司中做出选择，对许多投资者而言，押注Kimi几乎无需太多犹豫。投资人李思扬表示：“优秀公司的投资逻辑，就是应买尽买。”在她看来，当Kimi估值达到100亿美元时，那些仍不肯盲目投入资金的投资者，都是未能真正理解AI潜力的人。这一判断并非仅仅基于情绪。Kimi至今仍是中国少数真正建立起用户规模的AI产品之一。除了大型科技公司的AI助手和DeepSeek之外，它依然保持着可观的C端用户基数。同时，其模型性能在国内外也享有良好口碑。AI编程神器Cursor发布的Composer 2模型底层技术，即来源于Kimi的K2.5模型。

对于今年以来动作频频的阶跃星辰，部分投资者感到有些疑惑。无论从C端产品还是其“全面转向Agent终端”的策略来看，阶跃星辰给外界留下的印象并不深刻。一位相对谨慎的LP郑明透露，从今年1月开始，他们曾试图从实际业务场景中去了解这家公司的模型能力，但四五个月过去，仍然很难从外部形成清晰的感知。去年，阶跃星辰主动收缩C端业务，例如角色扮演产品“冒泡鸭”已停止运营，仅保留了AI助手工具“阶跃AI”。同时，在企业级（TO B）市场，公司全面转向终端场景，包括汽车、手机和具身智能。阶跃星辰对外宣扬“AI+终端”的战略叙事，放弃了当前大模型领域最热门的纯API调用商业化模式。

这种发展路径确实吸引了一批专注于终端领域的公司。例如，全球领先的手机ODM厂商华勤技术、专注于电子设备制造的龙旗科技、图像传感器领域的核心供应商豪威集团，以及横跨通信设备与终端的中兴等。但对郑明而言，这种战略对普通投资者的吸引力不大。他认为判断一家公司投资价值的关键在于，能否在真实场景中直接感知其模型能力。而阶跃星辰当前对外开放的产品规模较小，用户反馈有限。他甚至特意体验了阶跃星辰与吉利汽车合作推出的智能座舱，但仍未形成足够深刻的感知。最终，他没有选择投资阶跃星辰。

李思扬所在的机构也未投资阶跃星辰，她的核心逻辑是：模型能力始终是首要的竞争变量。在她看来，当前仍处于“模型即产品”的关键阶段，模型性能正迎来认知的拐点。自去年底以来，她频繁与模型公司的朋友交流，一个共识已在极少数科学家圈层中形成，那就是模型已经开始具备某种“自主研究能力”。它们不仅能实现自我训练、自主发现问题，还能设计编程单元、自己提出科学假设并进行验证。这意味着，模型正在从单纯的工具演变为真正意义上的“研究系统”。

最显著的案例是去年11月，Anthropic最新模型Claude Opus 4.5所展现出的“自主进化能力”。其团队在实际测试中发现，Opus 4.5的理解能力显著优于以往模型，不仅能够发现此前模型难以察觉的Bug，还能自主判断行动时机，并在复杂决策中进行权衡。Anthropic CEO Dario Amodei在今年1月接受媒体采访时也提到，随着最新模型Claude Opus 4.5的推出，AI端到端完成复杂任务的能力已达到一个关键拐点。模型的自主提升能力也加速了模型迭代。Anthropic的Claude Opus模型发布间隔也由此前的三个月缩短至两个月。去年11月发布Opus 4.5后，Opus 4.6于2月5日更新发布，Claude Opus 4.7也于4月17日正式发布。

Anthropic今年1月发布的桌面Agent工具Claude Cowork，在国内市场引发了桌面Agent工具的热潮。Amodei承认，这个工具几乎完全由Claude Opus模型自主开发，仅用了一周半的时间。模型具备自主理解能力，不仅意味着研发人员和工程师代码效率的提升，更预示着AI系统能力边界突破后，将带来前所未有的变化。李思扬表示：“二三十年前，全球规模最大的公司可能是百亿、千亿美元级别，而在AI时代，我认为这些模型公司的上涨空间将非常巨大，超乎人类想象。”

资本市场也正通过营收增速重新评估这些公司的价值。Anthropic已跃升为近万亿美元级的公司，其最新财报显示第二季度营收增速约为127%。该公司预计在6月季度实现5.59亿美元的运营利润。据研究机构SemiAnalysis的最新分析，Anthropic的推理毛利率已从38%跃升至70%以上，年化收入在数月内从90亿美元飙升至逾440亿美元。类似的增长也开始在中国模型公司身上显现。随着K2.5模型发布后口碑持续提升，Kimi的年度经常性收入（ARR）在今年3月突破1亿美元，并在4月进一步增长至超过2亿美元。短短一个月内收入几乎翻倍。当前AI应用领域，很难找到如此惊人的增速。李思扬认为，模型公司将成为AI行业最大的链主企业，这已经成为业内共识。

每一轮技术热潮中，大型科技公司无疑是最活跃的投资者。近年来，腾讯和阿里几乎联手投资了AI“六小龙”中至少五家基础模型公司，尽管其中一些已暂时落后。阿里是投资大模型公司数量最多的科技巨头。自2025年12月以来，阿里参与了Kimi的多轮融资，并且在C++轮融资中担任领投方。外界尚不清楚阿里在Kimi上的具体投入金额，但阿里一直被认为是Kimi最大的外部股东。早在2024年初，阿里便以8亿美元投资Kimi，创下了大模型公司单笔最大融资股东记录。同年3月，阿里还投入4亿美元，领投了MiniMax的B轮融资。

Kimi的老股东美团龙珠，自2023年领投Kimi的A轮后，持续参与其多轮融资，最近的D轮融资更是领投了2亿美元。美团龙珠投资Kimi的逻辑与李思扬相似，同样看重Kimi团队的技术前瞻性。美团龙珠合伙人王新宇多次向媒体讲述他首次见到杨植麟后的深刻印象：杨植麟对模型的认知非常接近第一性原理，整个团队具备极强的技术前瞻性。除了美团龙珠，Kimi还吸引了新晋财务投资者——全球VC机构凯辉基金。这家管理着欧洲有史以来最大AI基金的公司，更倾向于从AI如何重构行业底层逻辑的角度，投资AI垂类应用或软硬结合的产品。过去几年，它从未参与大模型投资，但在2026年，其在中国投资的首家模型公司便是Kimi。

公开资料显示，阿里是投资大模型公司最为活跃的科技巨头，几乎投资了除阶跃星辰之外的所有基础模型公司（DeepSeek的股权份额目前尚未确定）。阿里是MiniMax的重要外部股东，上市前持有13.66%的股份，目前MiniMax披露的数据显示，阿里持股达17%。阿里还持有智谱（上市前）约6%的股份，并且是已掉队的基础模型公司百川智能、零一万物的股东。

唯一不在阿里投资名单之列的是印奇担任董事长的阶跃星辰，这令人颇感意外。须知在AI 1.0时代，阿里曾多次投资印奇创立的旷视科技，是旷视早期重要的战略投资方之一。旷视科技曾先后冲刺港股与A股科创板，但均因实体清单、监管及持续亏损等原因未能成功上市。阿里真金白银的投入，很大程度上是为了绑定算力。早在2022年，MiniMax就一直使用阿里云提供的云服务。2025年年报披露，未来三年MiniMax每年向阿里云采购的交易金额高达1亿多美元。

智谱也与阿里云签署了深度战略合作协议。智谱的多个版本模型直接在阿里云“百炼”平台首发，并作为核心模型上架。为确保Kimi C端产品业务在高峰时期的高并发请求，Kimi与阿里云深度合作，阿里云为其构建了一套端到端的Agent Infra基础设施体系。在模型性能层面，腾讯自研大模型与字节跳动的“豆包”、阿里的“通义千问”相比仍存在差距。但过去半年，腾讯秉持“应投尽投”的策略，积极布局外部AI模型赛道。其进入大模型投资的节奏略晚于阿里，但投资覆盖面更广，主流大模型创业公司基本均有涉猎。

今年以来，腾讯和阿里共同领投了Kimi的C轮和C++轮融资。此外，腾讯还重金投入阶跃星辰，作为老股东参与了阶跃星辰今年的两轮融资。据公开信息统计，腾讯至少参与了阶跃星辰的三轮融资。腾讯的角色也早已超越了单纯的财务投资范畴。2026年4月，腾讯云与阶跃星辰正式签署战略合作协议，明确将AI模型与腾讯音乐、视频、地图等服务深度整合。腾讯的角色也从单纯的财务投资延伸至产业协同与产品落地层面。除此之外，腾讯在更早阶段也已布局多家头部模型公司，包括MiniMax和智谱。例如，在2023年8月智谱AI的B4轮融资中，腾讯出资约2亿元。2024年12月，又继续参与其约30亿元规模的新一轮融资。

总体而言，腾讯在基础大模型层面一直处于追赶状态，但在投资模型厂商方面的动作并不比阿里少。阿里更倾向于自建底层技术，试图在模型层建立统一的技术栈；而腾讯则更倾向于通过资本和生态绑定多家模型公司，确保自己在这一轮模型竞争中占据一席之地。