小米大模型API降价逾九成，直指DeepSeek引领AI普惠新格局

此前，DeepSeek公司宣布其API价格下调，紧接着，智能手机巨头小米也对外公布其大模型API将永久性降价，最高降幅高达99%。

具体来看，DeepSeek在5月22日公布，V4-Pro模型API价格永久降低75%，其中缓存命中输入的价格低至每百万Token 0.025元人民币。仅仅五天后，即5月27日，小米便推出了MiMo-V2.5系列API的永久降价方案，最大降幅达99%。其中，Pro版缓存命中的输入价格同样降至0.025元/百万Token，标准版的输入价格更是低至0.02元/百万Token。

如此相近的价格设定和发布时间，表明这并非简单的市场跟随，而是双方在策略上的直接对标。对于开发者而言，当日小米和DeepSeek在价格方面几乎没有差异，这意味着二者在价格上已无选择难题。

然而，若从长远视角审视，这场竞争远不止价格战那么简单，它更是一场关于技术路线、生态布局以及AI普及模式的深层次较量。小米作为从硬件领域向AI转型的追赶者，而DeepSeek则是纯粹的AI技术先行者。尽管都以“降价”为策略，但其背后的支撑逻辑却截然不同。

那么，这些公司为何能够实现“永久”降价？大模型API的定价主要由算力成本、运营成本以及合理的利润空间构成，其中算力成本是核心变量，受芯片采购、集群效率和模型推理开销等多重因素影响。

DeepSeek降价的底气源于其底层技术的突破性创新。其V3模型以约600万美元的训练成本，实现了与GPT-4相近的性能，这仅是同类模型训练成本的极小一部分。DeepSeek自主研发的稀疏注意力机制使得V4系列在处理百万级Token的长文本时，算力消耗仅为上一代的27%，并且KV Cache占用也大幅减少至10%。这表明其降价并非依赖资本市场，而是纯粹的技术效率提升。

小米方面，雷军在5月26日宣布未来三年将投入600亿元发展AI技术。今年一季度，小米的研发投入已达90亿元，同比增长33.4%，预计全年研发投入将超过400亿元。这600亿资金主要用于追赶技术差距，并通过规模效应和其端侧优势，降低单位推理成本。两家公司的降价逻辑有着根本性的区别。

在价格之外，大模型的核心竞争力仍是技术实力。DeepSeek的优势在于其MoE（混合专家）架构的极致工程化。DeepSeek-V3拥有671B的总参数，但单Token仅激活约37B参数，激活比例仅约5.5%。结合MLA（多头潜在注意力）机制，KV缓存的占用被压缩到传统注意力的几分之一，显著降低了长文本推理的内存需求。这从根本上削减了算力消耗。

小米的追赶速度令人瞩目。今年4月发布了MiMo-V2.5系列，包含两款核心模型。MiMo-V2.5-Pro采用了MoE架构，总参数达1.02T（激活42B），预训练使用27万亿Token，原生序列从32K扩展至1M。MiMo-V2.5是一款全模态模型，拥有310B总参数（激活15B），支持文本、图像、视频和音频的全面理解。

在权威的Artificial Analysis综合智能指数和Agent指数评估中，MiMo-V2.5-Pro在全球开源模型中均排名第一。特别是在SWE-bench Pro测试中，其得分高达57.2%，超越了DeepSeek V4 Pro的55.4%和Gemini 3.1 Pro的54.2%。在Agent任务的ClawEval测试中，小米模型得分63.8%，位列全球开源模型之首。

小米表示，在ClawEval测试中，其模型每条任务轨迹仅消耗约7万Token，与GPT-5.4等同等能力水平的模型相比，Token消耗减少了40%至60%。这表明MiMo-V2.5-Pro在技术上具备结构性成本优势，其降价是能力提升的直接体现，而非单纯的市场定价调整。

虽然两种技术路线在MoE稀疏激活的底层趋势上趋同，但其能力侧重点有所不同。DeepSeek更侧重于通用知识的深度和推理能力，而MiMo-V2.5-Pro则在长上下文的Agent任务和多模态领域表现出相对优势。此外，小米还拥有DeepSeek所不具备的软硬件协同的终端落地优势。在小米“人车家全生态”战略下，MiMo大模型正逐步融入手机、汽车和智能家居等产品中。今年一季度，小米在AI领域的90亿元研发投入，正致力于用AI重塑其所有终端产品。去年底罗福莉加盟小米担任MiMo大模型负责人后，团队快速迭代，完成了从语言到多模态乃至语音的全面布局。如果仅将小米视为靠API盈利，则会低估这家硬件巨头的AI战略。

2025年11月，前DeepSeek的95后AI技术专家罗福莉加盟小米，担任MiMo大模型负责人，据悉雷军曾以千万年薪邀其加入。在罗福莉的领导下，小米MiMo大模型迅速完成了多代迭代，在短短几个月内从MiMo-V2-Pro发展到V2.5系列，并在高性能推理、轻量化通用交互和语音合成等全场景能力上取得了突破。罗福莉的到来，不仅带来了个人能力，更带来了一种强调效率、追求低成本高回报的工程师驱动文化，这或许解释了为何小米的降价策略在某种程度上与DeepSeek高度相似：这并非补贴战，而是效率战。

此外，据统计，自2026年以来，小米以高频率发布和更新了多款模型，从VLA大模型到移动端Agent产品Xiaomi miclaw，从MiMo-V2系列到V2.5系列的全模态模型矩阵，再到语音合成与识别、自动驾驶模型等，其覆盖范围之广、迭代速度之快在业内实属罕见。这种速度和节奏对许多企业来说可能是“战略性投入”，但对小米而言，更像是一种快速的“补课”，而且效果显著。

本次小米降价的具体细节值得关注：MiMo-V2.5-Pro的输入缓存命中价格从每百万Token 2.80元降至0.025元（降幅达99%），输出价格从42元降至6元（降幅86%）；MiMo-V2.5标准版输入缓存命中价格从1.12元降至0.02元（降幅98%），输出价格从28元降至2元（降幅93%）。同时，小米还取消了上下文窗口长度的区分定价，优化了Token Plan计费，在同等价格下Token使用量提升5到8倍。

这场降价战分为两个阶段：第一阶段，DeepSeek在4月25日的两天内两次降价，将V4-Pro缓存命中价格降至0.025元，打破了行业的价格上限。在推理端调用量激增、算力和存储成本高涨的背景下，多数大模型公司选择涨价，部分涨幅甚至高达463%。DeepSeek逆势降价，通过技术驱动的成本下降，改变了行业“AI理应越来越贵”的预期。第二阶段，小米迅速跟进，价格直接对标DeepSeek甚至更低。这不仅是价格战，更是信号战，体现了小米在大模型API市场实现规模化并争夺市场份额的决心。

尽管都打着“降价”的旗号，两者逻辑却有所不同：DeepSeek的降价是“技术溢出”，通过架构创新和工程优化降低单位推理成本，并将部分技术红利回馈市场。其降价本身即是技术优势的体现。小米的降价是“生态卡位”，通过硬件利润反哺AI研发，以低价吸引开发者用户。一旦开发者习惯使用MiMo，便可在小米IoT生态中更顺畅地开发应用，并利用AI赋能汽车和手机。API降价不仅是价格战，更是小米构建AI生态的前期投入。对小米而言，大模型API短期内并非以盈利为主要目标。小米总裁卢伟冰在财报电话会议上明确表示，AI商业化仍处于起步阶段，目前的核心战略是强化基座模型能力，并以自研基座模型赋能“人车家全生态”。这背后是一条清晰的路径：降价吸引开发者，建立生态，最终反哺硬件，形成闭环。DeepSeek走的是纯技术降本路线，小米走的是生态降本路线。两者殊途同归，都致力于让AI真正实现普惠。

2025年被称为中国AI大模型的“百模大战”之年，那么2026年或将是“价格战终结之战”。DeepSeek将缓存命中价格降至0.025元/百万Token，使得调用百万级Token的成本甚至低于通话费。现在小米也已进入市场，价格体系基本触底。

小米此番降价还有一个值得关注的细节：2010年代的中国云计算行业也经历了一轮激烈的价格战，从而加速了企业级客户上云，催生了整个生态的成熟。如今这一幕正在AI行业重演。大模型API的极端低价将带来怎样的变革？

首先，开发者的门槛被彻底打破。当一个创业团队仅需几元钱便能完成模型MVP测试周期时，试错成本几乎为零，AI原生应用或许将迎来真正的春天。其次，大模型的竞争将从性能之争升级为“性价比之争”。未来衡量大模型优劣的标准，不再仅仅是MMLU、HumanEval等基准测试分数，还将包括“完成一次实际任务需要多少成本”。DeepSeek和小米正以行动重新定义竞争规则。最后，大模型行业将加速洗牌。拥有技术优势的厂商通过降价迅速占领市场，缺乏底层技术支撑的企业或将被淘汰出局，或转型走向高端定制路线。行业分析也印证了这一趋势：阿里通义、字节豆包等相继下调API价格，而智谱GLM、腾讯混元等专注于企业定制服务的模型则保持稳定甚至小幅上涨，形成了“通用模型降价走量、高端模型溢价保值”的新格局。

若仅关注小米与DeepSeek的价格竞争，则会显得格局过小。DeepSeek代表着开源AI的崛起。其V4系列不仅价格低廉，还采用MIT License开源，全球开发者均可自由下载、微调和商业部署。在DeepSeek之前，开源的力量从未如此强大。斯坦福AI指数2026显示，开源模型与闭源模型的性能差距已从17.5个百分点骤降至0.3%。小米的MiMo-V2.5系列同样采用MIT协议全面开源。顶尖模型的开源，正在将AI应用开发的门槛降至历史最低点，行业的壁垒正从模型本身转向应用场景和数据。

降价并非终点。当API价格趋近于运营成本时，大模型公司必须寻求新的价值增长点。小米已找到答案：AI赋能“人车家全生态”。雷军表示，小米未来三年600亿的AI投入，目标是将AI融入小米的所有核心产品中。目前，小米大模型已登上OpenRouter平台日榜、周榜双第一，成为全球增长最快的开源智能体首选推理引擎。对DeepSeek而言，降价本身是商业逻辑的延续。DeepSeek的开源模型+收费API模式，可能成为中国AI走向全球的另一条路径。

小米大模型是否在对标DeepSeek？答案是肯定的，至少从定价策略来看，小米几乎复制了DeepSeek的降价打法。但二者的“对标”不仅限于价格竞争。小米对标的是DeepSeek对整个行业发起的挑战：推动API价格逼近成本线，推动模型从闭源走向开源，推动行业竞争从堆算力、拼参数转向比效率、比生态、比落地。在这场竞赛中，小米找到了自己的道路，不依赖纯技术降本一步登天，而是依靠生态规模和端侧落地的独特壁垒构建护城河。而DeepSeek则通过极致的架构创新证明，即使是硬件资源受限的中国企业，也能通过算法和工程能力打造世界级的模型，并以此撬动整个行业的成本结构。这场降价竞争的终点，并非某一方的胜利加冕，而是AI普惠的起点。当百万级Token的调用成本低于通话费，当顶尖开源模型向所有开发者免费开放权重，从大公司到初创企业再到个人开发者，AI应用的天花板正被无限推高。DeepSeek和小米正是这场变革中两大关键推动者。