此前,DeepSeek公司宣布其API价格下调,紧接着,智能手机巨头小米也对外公布其大模型API将永久性降价,最高降幅高达99%。
具体来看,DeepSeek在5月22日公布,V4-Pro模型API价格永久降低75%,其中缓存命中输入的价格低至每百万Token 0.025元人民币。仅仅五天后,即5月27日,小米便推出了MiMo-V2.5系列API的永久降价方案,最大降幅达99%。其中,Pro版缓存命中的输入价格同样降至0.025元/百万Token,标准版的输入价格更是低至0.02元/百万Token。
如此相近的价格设定和发布时间,表明这并非简单的市场跟随,而是双方在策略上的直接对标。对于开发者而言,当日小米和DeepSeek在价格方面几乎没有差异,这意味着二者在价格上已无选择难题。
然而,若从长远视角审视,这场竞争远不止价格战那么简单,它更是一场关于技术路线、生态布局以及AI普及模式的深层次较量。小米作为从硬件领域向AI转型的追赶者,而DeepSeek则是纯粹的AI技术先行者。尽管都以“降价”为策略,但其背后的支撑逻辑却截然不同。
那么,这些公司为何能够实现“永久”降价?大模型API的定价主要由算力成本、运营成本以及合理的利润空间构成,其中算力成本是核心变量,受芯片采购、集群效率和模型推理开销等多重因素影响。
DeepSeek降价的底气源于其底层技术的突破性创新。其V3模型以约600万美元的训练成本,实现了与GPT-4相近的性能,这仅是同类模型训练成本的极小一部分。DeepSeek自主研发的稀疏注意力机制使得V4系列在处理百万级Token的长文本时,算力消耗仅为上一代的27%,并且KV Cache占用也大幅减少至10%。这表明其降价并非依赖资本市场,而是纯粹的技术效率提升。
小米方面,雷军在5月26日宣布未来三年将投入600亿元发展AI技术。今年一季度,小米的研发投入已达90亿元,同比增长33.4%,预计全年研发投入将超过400亿元。这600亿资金主要用于追赶技术差距,并通过规模效应和其端侧优势,降低单位推理成本。两家公司的降价逻辑有着根本性的区别。
在价格之外,大模型的核心竞争力仍是技术实力。DeepSeek的优势在于其MoE(混合专家)架构的极致工程化。DeepSeek-V3拥有671B的总参数,但单Token仅激活约37B参数,激活比例仅约5.5%。结合MLA(多头潜在注意力)机制,KV缓存的占用被压缩到传统注意力的几分之一,显著降低了长文本推理的内存需求。这从根本上削减了算力消耗。
小米的追赶速度令人瞩目。今年4月发布了MiMo-V2.5系列,包含两款核心模型。MiMo-V2.5-Pro采用了MoE架构,总参数达1.02T(激活42B),预训练使用27万亿Token,原生序列从32K扩展至1M。MiMo-V2.5是一款全模态模型,拥有310B总参数(激活15B),支持文本、图像、视频和音频的全面理解。
在权威的Artificial Analysis综合智能指数和Agent指数评估中,MiMo-V2.5-Pro在全球开源模型中均排名第一。特别是在SWE-bench Pro测试中,其得分高达57.2%,超越了DeepSeek V4 Pro的55.4%和Gemini 3.1 Pro的54.2%。在Agent任务的ClawEval测试中,小米模型得分63.8%,位列全球开源模型之首。
小米表示,在ClawEval测试中,其模型每条任务轨迹仅消耗约7万Token,与GPT-5.4等同等能力水平的模型相比,Token消耗减少了40%至60%。这表明MiMo-V2.5-Pro在技术上具备结构性成本优势,其降价是能力提升的直接体现,而非单纯的市场定价调整。
虽然两种技术路线在MoE稀疏激活的底层趋势上趋同,但其能力侧重点有所不同。DeepSeek更侧重于通用知识的深度和推理能力,而MiMo-V2.5-Pro则在长上下文的Agent任务和多模态领域表现出相对优势。此外,小米还拥有DeepSeek所不具备的软硬件协同的终端落地优势。在小米“人车家全生态”战略下,MiMo大模型正逐步融入手机、汽车和智能家居等产品中。今年一季度,小米在AI领域的90亿元研发投入,正致力于用AI重塑其所有终端产品。去年底罗福莉加盟小米担任MiMo大模型负责人后,团队快速迭代,完成了从语言到多模态乃至语音的全面布局。如果仅将小米视为靠API盈利,则会低估这家硬件巨头的AI战略。
2025年11月,前DeepSeek的95后AI技术专家罗福莉加盟小米,担任MiMo大模型负责人,据悉雷军曾以千万年薪邀其加入。在罗福莉的领导下,小米MiMo大模型迅速完成了多代迭代,在短短几个月内从MiMo-V2-Pro发展到V2.5系列,并在高性能推理、轻量化通用交互和语音合成等全场景能力上取得了突破。罗福莉的到来,不仅带来了个人能力,更带来了一种强调效率、追求低成本高回报的工程师驱动文化,这或许解释了为何小米的降价策略在某种程度上与DeepSeek高度相似:这并非补贴战,而是效率战。
此外,据统计,自2026年以来,小米以高频率发布和更新了多款模型,从VLA大模型到移动端Agent产品Xiaomi miclaw,从MiMo-V2系列到V2.5系列的全模态模型矩阵,再到语音合成与识别、自动驾驶模型等,其覆盖范围之广、迭代速度之快在业内实属罕见。这种速度和节奏对许多企业来说可能是“战略性投入”,但对小米而言,更像是一种快速的“补课”,而且效果显著。
本次小米降价的具体细节值得关注:MiMo-V2.5-Pro的输入缓存命中价格从每百万Token 2.80元降至0.025元(降幅达99%),输出价格从42元降至6元(降幅86%);MiMo-V2.5标准版输入缓存命中价格从1.12元降至0.02元(降幅98%),输出价格从28元降至2元(降幅93%)。同时,小米还取消了上下文窗口长度的区分定价,优化了Token Plan计费,在同等价格下Token使用量提升5到8倍。
这场降价战分为两个阶段:第一阶段,DeepSeek在4月25日的两天内两次降价,将V4-Pro缓存命中价格降至0.025元,打破了行业的价格上限。在推理端调用量激增、算力和存储成本高涨的背景下,多数大模型公司选择涨价,部分涨幅甚至高达463%。DeepSeek逆势降价,通过技术驱动的成本下降,改变了行业“AI理应越来越贵”的预期。第二阶段,小米迅速跟进,价格直接对标DeepSeek甚至更低。这不仅是价格战,更是信号战,体现了小米在大模型API市场实现规模化并争夺市场份额的决心。
尽管都打着“降价”的旗号,两者逻辑却有所不同:DeepSeek的降价是“技术溢出”,通过架构创新和工程优化降低单位推理成本,并将部分技术红利回馈市场。其降价本身即是技术优势的体现。小米的降价是“生态卡位”,通过硬件利润反哺AI研发,以低价吸引开发者用户。一旦开发者习惯使用MiMo,便可在小米IoT生态中更顺畅地开发应用,并利用AI赋能汽车和手机。API降价不仅是价格战,更是小米构建AI生态的前期投入。对小米而言,大模型API短期内并非以盈利为主要目标。小米总裁卢伟冰在财报电话会议上明确表示,AI商业化仍处于起步阶段,目前的核心战略是强化基座模型能力,并以自研基座模型赋能“人车家全生态”。这背后是一条清晰的路径:降价吸引开发者,建立生态,最终反哺硬件,形成闭环。DeepSeek走的是纯技术降本路线,小米走的是生态降本路线。两者殊途同归,都致力于让AI真正实现普惠。
2025年被称为中国AI大模型的“百模大战”之年,那么2026年或将是“价格战终结之战”。DeepSeek将缓存命中价格降至0.025元/百万Token,使得调用百万级Token的成本甚至低于通话费。现在小米也已进入市场,价格体系基本触底。
小米此番降价还有一个值得关注的细节:2010年代的中国云计算行业也经历了一轮激烈的价格战,从而加速了企业级客户上云,催生了整个生态的成熟。如今这一幕正在AI行业重演。大模型API的极端低价将带来怎样的变革?
首先,开发者的门槛被彻底打破。当一个创业团队仅需几元钱便能完成模型MVP测试周期时,试错成本几乎为零,AI原生应用或许将迎来真正的春天。其次,大模型的竞争将从性能之争升级为“性价比之争”。未来衡量大模型优劣的标准,不再仅仅是MMLU、HumanEval等基准测试分数,还将包括“完成一次实际任务需要多少成本”。DeepSeek和小米正以行动重新定义竞争规则。最后,大模型行业将加速洗牌。拥有技术优势的厂商通过降价迅速占领市场,缺乏底层技术支撑的企业或将被淘汰出局,或转型走向高端定制路线。行业分析也印证了这一趋势:阿里通义、字节豆包等相继下调API价格,而智谱GLM、腾讯混元等专注于企业定制服务的模型则保持稳定甚至小幅上涨,形成了“通用模型降价走量、高端模型溢价保值”的新格局。
若仅关注小米与DeepSeek的价格竞争,则会显得格局过小。DeepSeek代表着开源AI的崛起。其V4系列不仅价格低廉,还采用MIT License开源,全球开发者均可自由下载、微调和商业部署。在DeepSeek之前,开源的力量从未如此强大。斯坦福AI指数2026显示,开源模型与闭源模型的性能差距已从17.5个百分点骤降至0.3%。小米的MiMo-V2.5系列同样采用MIT协议全面开源。顶尖模型的开源,正在将AI应用开发的门槛降至历史最低点,行业的壁垒正从模型本身转向应用场景和数据。
降价并非终点。当API价格趋近于运营成本时,大模型公司必须寻求新的价值增长点。小米已找到答案:AI赋能“人车家全生态”。雷军表示,小米未来三年600亿的AI投入,目标是将AI融入小米的所有核心产品中。目前,小米大模型已登上OpenRouter平台日榜、周榜双第一,成为全球增长最快的开源智能体首选推理引擎。对DeepSeek而言,降价本身是商业逻辑的延续。DeepSeek的开源模型+收费API模式,可能成为中国AI走向全球的另一条路径。
小米大模型是否在对标DeepSeek?答案是肯定的,至少从定价策略来看,小米几乎复制了DeepSeek的降价打法。但二者的“对标”不仅限于价格竞争。小米对标的是DeepSeek对整个行业发起的挑战:推动API价格逼近成本线,推动模型从闭源走向开源,推动行业竞争从堆算力、拼参数转向比效率、比生态、比落地。在这场竞赛中,小米找到了自己的道路,不依赖纯技术降本一步登天,而是依靠生态规模和端侧落地的独特壁垒构建护城河。而DeepSeek则通过极致的架构创新证明,即使是硬件资源受限的中国企业,也能通过算法和工程能力打造世界级的模型,并以此撬动整个行业的成本结构。这场降价竞争的终点,并非某一方的胜利加冕,而是AI普惠的起点。当百万级Token的调用成本低于通话费,当顶尖开源模型向所有开发者免费开放权重,从大公司到初创企业再到个人开发者,AI应用的天花板正被无限推高。DeepSeek和小米正是这场变革中两大关键推动者。
