小米AI策略透视：免费Token耗尽后的复杂计费新逻辑

小米公司近期公布了其推出的100万亿免费Token已提前终结使用。紧随其后约8小时，MiMo-V2.5系列API正式宣布价格永久下调99%，同时用户的Credits额度也获得了重置。这一连串紧密相连的举措，显然并非单纯的用户参与热情高涨所致。

当业界普遍为人工智能的大幅降价和普及欢呼时，有一个关键点却鲜少被关注：这种从免费吸引用户到引入复杂计费、再到推动用户向旗舰模型迁移的完整流程，已然构成了一套成熟的运营模式。

考虑到小米手机出货量下滑、利润缩水且股价持续走低的现状，此次降价行动不仅是规则上的革新，更是其主营业务面临压力下，寻求新增长点的必然选择。

在计费模式上，小米巧妙地运用了其惯常的营销手法，即通过“限量、限时、稀缺额度”来引导消费者决策，并将这一策略复制到了其AI业务之中。

值得注意的是，免费Token的实时消耗进度并未对外公布，平台单方面宣布其提前终止，并在短期内推出了低价套餐，意在利用用户“害怕错失良机”的心理，促使其迅速接受新的选择。

分析小米当前的经营背景，这些策略显得更深远。2026年第一季度，小米手机在国内市场的出货量同比大幅下降35%，跌出前五，产品主要集中在中低端市场，高端化进程受阻。公司创始人雷军也明确表示，手机业务已不再是发展的重心。

在主业增长遭遇瓶颈之际，AI业务被推至前台，成为新的增长引擎，其营销策略自然也沿袭了以往的风格。然而，仅仅依靠营销套路所堆积的热度，很难掩盖公司基本面所承受的压力。

小米官方宣称新推出的Credits计费系统“价格透明”，但其换算规则却制造了巨大的价格差异。

例如，以MiMo-V2.5-Pro模型为例，缓存命中的每Token消耗2.5 Credits，缓存未命中的则为300 Credits，而输出所需的Credits高达600 Credits。这意味着相同的Token，缓存命中与未命中之间的成本相差120倍，输出成本更是命中状态下的240倍。

尽管动态缓存调整是大模型行业的普遍技术，但小米并未公开其缓存判定逻辑和命中率的预期波动范围。这使得开发者难以准确预估实际成本，从而在使用过程中面临显著的不确定性。

过去，纯粹基于Token数量的直接计费模式清晰明了，消耗多少，费用多少一目了然。然而，转向Credits体系后，用户只能购买固定额度，实际可调用的Token数量则完全依赖于平台的内部规则。

MiMo项目负责人罗福莉曾表示，这一新的定价体系具有底气，因为“模型推理成本远低于行业平均水平，此次定价仍预留了2-3倍的利润空间。即便降价99%，也能实现收支平衡”。

这番话从侧面证实，过往大模型API市场确实存在定价过高的情况。此次大幅降价99%仍能维持平衡，并非出于普惠情怀，更多是市场定价回归合理的结果。

小米的Token计划提出了“定价不变，Credits大幅提升”的口号。例如，Lite套餐从0.6亿Credits增至41亿，Standard从2亿增至110亿，Pro从7亿增至380亿，表面上看额度暴增数十倍。

然而，考虑到API单价同步下调99%，单个Credits的实际购买力也被同比例稀释，这实质上是一种数字游戏。此外，“非高峰期0.8倍消耗”的规则也未明确高峰期的具体界定标准，这进一步增加了用户预估成本的难度。

针对AI业务的变现问题，卢伟冰在财报会议上曾表示“不会急于变现”。但结合财报数据来看，第一季度集团营收同比下降10.9%，净利润大跌43.1%，经营利润更是腰斩59.5%，盈利压力显而易见。

因此，所谓“不急变现”的言论，更像是对长期生态建设的一种说辞。而复杂的Credits体系，其本质在于提前构建了一个可持续的收费框架。

如果说V2.5系列的降价是吸引用户的入门诱饵，那么被刻意淡化的旗舰模型定价，则构成了真正的价格壁垒。

MiMo-V2-Pro和MiMo-V2-Omni两款高级模型的价格维持不变，原有的低价Token套餐也将停止提供，官方明确引导用户转向V2.5系列。

两者的成本差异显而易见：V2.5-Pro在缓存命中时每Token消耗2.5 Credits，而V2-Pro则高达140 Credits，两者之间存在高达56倍的价格鸿沟。

这意味着开发者被低价吸引入门后，一旦需要更强大的模型能力，使用成本将瞬间飙升数十倍。这并非单纯的普惠让利，而是通过低价引流与产品矩阵锁定用户的模式，旨在引导用户长期停留在入门级版本。

将上述各个环节串联起来，小米的整体运营剧本清晰呈现：

第一步是免费获客：通过100T Token计划培养开发者使用习惯，促使大量开发者将代码、项目和工作流程建立在MiMo平台之上。

第二步是制造饥饿感和紧迫感：宣布“提前发完”免费额度以制造稀缺性，并配合8小时后即刻生效的降价措施，迫使开发者在“免费额度耗尽”的焦虑中迅速做出决策。

第三步是利用复杂计费系统来锁定用户的迁移成本：Credits体系、不透明的缓存命中率判断以及高峰时段的浮动计费，使得开发者无法准确预估真实成本，也难以与其他平台进行直观的价格比较。

第四步是生态绑定以实现长期锁定：当开发者深度依赖MiMo的API格式、缓存机制和Credits体系后，其迁移至其他平台的成本急剧上升。此时，小米推出“人车家全生态”增值服务，开发者会发现自己已深陷于这套规则之中。

这并非单纯的人工智能普惠，而是平台经济学中的精准运营——只不过运营工具从传统的会员订阅变成了Credits，从流量入口变成了API接口。

对比同样选择大幅降价的DeepSeek，其与小米走的是两条截然不同的发展路线。

DeepSeek沿用纯粹的Token直接计费模式，价格方案公开固定，没有额外的换算和动态浮动规则，更倾向于扮演行业通用基础设施的角色。

小米则选择构建自己的Credits体系，实施分层定价，并区分高低端模型，其核心逻辑在于构建封闭生态并提高用户的迁移成本。

路线差异的背后，反映的是两家公司不同的处境。前者专注于纯技术服务，而后者则致力于绑定手机、IoT和汽车全生态，同时肩负着更大的主营业务增长压力。

雷军曾宣布，未来三年小米计划在AI领域投入600亿元，其中2026年单年至少投入160亿元。第一季度研发支出已达90亿元，同比增长33.4%。

巨额投入必然要求业务能够迅速实现规模化和数据增长。免费额度与降价活动仅相隔8小时的衔接、分层计费规则以及高低端模型的价格差异，都是在资本压力下快速提升业绩的运营手段。

资本市场的反应也十分明确。截至降价生效当日收盘，小米股价年内累计下跌超过27%，市值蒸发千亿港元。投资者早已意识到，低价走量并不等同于健康的盈利能力。

罗福莉曾提醒同行：“不要盲目跟风打价格战，大多数模型和推理方案根本无法承受低价。”

这句话同样值得所有开发者深思。在低价的表象之下，更应洞察规则背后所蕴含的真实成本逻辑。

真正的人工智能普惠，应是价格透明、规则简明，且高低端产品同步让利。而当前MiMo的降价策略，更像是为适应自身生态系统和经营现状而量身定制的一套运营体系。开发者在享受低价的同时，也不得不接受这套复杂规则所带来的束缚。