小米公司近期公布了其推出的100万亿免费Token已提前终结使用。紧随其后约8小时,MiMo-V2.5系列API正式宣布价格永久下调99%,同时用户的Credits额度也获得了重置。这一连串紧密相连的举措,显然并非单纯的用户参与热情高涨所致。
当业界普遍为人工智能的大幅降价和普及欢呼时,有一个关键点却鲜少被关注:这种从免费吸引用户到引入复杂计费、再到推动用户向旗舰模型迁移的完整流程,已然构成了一套成熟的运营模式。
考虑到小米手机出货量下滑、利润缩水且股价持续走低的现状,此次降价行动不仅是规则上的革新,更是其主营业务面临压力下,寻求新增长点的必然选择。
在计费模式上,小米巧妙地运用了其惯常的营销手法,即通过“限量、限时、稀缺额度”来引导消费者决策,并将这一策略复制到了其AI业务之中。
值得注意的是,免费Token的实时消耗进度并未对外公布,平台单方面宣布其提前终止,并在短期内推出了低价套餐,意在利用用户“害怕错失良机”的心理,促使其迅速接受新的选择。
分析小米当前的经营背景,这些策略显得更深远。2026年第一季度,小米手机在国内市场的出货量同比大幅下降35%,跌出前五,产品主要集中在中低端市场,高端化进程受阻。公司创始人雷军也明确表示,手机业务已不再是发展的重心。
在主业增长遭遇瓶颈之际,AI业务被推至前台,成为新的增长引擎,其营销策略自然也沿袭了以往的风格。然而,仅仅依靠营销套路所堆积的热度,很难掩盖公司基本面所承受的压力。
小米官方宣称新推出的Credits计费系统“价格透明”,但其换算规则却制造了巨大的价格差异。
例如,以MiMo-V2.5-Pro模型为例,缓存命中的每Token消耗2.5 Credits,缓存未命中的则为300 Credits,而输出所需的Credits高达600 Credits。这意味着相同的Token,缓存命中与未命中之间的成本相差120倍,输出成本更是命中状态下的240倍。
尽管动态缓存调整是大模型行业的普遍技术,但小米并未公开其缓存判定逻辑和命中率的预期波动范围。这使得开发者难以准确预估实际成本,从而在使用过程中面临显著的不确定性。
过去,纯粹基于Token数量的直接计费模式清晰明了,消耗多少,费用多少一目了然。然而,转向Credits体系后,用户只能购买固定额度,实际可调用的Token数量则完全依赖于平台的内部规则。
MiMo项目负责人罗福莉曾表示,这一新的定价体系具有底气,因为“模型推理成本远低于行业平均水平,此次定价仍预留了2-3倍的利润空间。即便降价99%,也能实现收支平衡”。
这番话从侧面证实,过往大模型API市场确实存在定价过高的情况。此次大幅降价99%仍能维持平衡,并非出于普惠情怀,更多是市场定价回归合理的结果。
小米的Token计划提出了“定价不变,Credits大幅提升”的口号。例如,Lite套餐从0.6亿Credits增至41亿,Standard从2亿增至110亿,Pro从7亿增至380亿,表面上看额度暴增数十倍。
然而,考虑到API单价同步下调99%,单个Credits的实际购买力也被同比例稀释,这实质上是一种数字游戏。此外,“非高峰期0.8倍消耗”的规则也未明确高峰期的具体界定标准,这进一步增加了用户预估成本的难度。
针对AI业务的变现问题,卢伟冰在财报会议上曾表示“不会急于变现”。但结合财报数据来看,第一季度集团营收同比下降10.9%,净利润大跌43.1%,经营利润更是腰斩59.5%,盈利压力显而易见。
因此,所谓“不急变现”的言论,更像是对长期生态建设的一种说辞。而复杂的Credits体系,其本质在于提前构建了一个可持续的收费框架。
如果说V2.5系列的降价是吸引用户的入门诱饵,那么被刻意淡化的旗舰模型定价,则构成了真正的价格壁垒。
MiMo-V2-Pro和MiMo-V2-Omni两款高级模型的价格维持不变,原有的低价Token套餐也将停止提供,官方明确引导用户转向V2.5系列。
两者的成本差异显而易见:V2.5-Pro在缓存命中时每Token消耗2.5 Credits,而V2-Pro则高达140 Credits,两者之间存在高达56倍的价格鸿沟。
这意味着开发者被低价吸引入门后,一旦需要更强大的模型能力,使用成本将瞬间飙升数十倍。这并非单纯的普惠让利,而是通过低价引流与产品矩阵锁定用户的模式,旨在引导用户长期停留在入门级版本。
将上述各个环节串联起来,小米的整体运营剧本清晰呈现:
第一步是免费获客:通过100T Token计划培养开发者使用习惯,促使大量开发者将代码、项目和工作流程建立在MiMo平台之上。
第二步是制造饥饿感和紧迫感:宣布“提前发完”免费额度以制造稀缺性,并配合8小时后即刻生效的降价措施,迫使开发者在“免费额度耗尽”的焦虑中迅速做出决策。
第三步是利用复杂计费系统来锁定用户的迁移成本:Credits体系、不透明的缓存命中率判断以及高峰时段的浮动计费,使得开发者无法准确预估真实成本,也难以与其他平台进行直观的价格比较。
第四步是生态绑定以实现长期锁定:当开发者深度依赖MiMo的API格式、缓存机制和Credits体系后,其迁移至其他平台的成本急剧上升。此时,小米推出“人车家全生态”增值服务,开发者会发现自己已深陷于这套规则之中。
这并非单纯的人工智能普惠,而是平台经济学中的精准运营——只不过运营工具从传统的会员订阅变成了Credits,从流量入口变成了API接口。
对比同样选择大幅降价的DeepSeek,其与小米走的是两条截然不同的发展路线。
DeepSeek沿用纯粹的Token直接计费模式,价格方案公开固定,没有额外的换算和动态浮动规则,更倾向于扮演行业通用基础设施的角色。
小米则选择构建自己的Credits体系,实施分层定价,并区分高低端模型,其核心逻辑在于构建封闭生态并提高用户的迁移成本。
路线差异的背后,反映的是两家公司不同的处境。前者专注于纯技术服务,而后者则致力于绑定手机、IoT和汽车全生态,同时肩负着更大的主营业务增长压力。
雷军曾宣布,未来三年小米计划在AI领域投入600亿元,其中2026年单年至少投入160亿元。第一季度研发支出已达90亿元,同比增长33.4%。
巨额投入必然要求业务能够迅速实现规模化和数据增长。免费额度与降价活动仅相隔8小时的衔接、分层计费规则以及高低端模型的价格差异,都是在资本压力下快速提升业绩的运营手段。
资本市场的反应也十分明确。截至降价生效当日收盘,小米股价年内累计下跌超过27%,市值蒸发千亿港元。投资者早已意识到,低价走量并不等同于健康的盈利能力。
罗福莉曾提醒同行:“不要盲目跟风打价格战,大多数模型和推理方案根本无法承受低价。”
这句话同样值得所有开发者深思。在低价的表象之下,更应洞察规则背后所蕴含的真实成本逻辑。
真正的人工智能普惠,应是价格透明、规则简明,且高低端产品同步让利。而当前MiMo的降价策略,更像是为适应自身生态系统和经营现状而量身定制的一套运营体系。开发者在享受低价的同时,也不得不接受这套复杂规则所带来的束缚。
