大厂AI内卷新姿势：Token消耗成新“绩效指标”引发争议

企业在努力实现降本增效的同时，却发现节省下来的资金可能正被无效的AI计算资源（Token）大量消耗。

近期有报道指出，微软正在内部收缩对Claude Code的授权，其Experiences + Devices团队计划在六月底前关闭大部分第三方Claude Code使用权限，并全面转向自家的GitHub Copilot CLI。此举主要目的是为了减轻AI带来的巨大成本压力。而打车软件巨头Uber的情况则更为严峻，其首席技术官Praveen Neppalli Naga透露，公司2026年全年预计的AI预算在短短四个月内就已基本用尽。

与微软和Uber的“刹车”态度相反，Meta则采取了截然不同的策略。该公司内部推行了Token消耗排行榜，并为消耗量高的员工授予“Token传奇”、“缓存魔法师”等荣誉称号，甚至将Token用量与绩效考核挂钩，实行末位淘汰制度。这项机制推行仅一个月，Meta的全体员工Token总消耗量就从6万亿激增至73.7万亿，增幅超过12倍，导致AI资源消耗完全失控。

尽管各公司策略不同，但它们都面临着同一个核心难题：行业至今尚未建立一套成熟、稳定且可操作的AI价值衡量标准。因此，Token消耗量这类易于统计的指标，便成了唯一的、看似“硬性”的衡量依据。

百度首席执行官李彦宏在前不久的一次行业会议上明确指出，Token消耗固然容易统计，但这并不等同于实际的业务产出。

例如，一名员工为了完成任务，可能会让AI智能体（Agent）运行更多次、输入更长的上下文信息，或者反复尝试让模型生成结果，这必然会迅速增加账单，但最终的业务成果却不一定能随之提升。

Token消耗作为绩效考核指标（“Token KPI”）正在制造一场巨大的浪费。以最大化Token消耗为目标的工作模式（“Tokenmaxxing”）自去年底在硅谷兴起后，目前已蔓延至中国。阿里巴巴、腾讯、字节跳动等国内互联网巨头的技术团队，也已不同程度地将Token使用量纳入员工转正和晋升的考量范围。

当绩效考核与Token用量深度绑定后，职场中的形式主义迅速渗透到AI工作场景。《财经》杂志的报道披露，许多员工为了达到考核目标，会刻意让AI Agent大量读取数万行代码，或堆砌数万字的文献数据，纯粹通过“堆砌工作量”来刷高Token消耗，而没有实际的工作产出。这种现象并非个案，公开数据显示，在全球企业级AI应用中，近一半的Token消耗都被认为是无效浪费。

Meta在一个月内高达73.7万亿的Token消耗中，究竟有多少真正转化成了有效的业务产出？这正是所有Token KPI制度存在的根本漏洞。

与硅谷企业对成本的焦虑不同，国内的大型科技公司正通过高额Token补贴，积极降低员工使用AI的门槛。

根据多方透露的信息，各家企业的福利政策各有侧重：腾讯为核心研发人员提供了每年22.8万元的Token专属套餐，并额外报销每月1000美元的外部AI工具费用；字节跳动对内开放AI工具不限量使用，员工在业余时间体验AI可报销50%，技术岗位的报销上限为每年1000美元；百度为技术岗员工提供了文心一言无限量使用权，并额外补贴最高每年800美元的外部Token费用；360公司更是直接为全体员工充值了1亿Token。

AI工具已不再仅仅是办公软件的插件，它正在逐渐演变为新的生产资料。过去，企业为员工配置电脑、软件账号、云盘和报销额度；而现在，研发、设计、产品和运营等部门都可能需要模型调用额度。尤其在代码生成、智能体工作流、视频创作和知识检索等领域，Token就像是驱动工作的燃油。

然而，燃料已经配发，但如何高效计算“油耗”的问题，许多公司仍未有清晰的解决方案。

Uber的内部数据精确揭示了企业AI成本失控的核心机制缺陷。目前，该公司95%的工程师日常使用AI编码工具，每位工程师每月在AI调用上的成本在500至2000美元之间。70%的代码提交是由AI生成的，AI智能体每周可完成1800次代码变更，相关工作量占比已从不足1%飙升至8%。

从业务落地角度看，这无疑标志着AI渗透率的大幅提升；但对于企业的财务部门而言，这意味着原本刚性可控的IT成本体系已彻底被打破。

成本失控的根本原因在于AI智能体（Agent）的高消耗特性。Gartner研究指出，完成相同任务量时，Agent的Token消耗是传统聊天机器人的5到30倍。高盛预测，到2030年，全球Token消耗量将达到每月约120万亿（quadrillion），是2026年水平的24倍，而其主要驱动力正是企业端智能体的大规模部署。

传统SaaS软件按席位计费，IT部门在采购时可以锁定全年的支出上限。

然而，AI工具的成本结构与此完全不兼容。Token账单会随着使用行为的动态变化而增长，这意味着财务部门缺乏历史数据来建立成本基准；IT部门没有成熟的工具进行实时追踪与成本分摊；业务部门在推广使用AI时，也未能同步建立成本归因机制。

问题并非出在AI本身无用，而是企业的财务运营（FinOps）体系未能跟上AI的消费速度。正因如此，微软和Uber才紧急采取了限制措施。

国内企业的现状与硅谷略有不同。硅谷的焦虑在于Token用量过快，导致预算超支；而国内大厂面临更现实的尴尬：尽管投入了大量资金，但员工对AI工具的使用深度仍不足，实际的业务价值难以体现。

从消费者端数据看，中国AI应用热度空前高涨。量子位智库2026年行业报告显示，今年4月国内AI应用的网页端月访问量突破9亿次，移动应用端月下载量超过2.4亿，日活跃用户达6.7亿，同比增幅高达223%。QuestMobile的数据也同步印证，截至2026年3月，国内AI原生应用的月活跃用户达到4.4亿，其中“豆包”、“千问”和“DeepSeek”稳居行业前三。

然而，火爆的消费者端数据并未同步转化为企业端的生产力提升。

埃森哲《2025中国企业数字化转型指数》数据显示，国内46%的企业已经启动AI适配与落地，但仅有9%的企业实现了显著的业务价值突破。绝大多数企业在AI落地方面，仍停留在浅层试用、盲目推广和摸索应用场景的初级阶段。

在内容创作、客服问答和代码辅助等浅层场景，AI落地的门槛较低，见效也较快；但在核心研发、供应链管理、财务风控和组织协同等关键业务环节，AI落地的适配难度、合规门槛和实施成本都大幅增加。

大型企业全员发放Token补贴的目的，是希望通过资金激励降低AI试错成本，强力推动全体员工融入AI工作流程。这种策略具有一定的合理性：只有足够的使用密度，才能倒逼企业筛选出真正适配业务的场景，并培养员工的AI使用习惯。

但问题在于，如果只鼓励使用，而不建立价值衡量体系，这种福利最终会演变成巨大的账单压力，并可能滋生出类似“制作PPT”、“堆砌文档”式的伪AI工作方式。

AI对职场的渗透速度远超预期。据Cognizant 2026年报告测算，美国93%的岗位将不同程度地受到AI影响，这一预测比之前的估计提前了整整6年。

主要岗位受到AI渗透的影响正在全面爆发。数据显示，2023年管理、金融运营和行政支持类岗位的AI暴露度仅为14%至21%，但目前已飙升至60%至68%；律师岗位的AI暴露度从9%跃升至63%，甚至首席执行官（CEO）岗位的理论AI暴露度也突破了60%。报告同时强调，理论渗透并不代表实际替代，责任问责、行业监管以及人类的主观判断，仍然是制约AI全面落地的核心障碍。

这意味着，AI将继续进入更多岗位，Token消耗也将从研发部门扩散到更广泛的组织层面。企业真正需要面对的问题是，如何判断一笔Token的花费是否物有所值。

Token本身并非问题，企业若想构建成熟的AI生产力体系，必然需要充足的Token投入作为支撑。行业乱象的核心症结，从来不是“Token用得太多”，而是“把Token用量当作唯一目标”。

Meta的Token排行榜机制，表面上激发了全员使用AI的热情，一定程度上推动了员工尝试新型AI工具，但它无法规避核心漏洞：Token消耗总量与员工的实际业务产出之间并没有直接关联。

同时，微软和Uber的成本危机也证明，单纯地“一刀切”缩减Token额度，只是治标不治本，反而可能误伤到真正高效的AI办公场景。

李彦宏试图给出了一个解决方案，提出了DAA（Daily Active Agent，每日活跃智能体）的概念。他主张用每日活跃智能体的数量来衡量AI的实际渗透程度，而非Token消耗总量。这个方向并非没有道理，但其具体的计算方式仍有待完善，毕竟一个活跃的智能体也未必能真正跑通业务流程，并产生真实价值。

企业转型的核心方向，应是摒弃对Token消耗的盲目崇拜，建立以AI效率为导向的思维模式。

在评估研发领域AI工作质量时，重点应关注AI生成代码的合并通过率、缺陷率、返工率以及项目交付周期，而非简单的调用频率；

考核客服场景时，核心指标应为问题的一次解决率、人工介入率以及用户满意度；

对于营销内容场景，则应侧重产出效率、转化效果以及合规风险的把控；

针对AI智能体（Agent）工作流，则需要重点排查无效重试、冗余上下文信息、不合理的模型调用等浪费行为。

这套精细化的成本与价值管理体系，其核心逻辑在于精准区分有效的AI调用与无效的资源消耗，从而斩断纯粹堆砌用量所造成的浪费行为。

随着AI的深入落地，Token将逐渐成为与电费、云服务、人力成本并列的核心生产开支。硅谷的企业正在为过去盲目的扩张付出代价，而国内企业则正通过补贴来普及AI的使用。

从单纯关注Token数量，到关注每日活跃智能体（DAA），这标志着从“烧了多少钱”向“运行了多少智能体”迈出了一步。然而，“到底值多少钱”这个核心问题，目前还没有人能真正给出明确的答案。