← 返回新闻列表

大厂AI内卷新姿势:Token消耗成新“绩效指标”引发争议

当前企业在AI投入上出现两极分化:微软和Uber因高昂的成本开始限制AI使用,而Meta等公司却将Token消耗量纳入员工绩效考核,引发业内对AI产出衡量标准的广泛讨论。这种以Token用量作为唯一指标的做法,被质疑制造了大量无效浪费和形式主义。

文 / 编辑部 · 2026/05/25 · 阅读约 8 分钟

分享:
大厂AI内卷新姿势:Token消耗成新“绩效指标”引发争议

企业在努力实现降本增效的同时,却发现节省下来的资金可能正被无效的AI计算资源(Token)大量消耗。

近期有报道指出,微软正在内部收缩对Claude Code的授权,其Experiences + Devices团队计划在六月底前关闭大部分第三方Claude Code使用权限,并全面转向自家的GitHub Copilot CLI。此举主要目的是为了减轻AI带来的巨大成本压力。而打车软件巨头Uber的情况则更为严峻,其首席技术官Praveen Neppalli Naga透露,公司2026年全年预计的AI预算在短短四个月内就已基本用尽。

与微软和Uber的“刹车”态度相反,Meta则采取了截然不同的策略。该公司内部推行了Token消耗排行榜,并为消耗量高的员工授予“Token传奇”、“缓存魔法师”等荣誉称号,甚至将Token用量与绩效考核挂钩,实行末位淘汰制度。这项机制推行仅一个月,Meta的全体员工Token总消耗量就从6万亿激增至73.7万亿,增幅超过12倍,导致AI资源消耗完全失控。

尽管各公司策略不同,但它们都面临着同一个核心难题:行业至今尚未建立一套成熟、稳定且可操作的AI价值衡量标准。因此,Token消耗量这类易于统计的指标,便成了唯一的、看似“硬性”的衡量依据。

百度首席执行官李彦宏在前不久的一次行业会议上明确指出,Token消耗固然容易统计,但这并不等同于实际的业务产出。

例如,一名员工为了完成任务,可能会让AI智能体(Agent)运行更多次、输入更长的上下文信息,或者反复尝试让模型生成结果,这必然会迅速增加账单,但最终的业务成果却不一定能随之提升。

Token消耗作为绩效考核指标(“Token KPI”)正在制造一场巨大的浪费。以最大化Token消耗为目标的工作模式(“Tokenmaxxing”)自去年底在硅谷兴起后,目前已蔓延至中国。阿里巴巴、腾讯、字节跳动等国内互联网巨头的技术团队,也已不同程度地将Token使用量纳入员工转正和晋升的考量范围。

当绩效考核与Token用量深度绑定后,职场中的形式主义迅速渗透到AI工作场景。《财经》杂志的报道披露,许多员工为了达到考核目标,会刻意让AI Agent大量读取数万行代码,或堆砌数万字的文献数据,纯粹通过“堆砌工作量”来刷高Token消耗,而没有实际的工作产出。这种现象并非个案,公开数据显示,在全球企业级AI应用中,近一半的Token消耗都被认为是无效浪费。

Meta在一个月内高达73.7万亿的Token消耗中,究竟有多少真正转化成了有效的业务产出?这正是所有Token KPI制度存在的根本漏洞。

与硅谷企业对成本的焦虑不同,国内的大型科技公司正通过高额Token补贴,积极降低员工使用AI的门槛。

根据多方透露的信息,各家企业的福利政策各有侧重:腾讯为核心研发人员提供了每年22.8万元的Token专属套餐,并额外报销每月1000美元的外部AI工具费用;字节跳动对内开放AI工具不限量使用,员工在业余时间体验AI可报销50%,技术岗位的报销上限为每年1000美元;百度为技术岗员工提供了文心一言无限量使用权,并额外补贴最高每年800美元的外部Token费用;360公司更是直接为全体员工充值了1亿Token。

AI工具已不再仅仅是办公软件的插件,它正在逐渐演变为新的生产资料。过去,企业为员工配置电脑、软件账号、云盘和报销额度;而现在,研发、设计、产品和运营等部门都可能需要模型调用额度。尤其在代码生成、智能体工作流、视频创作和知识检索等领域,Token就像是驱动工作的燃油。

然而,燃料已经配发,但如何高效计算“油耗”的问题,许多公司仍未有清晰的解决方案。

Uber的内部数据精确揭示了企业AI成本失控的核心机制缺陷。目前,该公司95%的工程师日常使用AI编码工具,每位工程师每月在AI调用上的成本在500至2000美元之间。70%的代码提交是由AI生成的,AI智能体每周可完成1800次代码变更,相关工作量占比已从不足1%飙升至8%。

从业务落地角度看,这无疑标志着AI渗透率的大幅提升;但对于企业的财务部门而言,这意味着原本刚性可控的IT成本体系已彻底被打破。

成本失控的根本原因在于AI智能体(Agent)的高消耗特性。Gartner研究指出,完成相同任务量时,Agent的Token消耗是传统聊天机器人的5到30倍。高盛预测,到2030年,全球Token消耗量将达到每月约120万亿(quadrillion),是2026年水平的24倍,而其主要驱动力正是企业端智能体的大规模部署。

传统SaaS软件按席位计费,IT部门在采购时可以锁定全年的支出上限。

然而,AI工具的成本结构与此完全不兼容。Token账单会随着使用行为的动态变化而增长,这意味着财务部门缺乏历史数据来建立成本基准;IT部门没有成熟的工具进行实时追踪与成本分摊;业务部门在推广使用AI时,也未能同步建立成本归因机制。

问题并非出在AI本身无用,而是企业的财务运营(FinOps)体系未能跟上AI的消费速度。正因如此,微软和Uber才紧急采取了限制措施。

国内企业的现状与硅谷略有不同。硅谷的焦虑在于Token用量过快,导致预算超支;而国内大厂面临更现实的尴尬:尽管投入了大量资金,但员工对AI工具的使用深度仍不足,实际的业务价值难以体现。

从消费者端数据看,中国AI应用热度空前高涨。量子位智库2026年行业报告显示,今年4月国内AI应用的网页端月访问量突破9亿次,移动应用端月下载量超过2.4亿,日活跃用户达6.7亿,同比增幅高达223%。QuestMobile的数据也同步印证,截至2026年3月,国内AI原生应用的月活跃用户达到4.4亿,其中“豆包”、“千问”和“DeepSeek”稳居行业前三。

然而,火爆的消费者端数据并未同步转化为企业端的生产力提升。

埃森哲《2025中国企业数字化转型指数》数据显示,国内46%的企业已经启动AI适配与落地,但仅有9%的企业实现了显著的业务价值突破。绝大多数企业在AI落地方面,仍停留在浅层试用、盲目推广和摸索应用场景的初级阶段。

在内容创作、客服问答和代码辅助等浅层场景,AI落地的门槛较低,见效也较快;但在核心研发、供应链管理、财务风控和组织协同等关键业务环节,AI落地的适配难度、合规门槛和实施成本都大幅增加。

大型企业全员发放Token补贴的目的,是希望通过资金激励降低AI试错成本,强力推动全体员工融入AI工作流程。这种策略具有一定的合理性:只有足够的使用密度,才能倒逼企业筛选出真正适配业务的场景,并培养员工的AI使用习惯。

但问题在于,如果只鼓励使用,而不建立价值衡量体系,这种福利最终会演变成巨大的账单压力,并可能滋生出类似“制作PPT”、“堆砌文档”式的伪AI工作方式。

AI对职场的渗透速度远超预期。据Cognizant 2026年报告测算,美国93%的岗位将不同程度地受到AI影响,这一预测比之前的估计提前了整整6年。

主要岗位受到AI渗透的影响正在全面爆发。数据显示,2023年管理、金融运营和行政支持类岗位的AI暴露度仅为14%至21%,但目前已飙升至60%至68%;律师岗位的AI暴露度从9%跃升至63%,甚至首席执行官(CEO)岗位的理论AI暴露度也突破了60%。报告同时强调,理论渗透并不代表实际替代,责任问责、行业监管以及人类的主观判断,仍然是制约AI全面落地的核心障碍。

这意味着,AI将继续进入更多岗位,Token消耗也将从研发部门扩散到更广泛的组织层面。企业真正需要面对的问题是,如何判断一笔Token的花费是否物有所值。

Token本身并非问题,企业若想构建成熟的AI生产力体系,必然需要充足的Token投入作为支撑。行业乱象的核心症结,从来不是“Token用得太多”,而是“把Token用量当作唯一目标”。

Meta的Token排行榜机制,表面上激发了全员使用AI的热情,一定程度上推动了员工尝试新型AI工具,但它无法规避核心漏洞:Token消耗总量与员工的实际业务产出之间并没有直接关联。

同时,微软和Uber的成本危机也证明,单纯地“一刀切”缩减Token额度,只是治标不治本,反而可能误伤到真正高效的AI办公场景。

李彦宏试图给出了一个解决方案,提出了DAA(Daily Active Agent,每日活跃智能体)的概念。他主张用每日活跃智能体的数量来衡量AI的实际渗透程度,而非Token消耗总量。这个方向并非没有道理,但其具体的计算方式仍有待完善,毕竟一个活跃的智能体也未必能真正跑通业务流程,并产生真实价值。

企业转型的核心方向,应是摒弃对Token消耗的盲目崇拜,建立以AI效率为导向的思维模式。

在评估研发领域AI工作质量时,重点应关注AI生成代码的合并通过率、缺陷率、返工率以及项目交付周期,而非简单的调用频率;

考核客服场景时,核心指标应为问题的一次解决率、人工介入率以及用户满意度;

对于营销内容场景,则应侧重产出效率、转化效果以及合规风险的把控;

针对AI智能体(Agent)工作流,则需要重点排查无效重试、冗余上下文信息、不合理的模型调用等浪费行为。

这套精细化的成本与价值管理体系,其核心逻辑在于精准区分有效的AI调用与无效的资源消耗,从而斩断纯粹堆砌用量所造成的浪费行为。

随着AI的深入落地,Token将逐渐成为与电费、云服务、人力成本并列的核心生产开支。硅谷的企业正在为过去盲目的扩张付出代价,而国内企业则正通过补贴来普及AI的使用。

从单纯关注Token数量,到关注每日活跃智能体(DAA),这标志着从“烧了多少钱”向“运行了多少智能体”迈出了一步。然而,“到底值多少钱”这个核心问题,目前还没有人能真正给出明确的答案。

广告位 · 文末横幅