TMTPOST——人工智能突然变得昂贵起来。
2026年3月,腾讯云上某些AI模型的定价上涨了400%以上。阿里云也多次在同月内上调了其百炼平台上某些模型的AI服务价格。
我一位从事内容创作的朋友算了一笔账:使用大模型API接口,他批量生成了一周的短视频脚本(约50个)。三个月前按token用量计费时,大约花费15元人民币。但在3月,随着多个人工智能中继站关闭,以及各大云厂商相继上调模型价格,现在相同的工作量成本接近60元。
2024年初,中国的日均token调用量为1000亿。到2026年3月,这一数字已达到140万亿。
两年之内,增长了1000多倍。
token是什么?
如果你问“通义灵码”,“深圳今天天气怎么样?”,这在幕后大致相当于200个token(包括问题和回答)。如果你让DeepSeek为你撰写一份5000字的方案,这大致相当于8000到10000个token。token是AI用来处理信息的基本单位,也是计算费用的计费单位。你可以把它看作是AI的字数计数器:用得越多,消耗的算力就越多。
那么,如果AI突然变得昂贵了,这仅仅是厂商试图提价吗?
涨价背后的原因
摩根大通预测,到2030年,中国的AI推理token消耗量将比2025年高出约370倍。高盛预测,同期全球token消耗量将增长24倍。
结论都是一样的:AI的算力消耗正在进入指数级增长的轨道。
归根结底,原因是人们使用AI的方式发生了变化。
过去,我们通常问AI一个问题,它回答几十个token,然后就结束了。但现在,越来越多的人要求AI“替我做事”。
例如:“帮我规划一个五日游,包括航班、酒店推荐、观光路线和美食推荐。”AI不会一次性完成这项任务——它需要多轮推理,调用多个工具,并逐步执行——在行业内,这被称为智能体(Agent)。一个智能体任务所消耗的token是正常问答的100到1000倍。
从问答到执行,算力消耗相差三个数量级。
在供给侧,字节跳动、阿里巴巴和腾讯等领先云提供商的AI基础设施支出激增。从2024年到2025年,核心AI芯片组件的支出从220亿美元增加到520亿美元,增长了一倍多。高带宽内存(HBM)在GPU物料成本中的占比从约50%上升到大约三分之二。芯片昂贵、内存昂贵、电力昂贵——导致计算成本全面上涨。
因此,涨价对厂商来说并不是一个真正的选择;需求一直非常强劲,而产能根本无法跟上。
这很像2010年左右的移动通信。智能手机兴起,但基站不足,导致数据费用昂贵。只有在4G和5G大规模建设之后,数据才变得便宜。AI现在正处于那个相同的转折点。
只不过这一次,建设“AI基站”的不是三大电信运营商,而是中国正在推出的一项全新基础设施——一体化算力网络。
算力黑洞
当人们听到“公司使用AI”时,许多人会本能地想到一个不懂AI的老板,却仍然要求员工使用AI来审查报告和撰写计划。
这种想法太狭隘了。AI计算消耗的最大部分根本不在那里。
制造业。富士康和宁德时代等公司使用AI进行视觉质量检测——摄像头捕捉产品图像,AI实时判断每个产品是合格品还是缺陷品。仅仅一条生产线24小时运行,每天就必须处理数百万张产品图像,这背后是持续的算力消耗。
程序员。“通义灵码”和GitHub Copilot帮助开发者编写代码和查找bug。在中国,数百万开发者每天都在使用AI辅助编程,每个请求都会消耗算力。
内容产业。使用AI生成文案、视频脚本和产品描述。你每天刷到的短视频背后,很大一部分文案都有AI的参与。
医疗保健。AI阅览CT扫描,检测早期肺癌,在某些场景下其准确性已接近甚至超过人工判读。
科学研究。AI辅助药物发现极大地缩短了从靶点识别到分子筛选的时间——与传统工作流程所需的数年相比,效率大幅提升。
农业。卫星遥感结合AI分析,可以确定哪些地块缺水或有虫害,精确指导农民施肥和喷洒农药。
所有这些场景都有一个共同点:它们消耗巨大的算力。而且这些不是少数人玩的游戏——制造检测影响着每个产品的质量,医疗AI影响着每个人的健康,农业AI影响着作物产量。
当算力短缺时,涨价的压力不会止于云提供商。它将沿着链条一步步传递,最终影响到每一个普通人。
如何解决?中国的答案是建设一个“算力高铁网络”。
一张网络的责任
水网,下一代电网
