TMTPOST——AI突然变得更贵了。
2026年3月,腾讯云上某些AI模型的价格上涨了400%以上。阿里云也多次上调了其百炼平台上某些模型的AI服务价格。
我的一位从事内容创作的朋友算了一下:他使用API调用大模型批量生成了一周的短视频脚本(大约50个)。三个月前,按token用量计费,费用约为15元人民币。在3月份许多AI中继中心关闭,各大云服务商相继上调模型价格后,现在完成同样的工作量费用接近60元人民币。
2024年初,中国每日token调用量平均为1000亿次。到2026年3月,这个数字已变为140万亿次。
两年内,增长了1000多倍。
什么是token?
如果你问“问天”,“深圳今天天气怎么样?” 在后台大约是200个token(包括问题和回复)。如果你让DeepSeek为你写一份5000字的项目计划,大约需要8000到10000个token。Token是AI处理信息的基本单位——也是计算计费的单位。你可以把它们想象成AI的字数和字符计数器:使用越多,消耗的算力就越多。
那么,如果AI突然变得更贵了,这仅仅是供应商试图涨价吗?
涨价背后
摩根大通预测,到2030年,中国AI推理token消耗量将比2025年高出约370倍。高盛预测,在同一时期,全球token消耗量将增加24倍。
结论是相同的:AI的算力消耗正进入指数级增长的轨道。
归根结底,原因是人们使用AI的方式发生了变化。
过去,我们通常问AI一个问题,它用几十个token回答,然后就结束了。但现在,越来越多的人要求AI“替我办事”。
例如:“帮我计划一个五天行程,包括航班、酒店推荐、观光路线和美食推荐。” AI不会一次性完成——它需要多轮推理,调用多个工具,并逐步执行——在行业内,这被称为“Agent”。单个Agent任务消耗的token量可以是普通问答的100到1000倍。
从问答到执行,算力消耗相差三个数量级。
在供给侧,字节跳动、阿里巴巴、腾讯等领先云服务商的AI基础设施支出激增。从2024年到2025年,核心AI芯片组件的支出从220亿美元翻倍至520亿美元。高带宽内存(HBM)从占GPU物料清单的约50%上升到约三分之二。芯片昂贵,内存昂贵,电力昂贵——导致计算成本全面上涨。
所以涨价对供应商来说并非真正的选择;需求过于强劲,产能根本无法跟上。
这很像2010年左右的移动通信。智能手机兴起,但基站不足,导致数据费用昂贵。直到4G和5G大规模建设后,数据才变得便宜。AI现在正处于同样的转折点。
只是这一次,建设“AI基站”的不是三大电信运营商,而是中国正在部署的一种全新基础设施——一体化算力网络。
算力黑洞
当人们听到“公司使用AI”时,许多人会本能地想到一个不懂AI的老板,却仍然要求员工使用AI审查报告和撰写计划。
那想得太小了。AI算力消耗的最大部分根本不在这里。
制造业。富士康和宁德时代等公司使用AI进行视觉质量检测——摄像头捕捉产品图像,AI实时判断每个产品是合格品还是缺陷品。仅一条生产线24小时运行,每天就必须处理数百万张产品图像,这背后是持续的算力消耗。
程序员。通义灵码和GitHub Copilot帮助开发者编写代码和查找bug。在中国,数百万开发者已经每天使用AI辅助编程,每个请求都消耗算力。
内容产业。使用AI生成文案、视频脚本和产品描述。你每天刷到的短视频背后,很大一部分文案都有AI的参与。
医疗保健。AI读取CT扫描并检测早期肺癌,在某些场景下,其准确性已接近甚至超越人类解读。
科学研究。AI辅助药物发现极大地缩短了从靶点识别到分子筛选的时间——比传统流程所需的数年时间大幅压缩。
农业。卫星遥感结合AI分析可以确定哪些地块缺水或有虫害,精确指导农民施肥和施用农药。
所有这些场景都有一个共同点:它们消耗巨大的算力。而且它们不是少数人玩的游戏——制造业检测影响每个产品的质量,医疗AI影响每个人的健康,农业AI影响作物产量。
当算力短缺时,涨价的压力不会止步于云服务商。它将沿着产业链一步步传递,最终触及每一个普通人。
如何解决?中国的答案是建设一个“算力高铁网络”。
一张网络的责任
水网、下一代电力网
