近期,人工智能服务的成本经历了一轮显著增长。例如,到2026年3月,腾讯云上部分AI模型的收费上涨了超过400%。与此同时,阿里云也多次调整了其百炼平台上特定AI服务的价格。
一位专注于内容创作的朋友分享了他的经历:过去,批量生成一周约50个短视频脚本所需的API调用,按token计算大约仅需人民币15元。然而,自今年3月起,随着许多AI中继中心关闭以及主要云服务商上调价格,完成同样的工作量现在需要近60元,费用几乎翻了两番。
数据显示,2024年初,中国每日的token调用量平均为1000亿次,而到2026年3月,这一数字已飙升至惊人的140万亿次,两年内完成了千倍以上的增长。
那么,究竟什么是token?简单来说,它是人工智能处理信息的基本计量单位,也是算力计费的依据。当你向“通义千问”提问“深圳今天天气怎么样?”——这个过程大约会消耗200个token。若委托DeepSeek撰写一份5000字的方案,则可能需要8000至10000个token。可以将其类比为AI的字符或字数统计器:使用越多,消耗的算力自然就越多。
人工智能成本的急剧提升,仅仅是供应商在试图涨价吗?答案并非如此简单,这背后反映了需求模式的巨大转变。
摩根大通预测,到2030年,中国在AI推理token上的消耗量将比2025年高出大约370倍。高盛则预计,同期全球token消耗量将增长24倍。这些预测共同指向一个结论:人工智能算力的消耗正迈入指数级增长的轨道。
这种爆发式增长的核心原因在于人们使用AI方式的演变。过去,我们大多是向AI提出简单问题,获得简短回复。而今,用户更倾向于让AI执行复杂任务,例如:“帮我规划一个五日游,包括航班、酒店、观光与美食推荐。”执行此类“Agent”任务时,AI需要进行多轮推理、调用多种工具并逐步完成,其消耗的token量可能是普通问答的100到1000倍。从简单的问答到复杂的执行,算力需求有着三数量级的巨大差异。
在供应端,字节跳动、阿里巴巴、腾讯等领先的云服务提供商在AI基础设施上的投入正高速增长。从2024到2025年,核心AI芯片组件的支出从220亿美元增至520亿美元,增幅超过一倍。高带宽内存(HBM)在GPU物料清单中的比重也从大约50%上升到近三分之二。芯片、内存和电力成本的全面上涨,直接推高了整体计算成本。
因此,提价并非供应商的主动选择,而是源于持续过剩的需求和无法跟上的产能。这与2010年左右移动通信发展初期的情况颇为相似:智能手机普及初期,基站不足导致数据费用高昂,直到4G、5G大规模建设后,数据成本才得以降低。AI目前正处于类似的转折点。
不同的是,这一次承担“AI基站”建设任务的,并非传统电信运营商,而是中国正在大力推进的一项全新基础设施——一体化算力网络。
“算力黑洞”并非仅限于人们所想象的日常办公场景,其最大的消耗点隐藏在更广泛的产业之中。例如,在制造业领域,富士康和宁德时代等企业利用AI进行视觉质量检测,每日对数百万张产品图像进行实时分析,每条生产线都需要持续的强大算力支撑。程序员们通过“通义灵码”和GitHub Copilot等工具辅助编程和查找bug,中国数百万开发者每天都在产生巨大的算力需求。内容产业也大量使用AI生成文案、视频脚本和产品描述,短视频中许多文案都有AI的参与。
在医疗健康领域,AI辅助医生读取CT扫描,检测早期肺癌,其准确性在某些情境下甚至超越了人类。科学研究中,AI辅助药物发现极大地缩短了从靶点识别到分子筛选的时间。农业方面,卫星遥感结合AI分析,能够精准指导农民灌溉施肥和病虫害防治。
上述所有场景的共同特征是海量的算力消耗。这些应用并非少数人的专属,而是关乎产品质量、人类健康和作物收成等国计民生。当算力供应不足时,涨价的压力将沿着产业链传导,最终影响到每一个人。
为应对这一挑战,中国的解决方案是建设一个宏伟的“算力高铁网络”,以保障国家未来的数字发展。
