到了2026年,人工智能编程工具已深度融入开发者的日常工作,成为不可或缺的辅助力量。然而,伴随AI普及的,是对其真实效能的深刻质疑和对未来可能涌现的代码维护难题的忧虑。
著名人工智能研究实验室METR于2026年2月公布了一项重要发现:绝大多数开发者,即使是面对简单的任务,也离不开AI工具的帮助。在先前2025年的研究中,METR曾探讨AI对编程效率的影响。当时,开发者普遍表示AI提升了工作效率,但数据却出人意料地显示,AI实际上拖慢了整体项目进度。原因是尽管AI代码生成迅速,开发者却需要投入大量额外时间进行漏洞排查、修复,并持续引导AI完成任务。
当METR团队计划在2026年复现这项实验,以评估AI技术与程序员能力的发展时,实验却难以进行。研究人员透露,开发者普遍拒绝参与不使用AI的测试,他们表示即便只是为了实验,也无法接受脱离AI工具进行工作。
无奈之下,METR在同年5月转而发布了一份面向技术专业人员的调查问卷,让他们自行评估AI带来的效率提升。结果显示,受访者普遍认为AI使他们在公司的价值翻倍。然而,近期曝光的“词元滥用导致成本激增”事件,以及多项新的研究成果,使这些主观评价显得站不住脚。
以“词元用量”作为评估AI办公效率的“词元量化考核”,曾是2026年行业的一股风潮,但现在这股热潮可能正在悄然退去。据《金融时报》本周报道,亚马逊已叫停了内部的“基罗排名”词元用量排行榜。原因是员工为了冲榜过度调用智能体,不仅恶意刷高词元消耗,还大幅推升了运营成本。这清楚地表明:仅使用AI并不等同于效率提高。
科技媒体《The Information》也披露,优步在短短四个月内就耗尽了其2026年的全年AI预算。公司首席运营官安德鲁·麦克唐纳近期在一档播客节目中坦言,尽管进行了高额投入,但并未能带来项目规模或工作效率的实质性增长。
程序员兼作家詹姆斯·肖尔在一篇广为流传的博客文章中尖锐地指出,AI生成的代码并未减轻后续维护负担,反而可能使其变得更为沉重。他警告称:“即便你现在代码编写速度提升了一倍,也要祈祷维护成本能相应减半。否则,你得到的将只是一时的速度优势,却为自己套上了永久的运维枷锁。”
更多证据表明AI正在加剧代码维护的复杂性。可靠性工程代理初创公司Entelligence AI的创始人兼首席执行官艾斯瓦里亚·桑卡尔在社交媒体上发布一条推文,指出企业近44%的AI词元消耗都耗费在修复AI自身生成的程序漏洞上。同时,代码审核工具供应商CodeRabbit分析开源代码合并请求后发现,AI编写的代码出现问题的几率是人工代码的1.7倍。尽管这些数据源于销售相关产品的企业,可能带有一定倾向性,但独立研究团队也得出了类似结论。新加坡管理大学的研究人员在4月发布的报告中警示,AI生成的代码可能为实际软件项目埋下长期维护隐患。
面对程序员对AI高度依赖的现状,如何解决这些问题成为关键。AI编程智能体厂商提出的方案是:开发者可借助同类工具,迅速处理AI产出代码带来的繁琐修复任务。知名AI编程智能体Devin的开发公司Cognition的创始人兼首席执行官斯科特·吴便持此观点。但他坦言,尽管Devin能独立工作,但其当前能力介于初级和中级程序员之间,远未达到“交付后无需操心”的理想状态。
新加坡管理大学的研究团队则提出了更注重“人”的解决方案:程序员应像精通编程语言一样,彻底理解AI的能力边界,明确其所长与所短。同时,应建立专门适配AI流程的完善质检体系,并像审查新员工代码一样,对AI的产出内容进行细致核查。研究人员还指出(斯科特·吴对此表示认同),软件架构、安全设计等核心顶层工作,仍需由人类程序员主导完成。
