# AI 编程工具普及背后：效率提升的假象与代码维护的隐患

- 来源：IT之家（RSS）
- 发布时间：2026-05-31 11:37
- AIHOT 分数：66
- AIHOT 链接：https://aihot.virxact.com/items/cmpt9zjli08iesluzfi70zpij
- 原文链接：https://www.ithome.com/0/957/744.htm

## 正文

IT之家 5 月 31 日消息，研究人员发现，2026 年，AI 编程工具已然成为开发者离不开的帮手。

但另有研究者提醒，尽管 AI 无疑能让程序员写代码的速度变得更快，代码质量却未必随之提升，这在未来可能会埋下诸多隐患。

具体来看，知名人工智能研究实验室 METR 在 2026 年 2 月公布了一项出人意料的结论：如今绝大多数开发者哪怕只是处理少量工作，也离不开 AI 工具。

此前在 2025 年，该机构曾发布过一份极具开创性的研究，聚焦 AI 对编程效率的影响。本次 METR 本打算跟进更新这项研究，对比开源开发者手动编码与借助 AI 编码的耗时差异。

在 2025 年的研究中，开发者们都表示 AI 提升了自己的工作效率，可最终数据结果却令所有人意外：AI 实际上拖慢了整体工作进度。AI 生成代码的速度固然很快，但开发者要额外花费大量时间排查、修复漏洞，还要不断引导 AI、等待其完成任务。

当 METR 团队想要复刻这项实验，以此评测 AI 技术与程序员能力的进步时，实验却无法开展。

研究人员坦言，开发者们不愿参与实验，原因是哪怕只是为了完成测试，他们也无法接受脱离 AI 工作。

无奈之下，METR 在同年 5 月转而发布了一份调查问卷，由技术从业者自主反馈 AI 带来的效率提升。不出所料，受访者普遍认为，AI 让自己在公司里的工作价值翻了一倍。

然而，近期频频爆出的词元（token）滥用导致成本激增的相关新闻，再加上多项最新研究，都让这类主观自评显得站不住脚。

IT之家注意到，用词元使用量衡量 AI 办公效率（即“词元量化考核”）是 2026 年以来的行业风潮，而这股热潮如今或许已经走向落幕。

据《金融时报》本周报道，亚马逊关停了内部名为“基罗排名”的词元用量排行榜。原因是员工为冲榜单过度调用智能体，不仅恶意刷高词元消耗，还大幅增加了运营成本。这一现象也印证了：使用 AI 并不等同于工作效率提升。

另据科技媒体《The Information》消息，优步仅用四个月就耗尽了 2026 全年的 AI 预算。公司首席运营官安德鲁・麦克唐纳近日在一档播客节目中坦言，高额投入并未带来项目体量或工作效率的实质性增长。

程序员、作家詹姆斯・肖尔在一篇爆红于 Hacker News 的博客文章中一针见血地指出：AI 生成的代码也没能减少后续的代码维护工作，反而可能让维护压力变得更大。

他写道：“就算你现在写代码的速度快了一倍，也得祈祷维护成本能随之减半。否则只会陷入困境 —— 你换来的只是一时的速度提升，却被套上了永久的运维枷锁。”

还有更多证据表明，AI 会加剧代码维护难题。

可靠性工程代理初创公司 Entelligence AI 的创始人兼首席执行官艾斯瓦里亚・桑卡尔发布的一条推文引发广泛转发，她表示，各大企业近 44% 的 AI 词元消耗，都用于修复 AI 自身生成的程序漏洞。与此同时，代码审核工具厂商 CodeRabbit 分析开源代码合并请求后发现，AI 编写的代码出现问题的概率，是人工代码的 1.7 倍。

客观来说，上述数据来自售卖 AI 代码审核工具的企业，难免带有自利倾向。

但独立研究团队也得出了相似结论。新加坡管理大学的研究人员在 4 月发布报告警示：AI 生成的代码会给实际软件项目埋下长期维护隐患。

既然程序员已经高度依赖 AI 助手，该如何解决这些问题？

主推 AI 编程智能体的厂商给出的方案是：开发者可以借助同类工具，快速处理 AI 产出代码所带来的繁杂修复工作。知名 AI 编程智能体 Devin 的开发方 Cognition 公司创始人兼首席执行官 Scott Wu 便持这一观点。

不过他也坦言，尽管 Devin 能够独立完成工作，但综合不同任务来看，它目前的能力仅介于初级与中级程序员之间，远达不到“交付之后就无需过问”的理想状态。

新加坡管理大学的研究团队则提出了更侧重人的解决思路：程序员要像精通常用编程语言一样，吃透 AI 的能力边界，清楚它擅长和不擅长的工作；同时搭建专门适配 AI 流程的完善质检体系，并且必须像审核新人代码一样，逐一对 AI 产出内容进行细致核查。

研究人员还提到（Scott Wu 也对此表示认同），软件架构、安全设计这类顶层核心工作，仍应当由人类程序员主导完成。