尽管被认为有益，AI 工具却让资深程序员编程变慢

METR 的一项严格研究发现，经验丰富的开源开发者在使用如 Cursor Pro 搭配 Claude 3.5/3.7 Sonnet 等 AI 工具时，完成编码任务所需时间比不使用 AI 辅助时多出 19%。该随机对照试验涉及 16 名资深开发者，基于他们自有仓库的 246 个真实任务。令人意外的是，开发者普遍认为 AI 让他们快了 20%，这揭示了认知与现实之间的巨大落差。

一项开创性研究对“AI 编程助手能全面提升开发者生产力”的主流观点提出了挑战。

模型评估与威胁研究组织（METR）开展了一项随机对照试验，测量 2025 年初 AI 工具对经验丰富的开源开发者在自有仓库中编程效率的影响。令人惊讶的是，研究发现开发者在使用 AI 工具时，完成任务所需时间比不使用时多出 19%——AI 实际上让他们变慢了。

研究跟踪了 16 名资深开源开发者，他们在平均代码量超百万行、GitHub 星标数超 2.2 万的成熟仓库中完成了 246 个真实编码任务。每项任务随机分配为允许或禁止使用 AI 工具，开发者主要在 2025 年 2 月至 6 月期间使用 Cursor Pro 搭配 Claude 3.5 和 3.7 Sonnet。

结果令所有人感到意外，包括参与研究的开发者本人。即便在完成任务后，开发者们仍估计 AI 让他们的生产效率提升了 20%，而数据却清楚显示实际下降了 19%。这凸显了一个关键洞察：当人们报告 AI 加快了工作进度时，他们对实际影响可能完全误判。

METR 研究人员指出，效率下降的潜在原因包括：开发者花了更多时间在提示 AI 和等待回复上，而不是实际编码。这项研究对 2025 年 AI 编码工具所宣称的普遍生产力提升提出了重要质疑。

不过，这并不意味着 AI 工具普遍无效。METR 指出，在不熟悉的代码库、早期项目阶段，或对于经验较少的程序员，AI 仍可能加快进展。研究团队计划在未来进一步探索这些情景。他们还强调，这项研究仅反映了 2025 年初工具的现状，随着模型速度提升、更好集成或提示实践改进，结果可能会发生变化。

对于部署 AI 助手的团队来说，信息很明确：AI 编码工具仍在不断演进，但以目前形态，尤其是在资深工程师处理熟悉代码时，并不能保证效率提升。企业应在自身环境中实际测试和衡量影响，而不能仅凭主观感受来信任 AI 的提速效果。

Source:

尽管被认为有益，AI 工具却让资深程序员编程变慢

Latest News

谷歌发布超高效 Gemini 2.5 Flash-Lite，专为成本敏感型 AI 场景打造

Google 推出 Gemini CLI：为开发者终端打造的 AI 助手

Google发布Imagen 4，革新文本渲染能力

谷歌AI以突破性检测工具革新癌症护理

谷歌端侧AI为机器人带来自主智能

谷歌AI代理成功阻止关键SQLite漏洞被利用

Enovix 硅电池突破助力 AI 智能手机革命

Lightchain AI 完成 2100 万美元融资，推动 AI 驱动区块链主网发布

谷歌识别出威胁AI智能体安全的“三重致命组合”

企业缺乏 AI 时代成功所需的关键人类技能

尽管被认为有益，AI 工具却让资深程序员编程变慢

Related Articles

谷歌发布超高效 Gemini 2.5 Flash-Lite，专为成本敏感型 AI 场景打造

Google 推出 Gemini CLI：为开发者终端打造的 AI 助手

Google发布Imagen 4，革新文本渲染能力

谷歌AI以突破性检测工具革新癌症护理

谷歌端侧AI为机器人带来自主智能

Latest News

谷歌发布超高效 Gemini 2.5 Flash-Lite，专为成本敏感型 AI 场景打造

Google 推出 Gemini CLI：为开发者终端打造的 AI 助手

Google发布Imagen 4，革新文本渲染能力

谷歌AI以突破性检测工具革新癌症护理

谷歌端侧AI为机器人带来自主智能

谷歌AI代理成功阻止关键SQLite漏洞被利用

Enovix 硅电池突破助力 AI 智能手机革命

Lightchain AI 完成 2100 万美元融资，推动 AI 驱动区块链主网发布

谷歌识别出威胁AI智能体安全的“三重致命组合”

企业缺乏 AI 时代成功所需的关键人类技能