MIT绘制AI驱动软件工程的障碍地图

由MIT研究人员主导的一项综合性研究识别出了阻碍AI全面自动化软件开发的关键挑战。该研究由Armando Solar-Lezama教授领导，于2025年7月16日发表，提出了一条从简单代码生成迈向复杂工程任务的路线图。研究呼吁业界共同努力，开发更优质的基准测试、提升人机协作，并创建能够反映真实开发过程的丰富数据集。

尽管AI在生成代码片段方面取得了显著进展，麻省理工学院（MIT）的一项新研究却揭示了实现真正自主软件工程所面临的重大障碍。

这项名为《面向软件工程的AI：挑战与路径》的研究，由MIT教授Armando Solar-Lezama领导，第一作者为Alex Gu。该研究于2025年7月16日发表，并将在2025年国际机器学习大会（ICML 2025，温哥华）上进行报告。

“大家都在谈论以后不再需要程序员，自动化工具层出不穷。”Solar-Lezama表示，“一方面，这个领域确实取得了巨大进步。我们拥有比以往任何时候都更强大的工具。但要真正实现我们期望的全面自动化，还有很长的路要走。”

研究人员指出，当前AI系统在生成小型代码函数方面表现出色，但在更广泛的软件工程任务上，如大规模重构、代码迁移以及复杂系统调试等方面仍然力不从心。像SWE-Bench这样的流行基准测试仅检验针对GitHub问题的几百行代码补丁，无法反映现实中需要优化或从遗留系统迁移数百万行代码的场景。

人机沟通也是一大难题。Gu形容当前的交互为“一条细线”，AI工具往往生成庞大且无结构的文件，测试流于表面，缺乏有效利用人类开发者依赖的调试工具和静态分析器的能力。

研究团队并未提出单一解决方案，而是呼吁业界共同努力：开发能够捕捉开发者随时间编写和重构代码过程的丰富数据集；创建可衡量重构质量和缺陷修复持久性的共享评测套件；以及构建能够揭示模型不确定性、并邀请人类指导的透明工具。

“软件已经成为金融、交通、医疗以及无数其他关键系统的基础。”Solar-Lezama指出。研究团队展望未来，AI将承担例行开发任务，让人类工程师专注于高层设计决策和需要人类判断的复杂权衡。

Source: Mit

MIT绘制AI驱动软件工程的障碍地图

Latest News

OpenAI 推出 ChatGPT Agent，统一 AI 工具实现自主任务处理

OpenAI携手Shopify，将ChatGPT升级为购物中心并内置结账功能

AI自动化推动Tech Mahindra逆势增长

xAI在与五角大楼签约之际推出带有性暗示的AI陪伴角色

谷歌AI现可代用户拨打电话，彻底解放你的双手

穆拉蒂的Thinking Machines Lab获20亿美元融资，推动AI革命

标普全球发布AI就绪元数据，革新金融分析领域

美联储积极采用AI提升研究能力，同时审慎评估其经济影响

AWS发布为新一代AI芯片定制的冷却系统

MIT推出AI教练，显著提升大语言模型问题解决能力

MIT绘制AI驱动软件工程的障碍地图

Related Articles

OpenAI 推出 ChatGPT Agent，统一 AI 工具实现自主任务处理

OpenAI携手Shopify，将ChatGPT升级为购物中心并内置结账功能

AI自动化推动Tech Mahindra逆势增长

xAI在与五角大楼签约之际推出带有性暗示的AI陪伴角色

谷歌AI现可代用户拨打电话，彻底解放你的双手

Latest News

OpenAI 推出 ChatGPT Agent，统一 AI 工具实现自主任务处理

OpenAI携手Shopify，将ChatGPT升级为购物中心并内置结账功能

AI自动化推动Tech Mahindra逆势增长

xAI在与五角大楼签约之际推出带有性暗示的AI陪伴角色

谷歌AI现可代用户拨打电话，彻底解放你的双手

穆拉蒂的Thinking Machines Lab获20亿美元融资，推动AI革命

标普全球发布AI就绪元数据，革新金融分析领域

美联储积极采用AI提升研究能力，同时审慎评估其经济影响

AWS发布为新一代AI芯片定制的冷却系统

MIT推出AI教练，显著提升大语言模型问题解决能力