menu
close

MIT绘制AI驱动软件工程的障碍地图

由MIT研究人员主导的一项综合性研究识别出了阻碍AI全面自动化软件开发的关键挑战。该研究由Armando Solar-Lezama教授领导,于2025年7月16日发表,提出了一条从简单代码生成迈向复杂工程任务的路线图。研究呼吁业界共同努力,开发更优质的基准测试、提升人机协作,并创建能够反映真实开发过程的丰富数据集。
MIT绘制AI驱动软件工程的障碍地图

尽管AI在生成代码片段方面取得了显著进展,麻省理工学院(MIT)的一项新研究却揭示了实现真正自主软件工程所面临的重大障碍。

这项名为《面向软件工程的AI:挑战与路径》的研究,由MIT教授Armando Solar-Lezama领导,第一作者为Alex Gu。该研究于2025年7月16日发表,并将在2025年国际机器学习大会(ICML 2025,温哥华)上进行报告。

“大家都在谈论以后不再需要程序员,自动化工具层出不穷。”Solar-Lezama表示,“一方面,这个领域确实取得了巨大进步。我们拥有比以往任何时候都更强大的工具。但要真正实现我们期望的全面自动化,还有很长的路要走。”

研究人员指出,当前AI系统在生成小型代码函数方面表现出色,但在更广泛的软件工程任务上,如大规模重构、代码迁移以及复杂系统调试等方面仍然力不从心。像SWE-Bench这样的流行基准测试仅检验针对GitHub问题的几百行代码补丁,无法反映现实中需要优化或从遗留系统迁移数百万行代码的场景。

人机沟通也是一大难题。Gu形容当前的交互为“一条细线”,AI工具往往生成庞大且无结构的文件,测试流于表面,缺乏有效利用人类开发者依赖的调试工具和静态分析器的能力。

研究团队并未提出单一解决方案,而是呼吁业界共同努力:开发能够捕捉开发者随时间编写和重构代码过程的丰富数据集;创建可衡量重构质量和缺陷修复持久性的共享评测套件;以及构建能够揭示模型不确定性、并邀请人类指导的透明工具。

“软件已经成为金融、交通、医疗以及无数其他关键系统的基础。”Solar-Lezama指出。研究团队展望未来,AI将承担例行开发任务,让人类工程师专注于高层设计决策和需要人类判断的复杂权衡。

Source: Mit

Latest News