Въпреки значителния напредък на изкуствения интелект в генерирането на кодови откъси, ново проучване на MIT разкрива съществени бариери пред постигането на напълно автономно софтуерно инженерство.
Изследването, озаглавено „Предизвикателства и пътища към ИИ за софтуерно инженерство“, е проведено от екип под ръководството на професор Армандо Солар-Лезама и първия автор Алекс Гу. Публикувано на 16 юли 2025 г., то ще бъде представено на Международната конференция по машинно обучение (ICML 2025) във Ванкувър.
„Всички говорят как вече не са нужни програмисти и колко автоматизация има“, казва Солар-Лезама. „От една страна, областта постигна огромен напредък. Имаме инструменти, които са много по-мощни от всичко, което сме виждали досега. Но все още има дълъг път до реализирането на пълния потенциал на автоматизацията, който очакваме.“
Изследователите твърдят, че настоящите ИИ системи се справят отлично с генерирането на малки функции, но изпитват затруднения с по-широки задачи като мащабно рефакториране, миграция на код и дебъгване на сложни системи. Популярни бенчмаркове като SWE-Bench тестват само кръпки по GitHub проблеми, включващи няколкостотин реда код, но не отразяват реални сценарии, при които милиони редове трябва да бъдат оптимизирани или мигрирани от наследени системи.
Комуникацията между човек и машина е друго значително предизвикателство. Гу описва днешното взаимодействие като „тънка линия на комуникация“, при която ИИ инструментите често генерират големи, неструктурирани файлове с повърхностни тестове, без да могат ефективно да използват дебъгинг инструменти и статични анализатори, на които разчитат човешките разработчици.
Вместо да предлагат едно решение, изследователите призовават за мащабни усилия на общността: създаване на по-богати набори от данни, които отразяват как разработчиците пишат и рефакторират код с течение на времето; изграждане на споделени тестови пакети, които измерват качеството на рефакторинга и дълготрайността на поправките; и разработване на прозрачни инструменти, които показват несигурността на модела и канят човешка намеса.
„Софтуерът вече е в основата на финансите, транспорта, здравеопазването и безброй други критични системи“, отбелязва Солар-Лезама. Екипът изследователи си представя бъдеще, в което ИИ поема рутинните задачи по разработка, а човешките инженери се фокусират върху вземането на стратегически решения и сложни компромиси, изискващи човешка преценка.