Chociaż sztuczna inteligencja poczyniła imponujące postępy w generowaniu fragmentów kodu, nowe badanie MIT ujawnia istotne bariery na drodze do osiągnięcia w pełni autonomicznej inżynierii oprogramowania.
Badanie zatytułowane „Wyzwania i ścieżki rozwoju AI dla inżynierii oprogramowania” zostało przeprowadzone przez zespół pod kierownictwem profesora MIT Armando Solar-Lezamy, a pierwszym autorem jest Alex Gu. Opublikowane 16 lipca 2025 roku, zostanie zaprezentowane podczas Międzynarodowej Konferencji Uczenia Maszynowego (ICML 2025) w Vancouver.
„Wszyscy mówią, że programiści nie będą już potrzebni, bo mamy teraz tyle automatyzacji” – mówi Solar-Lezama. „Z jednej strony dziedzina poczyniła ogromny postęp. Mamy narzędzia znacznie potężniejsze niż kiedykolwiek wcześniej. Ale przed nami jeszcze długa droga, by w pełni zrealizować obietnicę automatyzacji, której oczekujemy.”
Naukowcy argumentują, że obecne systemy AI świetnie radzą sobie z generowaniem małych funkcji, ale mają trudności z szerszymi zadaniami inżynierii oprogramowania, takimi jak refaktoryzacja na dużą skalę, migracja kodu czy debugowanie złożonych systemów. Popularne benchmarki, jak SWE-Bench, testują jedynie poprawki do problemów z GitHuba obejmujące kilkaset linii kodu, nie oddając realnych scenariuszy, w których optymalizacji lub migracji wymagać mogą miliony linii, często z przestarzałych systemów.
Kolejnym istotnym wyzwaniem jest komunikacja człowiek-maszyna. Gu opisuje dzisiejszą interakcję jako „cienką linię komunikacji”, gdzie narzędzia AI często generują duże, nieustrukturyzowane pliki z powierzchownymi testami, nie potrafiąc efektywnie korzystać z narzędzi debugujących i analizatorów statycznych, na których polegają programiści.
Zamiast proponować jedno rozwiązanie, naukowcy apelują o działania na skalę społeczności: rozwijanie bogatszych zbiorów danych, które odzwierciedlają, jak programiści piszą i refaktoryzują kod w czasie; tworzenie wspólnych zestawów ewaluacyjnych mierzących jakość refaktoryzacji i trwałość poprawek błędów; oraz budowanie przejrzystych narzędzi ujawniających niepewność modeli i zapraszających do współpracy człowieka.
„Oprogramowanie już dziś stanowi fundament finansów, transportu, opieki zdrowotnej i niezliczonych innych kluczowych systemów” – zauważa Solar-Lezama. Zespół badawczy wyobraża sobie przyszłość, w której AI przejmuje rutynowe zadania programistyczne, pozwalając inżynierom skupić się na projektowaniu na wysokim poziomie i złożonych kompromisach wymagających ludzkiego osądu.