Iako je umjetna inteligencija ostvarila izuzetan napredak u generiranju isječaka koda, novo MIT-ovo istraživanje otkriva značajne prepreke na putu prema istinski autonomnom softverskom inženjerstvu.
Istraživanje pod nazivom "Izazovi i putevi prema AI-u za softversko inženjerstvo" provela je ekipa predvođena MIT profesorom Armandom Solar-Lezamom i prvim autorom Alexom Guom. Objavljeno 16. srpnja 2025., istraživanje će biti predstavljeno na Međunarodnoj konferenciji o strojnom učenju (ICML 2025) u Vancouveru.
"Svi govore o tome kako nam više ne trebaju programeri i kako je sada dostupna sva ta automatizacija," kaže Solar-Lezama. "S jedne strane, područje je ostvarilo ogroman napredak. Imamo alate koji su daleko moćniji nego ikad prije. No, još je dug put do ispunjenja punog potencijala automatizacije koji očekujemo."
Istraživači tvrde da trenutni AI sustavi briljiraju u generiranju malih funkcija koda, ali se muče sa širim softverskim inženjerskim zadacima poput refaktoriranja velikih sustava, migracije koda i otklanjanja pogrešaka u složenim sustavima. Popularna mjerila poput SWE-Bench testiraju samo zakrpe za GitHub probleme koji uključuju nekoliko stotina linija koda, ne obuhvaćajući stvarne scenarije u kojima milijuni linija trebaju optimizaciju ili migraciju iz naslijeđenih sustava.
Komunikacija između čovjeka i stroja predstavlja još jedan značajan izazov. Gu opisuje današnju interakciju kao "tanku liniju komunikacije", gdje AI alati često generiraju velike, nestrukturirane datoteke s površnim testovima, bez mogućnosti učinkovitog korištenja alata za otklanjanje pogrešaka i statičkih analizatora na koje se oslanjaju ljudski programeri.
Umjesto predlaganja jednog rješenja, istraživači pozivaju na zajedničke napore: razvoj bogatijih skupova podataka koji prate kako programeri pišu i refaktoriraju kod kroz vrijeme; stvaranje zajedničkih evaluacijskih paketa koji mjere kvalitetu refaktora i dugovječnost ispravki grešaka; te izgradnju transparentnih alata koji otkrivaju nesigurnost modela i pozivaju na ljudsko usmjeravanje.
"Softver već danas čini temelj financija, prometa, zdravstva i brojnih drugih ključnih sustava," ističe Solar-Lezama. Istraživački tim zamišlja budućnost u kojoj AI preuzima rutinske razvojne zadatke, omogućujući ljudskim inženjerima da se usmjere na visokorazinske dizajnerske odluke i složene kompromise koji zahtijevaju ljudsku prosudbu.