Ačkoliv AI dosáhla pozoruhodného pokroku v generování úryvků kódu, nová studie MIT odhaluje zásadní překážky na cestě k plně autonomnímu softwarovému inženýrství.
Výzkum s názvem „Výzvy a cesty k AI pro softwarové inženýrství“ provedl tým pod vedením profesora MIT Armando Solar-Lezamy a hlavního autora Alexe Gu. Studie byla publikována 16. července 2025 a bude představena na Mezinárodní konferenci o strojovém učení (ICML 2025) ve Vancouveru.
„Všichni mluví o tom, že už programátory nepotřebujeme a že máme k dispozici veškerou tuto automatizaci,“ říká Solar-Lezama. „Na jedné straně obor skutečně udělal obrovský pokrok. Máme nástroje, které jsou mnohem výkonnější než cokoli, co jsme dosud viděli. Ale zároveň je před námi ještě dlouhá cesta k naplnění skutečného potenciálu automatizace, jaký bychom očekávali.“
Výzkumníci tvrdí, že současné AI systémy vynikají v generování menších funkcí kódu, ale selhávají u širších softwarových úkolů, jako je rozsáhlé refaktorování, migrace kódu nebo ladění složitých systémů. Oblíbené benchmarky jako SWE-Bench testují pouze opravy problémů na GitHubu zahrnující několik stovek řádků kódu, což neodráží reálné scénáře, kdy je třeba optimalizovat nebo migrovat miliony řádků ze starších systémů.
Další zásadní výzvu představuje komunikace mezi člověkem a strojem. Gu popisuje dnešní interakci jako „tenkou komunikační linku“, kdy AI nástroje často generují rozsáhlé, nestrukturované soubory s povrchními testy a postrádají schopnost efektivně využívat ladicí nástroje a statické analyzátory, na které se spoléhají lidscí vývojáři.
Namísto návrhu jediného řešení vyzývají výzkumníci ke komunitní spolupráci: k vytváření bohatších datových sad, které zachycují, jak vývojáři v průběhu času píší a refaktorují kód; ke tvorbě sdílených evaluačních sad, které měří kvalitu refaktorování a trvanlivost oprav chyb; a k budování transparentních nástrojů, které odhalují nejistotu modelu a umožňují lidské vedení.
„Software už dnes tvoří základ financí, dopravy, zdravotnictví a nespočtu dalších kritických systémů,“ upozorňuje Solar-Lezama. Výzkumný tým si představuje budoucnost, v níž AI převezme rutinní vývojářské úkoly a lidským inženýrům umožní soustředit se na rozhodování na vyšší úrovni a složité kompromisy, které vyžadují lidský úsudek.