Aj keď umelá inteligencia dosiahla pozoruhodný pokrok v generovaní útržkov kódu, nová štúdia MIT odhaľuje významné prekážky na ceste k skutočne autonómnemu softvérovému inžinierstvu.
Výskum s názvom „Výzvy a cesty k AI pre softvérové inžinierstvo“ viedol tím pod vedením profesora MIT Armando Solar-Lezamu a prvého autora Alexa Gu. Štúdia, publikovaná 16. júla 2025, bude prezentovaná na Medzinárodnej konferencii o strojovom učení (ICML 2025) vo Vancouveri.
„Všetci hovoria o tom, ako už nepotrebujeme programátorov a koľko automatizácie je dnes k dispozícii,“ hovorí Solar-Lezama. „Na jednej strane sme urobili obrovský pokrok. Máme nástroje, ktoré sú oveľa výkonnejšie ako čokoľvek, čo sme doteraz videli. No zároveň je pred nami ešte dlhá cesta, kým naplníme plný potenciál automatizácie, ktorý očakávame.“
Výskumníci tvrdia, že súčasné AI systémy vynikajú v generovaní malých funkcií, no majú problémy so širšími softvérovými úlohami, ako je rozsiahle refaktorovanie, migrácia kódu či ladenie zložitých systémov. Populárne benchmarky ako SWE-Bench testujú len opravy problémov na GitHube, ktoré zahŕňajú niekoľko stoviek riadkov kódu, a nezachytávajú reálne scenáre, kde je potrebné optimalizovať či migrovať milióny riadkov zo starších systémov.
Ďalšou významnou výzvou je komunikácia medzi človekom a strojom. Gu opisuje dnešnú interakciu ako „tenkú líniu komunikácie“, kde AI nástroje často produkujú veľké, neštruktúrované súbory s povrchnými testami a chýba im schopnosť efektívne využívať ladiace nástroje a statické analyzátory, na ktoré sa spoliehajú ľudskí vývojári.
Namiesto jedného riešenia výskumníci vyzývajú na komunitné úsilie: vytvárať bohatšie dátové súbory, ktoré zachytávajú, ako vývojári píšu a refaktorujú kód v čase; vytvárať spoločné hodnotiace sady, ktoré merajú kvalitu refaktoringu a trvácnosť opráv chýb; a budovať transparentné nástroje, ktoré odhaľujú neistotu modelu a umožňujú ľudské usmernenie.
„Softvér už dnes tvorí základ financií, dopravy, zdravotníctva a nespočetného množstva ďalších kritických systémov,“ poznamenáva Solar-Lezama. Výskumný tím si predstavuje budúcnosť, v ktorej AI zvláda rutinné vývojové úlohy a ľudskí inžinieri sa môžu sústrediť na rozhodovanie na vysokej úrovni a zložité kompromisy, ktoré si vyžadujú ľudský úsudok.