Bagama't malaki na ang naging progreso ng AI sa pagbuo ng mga code snippet, isiniwalat ng bagong pag-aaral mula sa MIT na may malalaking hadlang pa rin sa pagkamit ng tunay na autonomous na software engineering.
Ang pananaliksik na pinamagatang "Mga Hamon at Landas Patungo sa AI para sa Software Engineering" ay isinagawa ng isang team na pinangunahan ni MIT Propesor Armando Solar-Lezama at pangunahing may-akda na si Alex Gu. Inilathala noong Hulyo 16, 2025, ilalahad ang pag-aaral na ito sa International Conference on Machine Learning (ICML 2025) sa Vancouver.
"Lahat ay nagsasabing hindi na natin kailangan ng mga programmer, at napakaraming automation na ang available ngayon," ani Solar-Lezama. "Sa isang banda, napakalaki ng naging progreso ng larangan. Mayroon tayong mga tool na mas makapangyarihan kaysa sa dati. Ngunit malayo pa rin tayo sa lubos na pangakong automation na inaasahan natin."
Ipinunto ng mga mananaliksik na mahusay ang kasalukuyang mga AI system sa pagbuo ng maliliit na code function ngunit nahihirapan pa rin sa mas malawak na software engineering task gaya ng malakihang refactoring, code migration, at pag-debug ng komplikadong mga sistema. Ang mga popular na benchmark tulad ng SWE-Bench ay sumusubok lamang ng mga patch para sa mga isyu sa GitHub na may ilang daang linya ng code, ngunit hindi nito nasasaklaw ang mga totoong sitwasyon kung saan milyon-milyong linya ang kailangang i-optimize o ilipat mula sa mga lumang sistema.
Isa pang malaking hamon ang komunikasyon sa pagitan ng tao at makina. Inilarawan ni Gu ang kasalukuyang interaksyon bilang "manipis na linya ng komunikasyon," kung saan madalas na naglalabas ang mga AI tool ng malalaki at hindi organisadong file na may mababaw na pagsusuri, at kulang sa kakayahang epektibong gamitin ang mga debugging tool at static analyzer na inaasahan ng mga human developer.
Sa halip na magmungkahi ng iisang solusyon, nananawagan ang mga mananaliksik ng malawakang pagtutulungan ng komunidad: pagbuo ng mas mayamang dataset na sumasalamin kung paano sumusulat at nagre-refactor ng code ang mga developer sa paglipas ng panahon; paggawa ng mga shared evaluation suite na sumusukat sa kalidad ng refactor at tibay ng bug-fix; at paglikha ng transparent na mga tool na nagpapakita ng kawalan ng katiyakan ng modelo at humihikayat ng gabay mula sa tao.
"Ang software ay pundasyon na ng pananalapi, transportasyon, healthcare, at napakarami pang ibang kritikal na sistema," dagdag ni Solar-Lezama. Nakikita ng research team ang hinaharap kung saan AI na ang bahala sa mga paulit-ulit na development task, upang makapagpokus ang mga human engineer sa mataas na antas ng disenyo at komplikadong pagpapasya na nangangailangan ng human judgment.