menu
close

MIT identifica los obstáculos para la ingeniería de software impulsada por IA

Un estudio exhaustivo liderado por investigadores del MIT ha identificado los principales desafíos que impiden que la inteligencia artificial automatice por completo el desarrollo de software. Publicada el 16 de julio de 2025, la investigación dirigida por el profesor Armando Solar-Lezama traza una hoja de ruta para avanzar más allá de la simple generación de código y abordar tareas de ingeniería complejas. El estudio aboga por esfuerzos a escala comunitaria para desarrollar mejores benchmarks, mejorar la colaboración humano-IA y crear conjuntos de datos más ricos que reflejen procesos reales de desarrollo.
MIT identifica los obstáculos para la ingeniería de software impulsada por IA

Aunque la inteligencia artificial ha logrado avances notables en la generación de fragmentos de código, un nuevo estudio del MIT revela barreras significativas para alcanzar una ingeniería de software verdaderamente autónoma.

La investigación, titulada "Desafíos y caminos hacia la IA para la ingeniería de software", ha sido realizada por un equipo liderado por el profesor del MIT Armando Solar-Lezama y el primer autor Alex Gu. Publicada el 16 de julio de 2025, el estudio se presentará en la Conferencia Internacional sobre Aprendizaje Automático (ICML 2025) en Vancouver.

"Todo el mundo habla de que ya no necesitamos programadores y de que ahora hay toda esta automatización disponible", afirma Solar-Lezama. "Por un lado, el campo ha progresado enormemente. Disponemos de herramientas mucho más potentes que cualquier otra que hayamos visto antes. Pero aún queda mucho camino por recorrer para alcanzar la promesa completa de la automatización que esperamos".

Los investigadores sostienen que los sistemas de IA actuales destacan en la generación de pequeñas funciones de código, pero tienen dificultades con tareas de ingeniería de software más amplias, como la refactorización a gran escala, la migración de código y la depuración de sistemas complejos. Benchmarks populares como SWE-Bench solo evalúan parches para incidencias de GitHub que implican unos pocos cientos de líneas de código, sin reflejar escenarios reales en los que podrían necesitarse optimizaciones o migraciones de millones de líneas desde sistemas heredados.

La comunicación entre humanos y máquinas representa otro desafío importante. Gu describe la interacción actual como "una línea de comunicación muy fina", en la que las herramientas de IA suelen generar archivos grandes y poco estructurados con pruebas superficiales, sin la capacidad de utilizar eficazmente herramientas de depuración y analizadores estáticos en los que confían los desarrolladores humanos.

En lugar de proponer una única solución, los investigadores abogan por esfuerzos a escala comunitaria: desarrollar conjuntos de datos más ricos que reflejen cómo los desarrolladores escriben y refactorizan código a lo largo del tiempo; crear suites de evaluación compartidas que midan la calidad de la refactorización y la durabilidad de las correcciones de errores; y construir herramientas transparentes que expongan la incertidumbre de los modelos y faciliten la intervención humana.

"El software ya es la base de las finanzas, el transporte, la sanidad y muchos otros sistemas críticos", señala Solar-Lezama. El equipo de investigación imagina un futuro en el que la IA se encargue de las tareas rutinarias de desarrollo, permitiendo que los ingenieros humanos se centren en decisiones de diseño de alto nivel y en complejos compromisos que requieren juicio humano.

Source: Mit

Latest News