Παρά τη σημαντική πρόοδο της Τεχνητής Νοημοσύνης στη δημιουργία αποσπασμάτων κώδικα, μια νέα μελέτη του MIT αποκαλύπτει σημαντικά εμπόδια στην επίτευξη πραγματικά αυτόνομης μηχανικής λογισμικού.
Η έρευνα, με τίτλο «Προκλήσεις και Διαδρομές προς την ΤΝ για τη Μηχανική Λογισμικού», διεξήχθη από ομάδα υπό την καθοδήγηση του καθηγητή του MIT Armando Solar-Lezama και του πρώτου συγγραφέα Alex Gu. Δημοσιεύτηκε στις 16 Ιουλίου 2025 και θα παρουσιαστεί στο International Conference on Machine Learning (ICML 2025) στο Βανκούβερ.
«Όλοι μιλούν για το πώς δεν χρειαζόμαστε πλέον προγραμματιστές και ότι υπάρχει όλη αυτή η αυτοματοποίηση διαθέσιμη», σημειώνει ο Solar-Lezama. «Από τη μία πλευρά, ο τομέας έχει σημειώσει τεράστια πρόοδο. Έχουμε εργαλεία πολύ πιο ισχυρά από ό,τι είχαμε ποτέ. Αλλά υπάρχει ακόμη πολύς δρόμος μέχρι να φτάσουμε στην πλήρη υπόσχεση της αυτοματοποίησης που θα περιμέναμε.»
Οι ερευνητές υποστηρίζουν ότι τα τρέχοντα συστήματα ΤΝ διαπρέπουν στη δημιουργία μικρών συναρτήσεων κώδικα, αλλά δυσκολεύονται με ευρύτερες εργασίες μηχανικής λογισμικού, όπως η αναδιάρθρωση μεγάλης κλίμακας, η μετανάστευση κώδικα και η αποσφαλμάτωση σύνθετων συστημάτων. Δημοφιλείς δείκτες αξιολόγησης όπως το SWE-Bench δοκιμάζουν μόνο διορθώσεις για ζητήματα GitHub που αφορούν μερικές εκατοντάδες γραμμές κώδικα, αποτυγχάνοντας να αποτυπώσουν πραγματικά σενάρια όπου εκατομμύρια γραμμές μπορεί να χρειάζονται βελτιστοποίηση ή μετανάστευση από παλαιότερα συστήματα.
Η επικοινωνία ανθρώπου-μηχανής αποτελεί επίσης σημαντική πρόκληση. Ο Gu περιγράφει τη σημερινή αλληλεπίδραση ως «μια λεπτή γραμμή επικοινωνίας», όπου τα εργαλεία ΤΝ συχνά παράγουν μεγάλα, μη δομημένα αρχεία με επιφανειακά τεστ, χωρίς να αξιοποιούν αποτελεσματικά εργαλεία αποσφαλμάτωσης και στατικού ελέγχου που χρησιμοποιούν οι ανθρώπινοι προγραμματιστές.
Αντί να προτείνουν μία και μοναδική λύση, οι ερευνητές καλούν σε συλλογικές προσπάθειες: ανάπτυξη πλουσιότερων συνόλων δεδομένων που αποτυπώνουν πώς οι προγραμματιστές γράφουν και αναδιαρθρώνουν κώδικα με την πάροδο του χρόνου· δημιουργία κοινών σουιτών αξιολόγησης που μετρούν την ποιότητα της αναδιάρθρωσης και τη διάρκεια ζωής των διορθώσεων σφαλμάτων· και κατασκευή διαφανών εργαλείων που αποκαλύπτουν την αβεβαιότητα των μοντέλων και ενθαρρύνουν την ανθρώπινη καθοδήγηση.
«Το λογισμικό ήδη στηρίζει τη χρηματοοικονομία, τις μεταφορές, την υγεία και αμέτρητα άλλα κρίσιμα συστήματα», σημειώνει ο Solar-Lezama. Η ερευνητική ομάδα οραματίζεται ένα μέλλον όπου η ΤΝ θα αναλαμβάνει τις ρουτινικές εργασίες ανάπτυξης, επιτρέποντας στους ανθρώπινους μηχανικούς να επικεντρώνονται σε αποφάσεις υψηλού επιπέδου και σύνθετους συμβιβασμούς που απαιτούν ανθρώπινη κρίση.