Walaupun AI telah mencapai kemajuan luar biasa dalam penjanaan snippet kod, satu kajian baharu oleh MIT mendedahkan halangan besar untuk mencapai kejuruteraan perisian autonomi sepenuhnya.
Kajian bertajuk "Challenges and Paths Towards AI for Software Engineering" ini dijalankan oleh pasukan yang diketuai Profesor MIT, Armando Solar-Lezama dan penulis utama Alex Gu. Diterbitkan pada 16 Julai 2025, kajian ini akan dibentangkan di Persidangan Antarabangsa mengenai Pembelajaran Mesin (ICML 2025) di Vancouver.
"Semua orang bercakap tentang bagaimana kita tidak lagi memerlukan pengaturcara, dan kini terdapat pelbagai automasi yang tersedia," kata Solar-Lezama. "Di satu pihak, bidang ini telah membuat kemajuan yang luar biasa. Kita mempunyai alat yang jauh lebih berkuasa berbanding sebelum ini. Tetapi masih jauh lagi perjalanan untuk benar-benar mencapai janji automasi sepenuhnya yang kita harapkan."
Para penyelidik berhujah bahawa sistem AI semasa cemerlang dalam menjana fungsi kod kecil tetapi masih bergelut dengan tugas kejuruteraan perisian yang lebih luas seperti penstrukturan semula berskala besar, migrasi kod, dan penyahpepijatan sistem kompleks. Penanda aras popular seperti SWE-Bench hanya menguji tampalan untuk isu GitHub yang melibatkan beberapa ratus baris kod, dan gagal mencerminkan senario dunia sebenar di mana berjuta-juta baris mungkin perlu dioptimumkan atau dimigrasikan dari sistem legasi.
Komunikasi antara manusia dan mesin juga merupakan cabaran utama. Gu menggambarkan interaksi hari ini sebagai "garis komunikasi yang sangat nipis", di mana alat AI sering menghasilkan fail besar yang tidak berstruktur dengan ujian yang cetek, serta kekurangan keupayaan untuk menggunakan alat penyahpepijatan dan penganalisis statik yang menjadi kebergantungan pembangun manusia.
Daripada mencadangkan satu penyelesaian tunggal, para penyelidik menyeru usaha berskala komuniti: membangunkan set data yang lebih kaya yang menangkap bagaimana pembangun menulis dan menstruktur semula kod dari masa ke masa; mewujudkan suite penilaian bersama untuk mengukur kualiti penstrukturan semula dan ketahanan pembetulan pepijat; serta membina alat yang telus yang mendedahkan ketidakpastian model dan mengundang bimbingan manusia.
"Perisian sudah menjadi asas kepada kewangan, pengangkutan, penjagaan kesihatan, dan pelbagai sistem kritikal lain," kata Solar-Lezama. Pasukan penyelidik membayangkan masa depan di mana AI mengendalikan tugas pembangunan rutin, membolehkan jurutera manusia menumpukan kepada keputusan reka bentuk peringkat tinggi dan pertukaran kompleks yang memerlukan pertimbangan manusia.