Ο AI Προπονητής του MIT Ενισχύει τις Ικανότητες Επίλυσης Προβλημάτων των Γλωσσικών Μοντέλων

Ερευνητές του MIT ανέπτυξαν το CodeSteer, έναν έξυπνο βοηθό που καθοδηγεί μεγάλα γλωσσικά μοντέλα να εναλλάσσονται μεταξύ παραγωγής κειμένου και κώδικα μέχρι να απαντήσουν σωστά σε σύνθετα ερωτήματα. Το σύστημα αύξησε την ακρίβεια των LLM σε συμβολικές εργασίες όπως μαθηματικά προβλήματα και χωρική λογική κατά πάνω από 30%, επιτρέποντας σε λιγότερο εξελιγμένα μοντέλα να ξεπερνούν πιο προηγμένα. Αυτή η καινοτομία θα μπορούσε να βελτιώσει σημαντικά τις δυνατότητες επίλυσης σύνθετων προβλημάτων της τεχνητής νοημοσύνης σε τομείς όπως η ρομποτική, η διαχείριση εφοδιαστικής αλυσίδας και άλλους που απαιτούν ακριβή υπολογιστική λογική.

Τα μεγάλα γλωσσικά μοντέλα (LLMs) διαπρέπουν στην κατανόηση συμφραζομένων και στην παροχή λογικών απαντήσεων μέσω κειμενικής λογικής. Ωστόσο, συχνά δυσκολεύονται με υπολογιστικές εργασίες που θα επιλύονταν καλύτερα με χρήση κώδικα, όπως η σύγκριση δεκαδικών αριθμών ή η επίλυση προβλημάτων βελτιστοποίησης.

Για να αντιμετωπίσουν αυτόν τον περιορισμό, ερευνητές από το MIT ανέπτυξαν το CodeSteer, έναν έξυπνο βοηθό που λειτουργεί ως προπονητής για μεγαλύτερα γλωσσικά μοντέλα, καθοδηγώντας τα να εναλλάσσονται μεταξύ παραγωγής κειμένου και κώδικα μέχρι να απαντήσουν σωστά σε ένα ερώτημα.

"Εμπνευστήκαμε από τους ανθρώπους. Στα αθλήματα, ένας προπονητής μπορεί να μην είναι καλύτερος από τον αστέρα της ομάδας, αλλά μπορεί να δώσει χρήσιμες συμβουλές για να τον καθοδηγήσει. Αυτή η μέθοδος καθοδήγησης λειτουργεί και για τα LLMs," εξηγεί ο Yongchao Chen, μεταπτυχιακός φοιτητής στο Harvard και το MIT που εργάστηκε στο έργο.

Το CodeSteer, το οποίο είναι το ίδιο ένα μικρότερο LLM βελτιστοποιημένο πάνω στο μοντέλο Llama-3-8B, λειτουργεί εξετάζοντας ένα ερώτημα και αποφασίζοντας αν το κείμενο ή ο κώδικας είναι καταλληλότερος για την επίλυσή του. Στη συνέχεια δημιουργεί προτροπές για το μεγαλύτερο LLM, καθοδηγώντας το να χρησιμοποιήσει τη σωστή μέθοδο. Αν η απάντηση δεν είναι σωστή, το CodeSteer συνεχίζει να προτρέπει το LLM να δοκιμάσει διαφορετικές προσεγγίσεις μέχρι να φτάσει στη σωστή λύση.

Οι ερευνητές διαπίστωσαν ότι η ενίσχυση του GPT-4o με το CodeSteer αύξησε την ακρίβειά του σε συμβολικές εργασίες κατά πάνω από 30%, ανεβάζοντας τη μέση απόδοσή του από 53,3 σε 86,4 σε 37 εργασίες. Αυτή η βελτίωση του επέτρεψε να ξεπεράσει ακόμη και πιο προηγμένα μοντέλα όπως το OpenAI o1 (82,7) και το DeepSeek R1 (76,8). Αξιοσημείωτα, το CodeSteer επέδειξε επίσης ισχυρή γενικευσιμότητα, προσφέροντας κατά μέσο όρο αύξηση απόδοσης 41,8% όταν εφαρμόστηκε σε άλλα μοντέλα όπως τα Claude, Mistral και GPT-3.5.

Για την ανάπτυξη και δοκιμή του CodeSteer, οι ερευνητές δημιούργησαν το SymBench, ένα ολοκληρωμένο benchmark που περιλαμβάνει 37 συμβολικές εργασίες με ρυθμιζόμενη πολυπλοκότητα. Αυτές οι εργασίες καλύπτουν τα μαθηματικά, τη χωρική λογική, τη λογική, τη λογική σειράς και προβλήματα βελτιστοποίησης.

Αυτή η καινοτομία θα μπορούσε να βελτιώσει σημαντικά τις δυνατότητες της τεχνητής νοημοσύνης στην επίλυση σύνθετων προβλημάτων που είναι δύσκολο να λυθούν μόνο με κειμενική λογική, όπως η δημιουργία διαδρομών για ρομπότ σε αβέβαια περιβάλλοντα ή ο προγραμματισμός αποστολών σε διεθνείς εφοδιαστικές αλυσίδες.

"Ενισχύοντας ένα LLM με την ικανότητα να χρησιμοποιεί έξυπνα τον κώδικα, μπορούμε να πάρουμε ένα ήδη πολύ ισχυρό μοντέλο και να βελτιώσουμε ακόμη περισσότερο την απόδοσή του," σημειώνει ο Chen. Οι ερευνητές τώρα εργάζονται για να απλοποιήσουν το CodeSteer ώστε να επιταχύνουν τη διαδικασία επαναληπτικών προτροπών και εξερευνούν τρόπους βελτιστοποίησης ενός ενιαίου μοντέλου που θα μπορεί να εναλλάσσεται μεταξύ κειμενικής λογικής και παραγωγής κώδικα χωρίς να βασίζεται σε ξεχωριστό βοηθό.

Ο AI Προπονητής του MIT Ενισχύει τις Ικανότητες Επίλυσης Προβλημάτων των Γλωσσικών Μοντέλων

Latest News

Η OpenAI Ενοποιεί τα Εργαλεία Τεχνητής Νοημοσύνης με τον Πράκτορα ChatGPT για Αυτόνομες Εργασίες

Η OpenAI Μετατρέπει το ChatGPT σε Κέντρο Αγορών με Ενσωματωμένο Checkout της Shopify

Η Αυτοματοποίηση μέσω Τεχνητής Νοημοσύνης Οδηγεί την Ανάπτυξη της Tech Mahindra Παρά τις Προκλήσεις στον Κλάδο Πληροφορικής

Η xAI Παρουσιάζει Σεξουαλικοποιημένους AI Συνοδούς Εν μέσω Συμφωνίας με το Πεντάγωνο

Η Τεχνητή Νοημοσύνη της Google Πραγματοποιεί Τηλεφωνικές Κλήσεις Αντί για Εσάς

Το Thinking Machines Lab της Μιρά Μουράτι Εξασφαλίζει $2 Δισ. για την Επανάσταση της Τεχνητής Νοημοσύνης

Η S&P Global Παρουσιάζει AI-Έτοιμα Μεταδεδομένα για τον Μετασχηματισμό της Χρηματοοικονομικής Ανάλυσης

Η Fed Υιοθετεί την Τεχνητή Νοημοσύνη για Έρευνα Ενώ Μελετά τον Οικονομικό της Αντίκτυπο

Η AWS Παρουσιάζει Εξειδικευμένο Σύστημα Ψύξης για Τσιπ Τεχνητής Νοημοσύνης Νέας Γενιάς

Το MIT Χαρτογραφεί τα Εμπόδια στην Αυτοματοποίηση της Μηχανικής Λογισμικού με Τεχνητή Νοημοσύνη

Ο AI Προπονητής του MIT Ενισχύει τις Ικανότητες Επίλυσης Προβλημάτων των Γλωσσικών Μοντέλων

Related Articles

Η OpenAI Ενοποιεί τα Εργαλεία Τεχνητής Νοημοσύνης με τον Πράκτορα ChatGPT για Αυτόνομες Εργασίες

Η OpenAI Μετατρέπει το ChatGPT σε Κέντρο Αγορών με Ενσωματωμένο Checkout της Shopify

Η Αυτοματοποίηση μέσω Τεχνητής Νοημοσύνης Οδηγεί την Ανάπτυξη της Tech Mahindra Παρά τις Προκλήσεις στον Κλάδο Πληροφορικής

Η xAI Παρουσιάζει Σεξουαλικοποιημένους AI Συνοδούς Εν μέσω Συμφωνίας με το Πεντάγωνο

Η Fed Υιοθετεί την Τεχνητή Νοημοσύνη για Έρευνα Ενώ Μελετά τον Οικονομικό της Αντίκτυπο

Latest News

Η OpenAI Ενοποιεί τα Εργαλεία Τεχνητής Νοημοσύνης με τον Πράκτορα ChatGPT για Αυτόνομες Εργασίες

Η OpenAI Μετατρέπει το ChatGPT σε Κέντρο Αγορών με Ενσωματωμένο Checkout της Shopify

Η Αυτοματοποίηση μέσω Τεχνητής Νοημοσύνης Οδηγεί την Ανάπτυξη της Tech Mahindra Παρά τις Προκλήσεις στον Κλάδο Πληροφορικής

Η xAI Παρουσιάζει Σεξουαλικοποιημένους AI Συνοδούς Εν μέσω Συμφωνίας με το Πεντάγωνο

Η Τεχνητή Νοημοσύνη της Google Πραγματοποιεί Τηλεφωνικές Κλήσεις Αντί για Εσάς

Το Thinking Machines Lab της Μιρά Μουράτι Εξασφαλίζει $2 Δισ. για την Επανάσταση της Τεχνητής Νοημοσύνης

Η S&P Global Παρουσιάζει AI-Έτοιμα Μεταδεδομένα για τον Μετασχηματισμό της Χρηματοοικονομικής Ανάλυσης

Η Fed Υιοθετεί την Τεχνητή Νοημοσύνη για Έρευνα Ενώ Μελετά τον Οικονομικό της Αντίκτυπο

Η AWS Παρουσιάζει Εξειδικευμένο Σύστημα Ψύξης για Τσιπ Τεχνητής Νοημοσύνης Νέας Γενιάς

Το MIT Χαρτογραφεί τα Εμπόδια στην Αυτοματοποίηση της Μηχανικής Λογισμικού με Τεχνητή Νοημοσύνη