Η κούρσα προς τη γενική τεχνητή νοημοσύνη (AGI) έχει φτάσει σε ένα καθοριστικό σημείο, με το μοντέλο o3 της OpenAI να επιδεικνύει δυνατότητες που θεωρούνταν αδύνατες μόλις πριν από λίγους μήνες.
Ο Ζακ Βόρχις, ο πρώην καταγγέλλων της Google που έγινε γνωστός το 2019 αποκαλύπτοντας αυτό που περιέγραψε ως καθεστώς λογοκρισίας της Google, έχει αναδειχθεί σε ένθερμο υποστηρικτή της προώθησης και όχι της επιβράδυνσης της ανάπτυξης της τεχνητής νοημοσύνης. Σε πρόσφατες συνεντεύξεις, ο Βόρχις έχει απορρίψει κατηγορηματικά την άποψη ότι η πρόοδος της τεχνητής νοημοσύνης έχει φτάσει σε οροφή, επικαλούμενος το μοντέλο o3 της OpenAI ως αδιαμφισβήτητη απόδειξη της επιταχυνόμενης εξέλιξης.
Το σύστημα o3 πέτυχε αυτό που πολλοί ειδικοί θεωρούν ως ανακάλυψη, σημειώνοντας σκορ 75,7% στο benchmark ARC-AGI υπό τυπικές συνθήκες υπολογιστικής ισχύος και φτάνοντας το 87,5% με αυξημένους υπολογιστικούς πόρους. Αυτή η απόδοση υπερβαίνει τη μέση ανθρώπινη επίδοση του 80% σε αυτά τα τεστ αφηρημένης λογικής, τα οποία έχουν σχεδιαστεί ειδικά για να αξιολογούν τις δυνατότητες γενικής νοημοσύνης. Ο François Chollet, δημιουργός του ARC Challenge, αναγνώρισε ότι αυτό αποτελεί «ένα εκπληκτικό και σημαντικό άλμα στις δυνατότητες της τεχνητής νοημοσύνης».
Ο Sam Altman, διευθύνων σύμβουλος της OpenAI, δήλωσε δημόσια: «Τώρα είμαστε βέβαιοι ότι γνωρίζουμε πώς να κατασκευάσουμε AGI όπως το έχουμε παραδοσιακά κατανοήσει», προβλέποντας ότι «το 2025 μπορεί να δούμε τους πρώτους πράκτορες AI να εντάσσονται στο εργατικό δυναμικό και να αλλάζουν ουσιαστικά την παραγωγικότητα των εταιρειών». Αυτό το χρονοδιάγραμμα ευθυγραμμίζεται με προβλέψεις και άλλων ηγετών του κλάδου, όπως ο Elon Musk και ο Dario Amodei της Anthropic, που εκτιμούν ότι τα συστήματα AI θα μπορούσαν να ξεπεράσουν την ανθρώπινη νοημοσύνη έως το 2026.
Ο Βόρχις οραματίζεται ένα μέλλον όπου οι πράκτορες AI θα μεταμορφώσουν τις εργασιακές διαδικασίες, διαχωριζόμενοι σε ρόλους «αρχιτέκτονα» που καθορίζουν υψηλού επιπέδου στόχους και «εκτελεστή» που υλοποιούν συγκεκριμένα καθήκοντα. Ενώ αυτό θα μπορούσε να αυξήσει δραματικά την αποδοτικότητα σε όλους τους κλάδους, προειδοποιεί ότι ενδέχεται να οδηγήσει και σε σημαντική απώλεια θέσεων εργασίας.
Παρά τον ενθουσιασμό, οι ειδικοί επισημαίνουν ότι το o3 εξακολουθεί να αποτυγχάνει σε ορισμένες απλές εργασίες και απαιτεί τεράστιους υπολογιστικούς πόρους. Το επερχόμενο benchmark ARC-AGI-2, που θα λανσαριστεί το 2025, αναμένεται να παρουσιάσει σημαντικά μεγαλύτερες προκλήσεις, πιθανόν να μειώσει την απόδοση του o3 κάτω από το 30%, ενώ θα παραμένει επιλύσιμο από ανθρώπους. Όπως σημειώνει ο Chollet, «Θα ξέρετε ότι το AGI είναι εδώ όταν η δημιουργία εργασιών που είναι εύκολες για τους απλούς ανθρώπους αλλά δύσκολες για την AI καταστεί απλώς αδύνατη».