Σε ένα σημαντικό ορόσημο για την τεχνητή νοημοσύνη, τόσο η OpenAI όσο και η Google DeepMind επέδειξαν ικανότητες μαθηματικής σκέψης επιπέδου χρυσού μεταλλίου στη Διεθνή Μαθηματική Ολυμπιάδα (IMO) του 2025, τον κορυφαίο διαγωνισμό για νεαρούς μαθηματικούς παγκοσμίως.
Τα μοντέλα τεχνητής νοημοσύνης των δύο εταιρειών πέτυχαν ταυτόσημη βαθμολογία, συγκεντρώνοντας 35 από τους 42 δυνατούς βαθμούς, επιλύοντας άψογα πέντε από τα έξι προβλήματα. Η επίδοση αυτή αντιστοιχεί στο όριο για το χρυσό μετάλλιο στη φετινή διοργάνωση, όπου μόνο περίπου το 11% των 630 ανθρώπινων διαγωνιζόμενων (περίπου 67 μαθητές) απέσπασαν χρυσό μετάλλιο.
Η αναβαθμισμένη έκδοση του Gemini με Deep Think της Google DeepMind βαθμολογήθηκε και επικυρώθηκε επίσημα από τους συντονιστές της IMO, με τον πρόεδρο της IMO, Gregor Dolinar, να σημειώνει πως οι λύσεις τους ήταν «εντυπωσιακές σε πολλά σημεία» και «σαφείς, ακριβείς και οι περισσότερες εύκολες στην παρακολούθηση». Αυτό συνιστά σημαντική πρόοδο σε σχέση με πέρυσι, όταν η DeepMind είχε κατακτήσει το ασημένιο μετάλλιο με εξειδικευμένα συστήματα.
Η OpenAI αξιολόγησε το πειραματικό μοντέλο λογικής της στα ίδια προβλήματα, υπό πανομοιότυπες συνθήκες διαγωνισμού — δύο συνεδρίες εξετάσεων διάρκειας 4,5 ωρών χωρίς πρόσβαση στο διαδίκτυο ή εργαλεία. Αν και η OpenAI δεν συμμετείχε στην επίσημη διαδικασία αξιολόγησης της IMO, οι λύσεις της βαθμολογήθηκαν ανεξάρτητα από τρεις πρώην κατόχους μεταλλίων της IMO.
Η χρονική στιγμή των ανακοινώσεων προκάλεσε κάποια ένταση μεταξύ των εταιρειών. Η OpenAI δημοσίευσε τα αποτελέσματά της στις 19 Ιουλίου, ενώ η Google DeepMind περίμενε έως τις 21 Ιουλίου, σεβόμενη το αίτημα του Διοικητικού Συμβουλίου της IMO να κοινοποιηθούν τα αποτελέσματα μετά την επίσημη επικύρωση και την αναγνώριση των μαθητών.
Ο Junehyuk Jung, καθηγητής μαθηματικών στο Πανεπιστήμιο Brown και επισκέπτης ερευνητής στη Google DeepMind, πιστεύει ότι το επίτευγμα αυτό δείχνει πως η τεχνητή νοημοσύνη απέχει λιγότερο από έναν χρόνο από το να βοηθά μαθηματικούς στην επίλυση άλυτων ερευνητικών προβλημάτων στην αιχμή των μαθηματικών. «Πιστεύω ότι τη στιγμή που θα μπορούμε να λύνουμε δύσκολα προβλήματα λογικής σε φυσική γλώσσα, θα ανοίξει η δυνατότητα συνεργασίας μεταξύ ΑΙ και μαθηματικών», δήλωσε ο Jung στο Reuters.
Παρά τον εντυπωσιακό χαρακτήρα του επιτεύγματος, ορισμένοι ειδικοί επισημαίνουν ότι τα προβλήματα της IMO, αν και δύσκολα, είναι εννοιολογικά απλούστερα από τα ερευνητικά προβλήματα αιχμής στα μαθηματικά. Η επιτυχία αυτή καταδεικνύει τη διαρκώς αυξανόμενη ικανότητα λογικής της τεχνητής νοημοσύνης, χωρίς όμως να σημαίνει απαραίτητα ότι είναι έτοιμη για όλες τις πτυχές της μαθηματικής έρευνας.