Η Google DeepMind εργάζεται για να μεταμορφώσει το πιο προηγμένο πολυτροπικό θεμελιώδες μοντέλο της, το Gemini 2.5 Pro, σε αυτό που αποκαλεί «μοντέλο του κόσμου» – ένα σύστημα τεχνητής νοημοσύνης ικανό να κατανοεί και να προσομοιώνει πτυχές του πραγματικού κόσμου με τρόπους που μιμούνται τις ανθρώπινες γνωστικές διεργασίες.
Όπως ανακοινώθηκε στο Google I/O 2025, αυτή η φιλόδοξη πρωτοβουλία στοχεύει στη δημιουργία μιας AI που μπορεί να σχεδιάζει και να φαντάζεται νέες εμπειρίες, μοντελοποιώντας το πώς λειτουργεί ο κόσμος. Σύμφωνα με τον CEO της DeepMind, Demis Hassabis, αυτή η ικανότητα αντιπροσωπεύει μια θεμελιώδη πρόοδο στην τεχνητή νοημοσύνη, που υπερβαίνει την απλή ταξινόμηση και πρόβλεψη.
«Γι’ αυτό εργαζόμαστε για να επεκτείνουμε το καλύτερο πολυτροπικό θεμελιώδες μοντέλο μας, το Gemini 2.5 Pro, ώστε να γίνει ένα “μοντέλο του κόσμου” που μπορεί να σχεδιάζει και να φαντάζεται νέες εμπειρίες κατανοώντας και προσομοιώνοντας πτυχές του κόσμου, όπως ακριβώς κάνει ο εγκέφαλος», εξήγησε ο Hassabis σε πρόσφατη ανάρτησή του στο blog.
Η Google διαπιστώνει ήδη πρώιμες ενδείξεις αυτών των δυνατοτήτων μοντελοποίησης του κόσμου, που εμφανίζονται στην ικανότητα του Gemini να αναπαριστά και να προσομοιώνει φυσικά περιβάλλοντα, να κατανοεί τη διαισθητική φυσική μέσω του μοντέλου Veo, και να διδάσκει ρομπότ να πιάνουν αντικείμενα και να ακολουθούν οδηγίες μέσω του Gemini Robotics.
Η εταιρεία περιγράφει αυτή την εξέλιξη ως καθοριστικό βήμα προς τη δημιουργία ενός «καθολικού βοηθού AI» – ενός ευφυούς συστήματος που κατανοεί το πλαίσιο και μπορεί να σχεδιάζει και να ενεργεί σε οποιαδήποτε συσκευή. Το απώτερο όραμα της Google είναι να μετασχηματίσει την εφαρμογή Gemini σε έναν βοηθό που θα εκτελεί καθημερινές εργασίες, θα διαχειρίζεται διοικητικά καθήκοντα και θα παρέχει εξατομικευμένες προτάσεις.
Αυτή η δυνατότητα μοντέλου του κόσμου βασίζεται ήδη στις εντυπωσιακές ικανότητες συλλογισμού του Gemini 2.5 Pro. Το μοντέλο αυτή τη στιγμή προηγείται σε δοκιμασίες πολύπλοκων μαθηματικών, επιστημονικών και προγραμματιστικών εργασιών, ενώ καταλαμβάνει την πρώτη θέση στις λίστες κατάταξης LMArena και WebDev Arena, που μετρούν τις ανθρώπινες προτιμήσεις για αλληλεπιδράσεις με AI.
Η Google σχεδιάζει να ενσωματώσει αυτές τις δυνατότητες μοντέλου του κόσμου με τεχνολογίες από τα Project Mariner και Project Astra, που εστιάζουν αντίστοιχα στην πολυδιεργασία και στην οπτική κατανόηση. Το ενισχυμένο Gemini 2.5 Pro αναμένεται να είναι γενικά διαθέσιμο τον Ιούνιο του 2025, μετά την τρέχουσα φάση προεπισκόπησης.