Η Google DeepMind έκανε ένα σημαντικό βήμα προς την ενσωμάτωση προηγμένων δυνατοτήτων τεχνητής νοημοσύνης σε φυσικά ρομπότ με την κυκλοφορία του Gemini Robotics On-Device, ενός μοντέλου σχεδιασμένου να λειτουργεί εξ ολοκλήρου σε τοπικό ρομποτικό υλικό.
Το νέο σύστημα, που ανακοινώθηκε στα τέλη Ιουνίου 2025, βασίζεται στην πλατφόρμα Gemini Robotics που παρουσιάστηκε τον Μάρτιο και έφερε για πρώτη φορά τη πολυτροπική λογική του Gemini 2.0 στον φυσικό κόσμο. Αυτό που καθιστά αυτή την τελευταία έκδοση πρωτοποριακή είναι η ικανότητά της να λειτουργεί ανεξάρτητα από τη σύνδεση στο cloud, διατηρώντας παράλληλα υψηλά επίπεδα απόδοσης.
«Το Gemini Robotics On-Device επιδεικνύει ισχυρή γενικής χρήσης δεξιοτεχνία και γενίκευση εργασιών, ενώ είναι βελτιστοποιημένο για αποδοτική λειτουργία απευθείας στο ίδιο το ρομπότ», σύμφωνα με την επίσημη ανακοίνωση της Google DeepMind. Αυτή η ανεξαρτησία από τη δικτυακή συνδεσιμότητα το καθιστά ιδιαίτερα πολύτιμο για εφαρμογές με ευαισθησία στην καθυστέρηση ή για περιβάλλοντα με διακοπτόμενη ή μηδενική σύνδεση.
Σε δοκιμές αξιολόγησης, η Google υποστηρίζει ότι το τοπικό μοντέλο επιτυγχάνει επιδόσεις κοντά στο αντίστοιχο μοντέλο που βασίζεται στο cloud, ενώ ξεπερνά άλλες τοπικές εναλλακτικές, ειδικά σε απαιτητικές εργασίες εκτός κατανομής και σε πολύπλοκες πολυβηματικές οδηγίες.
Το μοντέλο επιδεικνύει αξιοσημείωτη προσαρμοστικότητα, απαιτώντας μόλις 50-100 παραδείγματα για να μάθει νέες εργασίες. Αν και αρχικά εκπαιδεύτηκε για ρομπότ ALOHA, η Google το προσαρμόζει με επιτυχία ώστε να λειτουργεί με διβραχιόνια ρομπότ Franka FR3 και το ανθρωποειδές ρομπότ Apollo της Apptronik, αναδεικνύοντας την ευελιξία του σε διαφορετικές ρομποτικές πλατφόρμες.
Παράλληλα με το μοντέλο, η Google κυκλοφορεί το Gemini Robotics SDK για να βοηθήσει τους προγραμματιστές να αξιολογήσουν και να προσαρμόσουν την τεχνολογία στις δικές τους εφαρμογές. Το SDK επιτρέπει δοκιμές στον φυσικό προσομοιωτή MuJoCo της Google και παρέχει εργαλεία για ταχεία προσαρμογή σε νέα πεδία.
Αυτή η εξέλιξη σηματοδοτεί σημαντική πρόοδο στην πρακτική ρομποτική, φέρνοντας προηγμένη τεχνητή νοημοσύνη απευθείας στις ρομποτικές συσκευές. Αν και οι καταναλωτικές εφαρμογές ενδέχεται να αργήσουν ακόμη, η Carolina Parada, επικεφαλής ρομποτικής στη Google DeepMind, διακρίνει ευρεία προοπτική: «Θα μπορούσαν να είναι πιο χρήσιμα σε βιομηχανίες όπου οι εγκαταστάσεις είναι σύνθετες, η ακρίβεια σημαντική και οι χώροι όχι φιλικοί προς τον άνθρωπο. Και θα μπορούσαν να φανούν χρήσιμα και σε χώρους με επίκεντρο τον άνθρωπο, όπως το σπίτι.»