Η Google DeepMind έκανε ένα σημαντικό βήμα προς την κατεύθυνση της δημιουργίας πιο έξυπνων και αυτόνομων ρομπότ με την κυκλοφορία του Gemini Robotics On-Device, που ανακοινώθηκε στις 24 Ιουνίου 2025.
Το νέο μοντέλο αποτελεί μια μεγάλη πρόοδο στην τεχνητή νοημοσύνη για ρομπότ, επιτρέποντάς τους να λειτουργούν χωρίς σύνδεση στο cloud, διατηρώντας παράλληλα εντυπωσιακές δυνατότητες. Σε αντίθεση με τον προκάτοχό του που κυκλοφόρησε τον Μάρτιο, το Gemini Robotics On-Device λειτουργεί εξ ολοκλήρου στο τοπικό υλικό του ρομπότ, εξαλείφοντας την ανάγκη για συνεχή πρόσβαση στο διαδίκτυο, ενώ προσφέρει απόδοση συγκρίσιμη με τις λύσεις που βασίζονται στο cloud.
«Δεδομένου ότι το μοντέλο λειτουργεί ανεξάρτητα από το δίκτυο δεδομένων, είναι ιδανικό για εφαρμογές με ευαισθησία στην καθυστέρηση και εξασφαλίζει αξιοπιστία σε περιβάλλοντα με διακεκομμένη ή μηδενική συνδεσιμότητα», ανέφερε η Google DeepMind στην ανακοίνωσή της.
Η τεχνολογία επιδεικνύει εντυπωσιακή επιδεξιότητα και προσαρμοστικότητα, επιτρέποντας στα ρομπότ να ολοκληρώνουν πολύπλοκες εργασίες που απαιτούν λεπτούς χειρισμούς. Σε επιδείξεις, ρομπότ που τροφοδοτούνται από το μοντέλο κατάφεραν να εκτελέσουν απαιτητικές λειτουργίες όπως το δίπλωμα ρούχων, το άνοιγμα φερμουάρ και την ακριβή συναρμολόγηση βιομηχανικών εξαρτημάτων.
Παράλληλα με το μοντέλο, η Google κυκλοφορεί και το Gemini Robotics SDK, το οποίο επιτρέπει στους προγραμματιστές να αξιολογήσουν και να προσαρμόσουν το σύστημα για συγκεκριμένες εφαρμογές. Το SDK δίνει τη δυνατότητα εκπαίδευσης των ρομπότ σε νέες εργασίες με μόλις 50 έως 100 παραδείγματα, χρησιμοποιώντας τον προσομοιωτή φυσικής MuJoCo. Αν και αρχικά εκπαιδεύτηκε για τα ρομπότ ALOHA, η Google κατάφερε να προσαρμόσει το μοντέλο και σε άλλες πλατφόρμες, όπως το ρομπότ διπλού βραχίονα Franka FR3 και το ανθρωποειδές ρομπότ Apollo της Apptronik.
Η εξέλιξη αυτή έρχεται σε μια περίοδο που ο ανταγωνισμός στην τεχνητή νοημοσύνη για ρομπότ εντείνεται, με εταιρείες όπως η NVIDIA και η Hugging Face να αναπτύσσουν επίσης βασικά μοντέλα για ρομπότ. Η προσέγγιση της Google για λειτουργία απευθείας στη συσκευή αντιμετωπίζει κρίσιμες προκλήσεις στην ανάπτυξη της ρομποτικής, όπως ζητήματα ιδιωτικότητας και λειτουργία σε περιβάλλοντα με περιορισμένη συνδεσιμότητα.
Οι προγραμματιστές που ενδιαφέρονται να δουλέψουν με το Gemini Robotics On-Device μπορούν να υποβάλουν αίτηση για να συμμετάσχουν στο πρόγραμμα trusted tester της Google, αποκτώντας πρόσβαση τόσο στο μοντέλο όσο και στο SDK.