menu
close

Η Ενσωματωμένη Τεχνητή Νοημοσύνη της Google Φέρνει Αυτόνομη Νοημοσύνη στα Ρομπότ

Η Google παρουσίασε το Gemini Robotics On-Device, ένα προηγμένο μοντέλο τεχνητής νοημοσύνης που λειτουργεί απευθείας στα ρομπότ χωρίς να απαιτείται σύνδεση στο διαδίκτυο. Αυτή η καινοτόμος τεχνολογία επιτρέπει στα ρομπότ να εκτελούν σύνθετες εργασίες με μεγαλύτερη αυτονομία, ταχύτερους χρόνους απόκρισης και βελτιωμένη λειτουργικότητα σε περιβάλλοντα με περιορισμένη ή καθόλου συνδεσιμότητα. Βασισμένο στην πλατφόρμα Gemini Robotics που παρουσιάστηκε τον Μάρτιο, η νέα ενσωματωμένη έκδοση εξοπλίζει τα μηχανήματα με εξελιγμένη δεξιοτεχνία και ικανότητα γενίκευσης εργασιών, διατηρώντας υψηλές επιδόσεις σε σύγκριση με τις λύσεις που βασίζονται στο cloud.
Η Ενσωματωμένη Τεχνητή Νοημοσύνη της Google Φέρνει Αυτόνομη Νοημοσύνη στα Ρομπότ

Η Google DeepMind έκανε ένα σημαντικό βήμα προς την κατεύθυνση της δημιουργίας πιο έξυπνων και ανεξάρτητων ρομπότ με την κυκλοφορία του Gemini Robotics On-Device, ενός ισχυρού συστήματος τεχνητής νοημοσύνης που λειτουργεί εξ ολοκλήρου πάνω στο ίδιο το ρομπότ και όχι στο cloud.

Παρουσιάστηκε στις 24 Ιουνίου 2025 και το μοντέλο αυτό όρασης-γλώσσας-δράσης (VLA) αποτελεί σημαντική πρόοδο στην τεχνητή νοημοσύνη για ρομποτική, καθώς εξαλείφει την ανάγκη για συνεχή σύνδεση στο διαδίκτυο. Η τεχνολογία βασίζεται στην πλατφόρμα Gemini Robotics που λανσαρίστηκε τον Μάρτιο, η οποία εισήγαγε πολυτροπική λογική και κατανόηση του πραγματικού κόσμου στα μηχανήματα μέσω του πλαισίου Gemini 2.0.

Το ενσωματωμένο μοντέλο προσφέρει εντυπωσιακές δυνατότητες, παρότι λειτουργεί τοπικά. Σύμφωνα με τα benchmarks της Google, αποδίδει σε επίπεδο κοντά στο cloud-based μοντέλο Gemini Robotics, ξεπερνώντας άλλες ενσωματωμένες εναλλακτικές, ιδιαίτερα σε απαιτητικές εργασίες εκτός κατανομής και σε σύνθετες, πολυβήματες οδηγίες.

«Δεδομένου ότι το μοντέλο λειτουργεί ανεξάρτητα από το δίκτυο δεδομένων, είναι χρήσιμο για εφαρμογές με ευαισθησία στην καθυστέρηση και διασφαλίζει ανθεκτικότητα σε περιβάλλοντα με διακεκομμένη ή μηδενική συνδεσιμότητα», ανέφερε η Google DeepMind στην ανακοίνωσή της.

Το Gemini Robotics On-Device επιδεικνύει ισχυρή γενικής χρήσης δεξιοτεχνία σε διάφορα σενάρια δοκιμών. Σε επιδείξεις, ρομπότ που τροφοδοτούνται από το μοντέλο ολοκλήρωσαν με επιτυχία ιδιαίτερα επιδέξιες εργασίες, όπως το άνοιγμα φερμουάρ σε τσάντες και το δίπλωμα ρούχων, χωρίς βοήθεια από το cloud. Το σύστημα μπορεί να κατανοεί εντολές σε φυσική γλώσσα και να προσαρμόζεται σε μεταβαλλόμενα περιβάλλοντα σε πραγματικό χρόνο.

Η Google κυκλοφορεί επίσης ένα Gemini Robotics SDK για να βοηθήσει τους προγραμματιστές να αξιολογήσουν και να προσαρμόσουν το μοντέλο. Αξίζει να σημειωθεί ότι αυτό είναι το πρώτο μοντέλο VLA που η Google διαθέτει για fine-tuning, επιτρέποντας στους προγραμματιστές να το προσαρμόσουν σε συγκεκριμένες εφαρμογές με μόλις 50 έως 100 παραδείγματα.

Αρχικά εκπαιδευμένο για ρομπότ ALOHA, η Google έχει ήδη προσαρμόσει το μοντέλο ώστε να λειτουργεί και με άλλες πλατφόρμες, όπως το ρομπότ διπλού βραχίονα Franka FR3 και το ανθρωποειδές ρομπότ Apollo της Apptronik. Αυτή η ευελιξία υποδηλώνει ευρείες δυνατότητες εφαρμογής σε τομείς από τη βιομηχανία μέχρι την υγεία.

Η εξέλιξη αυτή έρχεται σε μια περίοδο που ο ανταγωνισμός στην τεχνητή νοημοσύνη για ρομποτική εντείνεται, με εταιρείες όπως οι Nvidia, Hugging Face και RLWRLD να εργάζονται επίσης πάνω σε βασικά μοντέλα για ρομπότ. Η προσέγγιση της Google με ενσωματωμένη λειτουργία αντιμετωπίζει ένα κρίσιμο περιορισμό του κλάδου, επιτρέποντας στα ρομπότ να λειτουργούν αποτελεσματικά σε περιβάλλοντα όπου η σύνδεση με το cloud είναι ανέφικτη ή αδύνατη.

Source:

Latest News