Η Ενσωματωμένη Τεχνητή Νοημοσύνη της Google Φέρνει Αυτόνομη Νοημοσύνη στα Ρομπότ

Η Google παρουσίασε το Gemini Robotics On-Device, ένα προηγμένο μοντέλο τεχνητής νοημοσύνης που λειτουργεί απευθείας στα ρομπότ χωρίς να απαιτείται σύνδεση στο διαδίκτυο. Αυτή η καινοτόμος τεχνολογία επιτρέπει στα ρομπότ να εκτελούν σύνθετες εργασίες με μεγαλύτερη αυτονομία, ταχύτερους χρόνους απόκρισης και βελτιωμένη λειτουργικότητα σε περιβάλλοντα με περιορισμένη ή καθόλου συνδεσιμότητα. Βασισμένο στην πλατφόρμα Gemini Robotics που παρουσιάστηκε τον Μάρτιο, η νέα ενσωματωμένη έκδοση εξοπλίζει τα μηχανήματα με εξελιγμένη δεξιοτεχνία και ικανότητα γενίκευσης εργασιών, διατηρώντας υψηλές επιδόσεις σε σύγκριση με τις λύσεις που βασίζονται στο cloud.

Η Google DeepMind έκανε ένα σημαντικό βήμα προς την κατεύθυνση της δημιουργίας πιο έξυπνων και ανεξάρτητων ρομπότ με την κυκλοφορία του Gemini Robotics On-Device, ενός ισχυρού συστήματος τεχνητής νοημοσύνης που λειτουργεί εξ ολοκλήρου πάνω στο ίδιο το ρομπότ και όχι στο cloud.

Παρουσιάστηκε στις 24 Ιουνίου 2025 και το μοντέλο αυτό όρασης-γλώσσας-δράσης (VLA) αποτελεί σημαντική πρόοδο στην τεχνητή νοημοσύνη για ρομποτική, καθώς εξαλείφει την ανάγκη για συνεχή σύνδεση στο διαδίκτυο. Η τεχνολογία βασίζεται στην πλατφόρμα Gemini Robotics που λανσαρίστηκε τον Μάρτιο, η οποία εισήγαγε πολυτροπική λογική και κατανόηση του πραγματικού κόσμου στα μηχανήματα μέσω του πλαισίου Gemini 2.0.

Το ενσωματωμένο μοντέλο προσφέρει εντυπωσιακές δυνατότητες, παρότι λειτουργεί τοπικά. Σύμφωνα με τα benchmarks της Google, αποδίδει σε επίπεδο κοντά στο cloud-based μοντέλο Gemini Robotics, ξεπερνώντας άλλες ενσωματωμένες εναλλακτικές, ιδιαίτερα σε απαιτητικές εργασίες εκτός κατανομής και σε σύνθετες, πολυβήματες οδηγίες.

«Δεδομένου ότι το μοντέλο λειτουργεί ανεξάρτητα από το δίκτυο δεδομένων, είναι χρήσιμο για εφαρμογές με ευαισθησία στην καθυστέρηση και διασφαλίζει ανθεκτικότητα σε περιβάλλοντα με διακεκομμένη ή μηδενική συνδεσιμότητα», ανέφερε η Google DeepMind στην ανακοίνωσή της.

Το Gemini Robotics On-Device επιδεικνύει ισχυρή γενικής χρήσης δεξιοτεχνία σε διάφορα σενάρια δοκιμών. Σε επιδείξεις, ρομπότ που τροφοδοτούνται από το μοντέλο ολοκλήρωσαν με επιτυχία ιδιαίτερα επιδέξιες εργασίες, όπως το άνοιγμα φερμουάρ σε τσάντες και το δίπλωμα ρούχων, χωρίς βοήθεια από το cloud. Το σύστημα μπορεί να κατανοεί εντολές σε φυσική γλώσσα και να προσαρμόζεται σε μεταβαλλόμενα περιβάλλοντα σε πραγματικό χρόνο.

Η Google κυκλοφορεί επίσης ένα Gemini Robotics SDK για να βοηθήσει τους προγραμματιστές να αξιολογήσουν και να προσαρμόσουν το μοντέλο. Αξίζει να σημειωθεί ότι αυτό είναι το πρώτο μοντέλο VLA που η Google διαθέτει για fine-tuning, επιτρέποντας στους προγραμματιστές να το προσαρμόσουν σε συγκεκριμένες εφαρμογές με μόλις 50 έως 100 παραδείγματα.

Αρχικά εκπαιδευμένο για ρομπότ ALOHA, η Google έχει ήδη προσαρμόσει το μοντέλο ώστε να λειτουργεί και με άλλες πλατφόρμες, όπως το ρομπότ διπλού βραχίονα Franka FR3 και το ανθρωποειδές ρομπότ Apollo της Apptronik. Αυτή η ευελιξία υποδηλώνει ευρείες δυνατότητες εφαρμογής σε τομείς από τη βιομηχανία μέχρι την υγεία.

Η εξέλιξη αυτή έρχεται σε μια περίοδο που ο ανταγωνισμός στην τεχνητή νοημοσύνη για ρομποτική εντείνεται, με εταιρείες όπως οι Nvidia, Hugging Face και RLWRLD να εργάζονται επίσης πάνω σε βασικά μοντέλα για ρομπότ. Η προσέγγιση της Google με ενσωματωμένη λειτουργία αντιμετωπίζει ένα κρίσιμο περιορισμό του κλάδου, επιτρέποντας στα ρομπότ να λειτουργούν αποτελεσματικά σε περιβάλλοντα όπου η σύνδεση με το cloud είναι ανέφικτη ή αδύνατη.

Source:

Η Ενσωματωμένη Τεχνητή Νοημοσύνη της Google Φέρνει Αυτόνομη Νοημοσύνη στα Ρομπότ

Latest News

Η Google Παρουσιάζει το Υπερ-Αποδοτικό Gemini 2.5 Flash-Lite για Οικονομικά Ευαίσθητη Τεχνητή Νοημοσύνη

Η Google Λανσάρει το Gemini CLI: Βοηθός Τεχνητής Νοημοσύνης για Τερματικά Προγραμματιστών

Η Google Παρουσιάζει το Imagen 4 με Επαναστατική Απόδοση Κειμένου

Η Τεχνητή Νοημοσύνη της Google Επαναστατεί στη Φροντίδα του Καρκίνου με Πρωτοποριακά Εργαλεία Ανίχνευσης

Οι Εταιρείες Στερούνται Κρίσιμων Ανθρώπινων Δεξιοτήτων για Επιτυχία στην Εποχή της Τεχνητής Νοημοσύνης

Το VentureBeat Αποκαλύπτει Μεγάλη Μετατόπιση στην Αγορά Τεχνητής Νοημοσύνης στην Ανάλυση του 2025

Το GPT-5 της OpenAI Ενοποιεί τις Δυνατότητες της Τεχνητής Νοημοσύνης σε Ένα Ισχυρό Μοντέλο

Το Στοίχημα 14,8 Δισ. Δολαρίων της Meta στην Τεχνητή Νοημοσύνη: Πράξη Απελπισίας ή Στρατηγική Διορατικότητα;

Οι Τεχνολογικοί Κολοσσοί Ενστερνίζονται την Πυρηνική Ενέργεια για να Καλύψουν τις Ενεργειακές Ανάγκες της Τεχνητής Νοημοσύνης

Η Dailymotion Αποκαλύπτει την Επανάσταση της Βίντεο Πλατφόρμας με Τεχνητή Νοημοσύνη

Η Ενσωματωμένη Τεχνητή Νοημοσύνη της Google Φέρνει Αυτόνομη Νοημοσύνη στα Ρομπότ

Related Articles

Η Google Παρουσιάζει το Imagen 4 με Επαναστατική Απόδοση Κειμένου

Η Google Λανσάρει το Gemini CLI: Βοηθός Τεχνητής Νοημοσύνης για Τερματικά Προγραμματιστών

Η Τεχνητή Νοημοσύνη της Google Επαναστατεί στη Φροντίδα του Καρκίνου με Πρωτοποριακά Εργαλεία Ανίχνευσης

Η Google Παρουσιάζει το Υπερ-Αποδοτικό Gemini 2.5 Flash-Lite για Οικονομικά Ευαίσθητη Τεχνητή Νοημοσύνη

Το VentureBeat Αποκαλύπτει Μεγάλη Μετατόπιση στην Αγορά Τεχνητής Νοημοσύνης στην Ανάλυση του 2025

Latest News

Η Google Παρουσιάζει το Υπερ-Αποδοτικό Gemini 2.5 Flash-Lite για Οικονομικά Ευαίσθητη Τεχνητή Νοημοσύνη

Η Google Λανσάρει το Gemini CLI: Βοηθός Τεχνητής Νοημοσύνης για Τερματικά Προγραμματιστών

Η Google Παρουσιάζει το Imagen 4 με Επαναστατική Απόδοση Κειμένου

Η Τεχνητή Νοημοσύνη της Google Επαναστατεί στη Φροντίδα του Καρκίνου με Πρωτοποριακά Εργαλεία Ανίχνευσης

Οι Εταιρείες Στερούνται Κρίσιμων Ανθρώπινων Δεξιοτήτων για Επιτυχία στην Εποχή της Τεχνητής Νοημοσύνης

Το VentureBeat Αποκαλύπτει Μεγάλη Μετατόπιση στην Αγορά Τεχνητής Νοημοσύνης στην Ανάλυση του 2025

Το GPT-5 της OpenAI Ενοποιεί τις Δυνατότητες της Τεχνητής Νοημοσύνης σε Ένα Ισχυρό Μοντέλο

Το Στοίχημα 14,8 Δισ. Δολαρίων της Meta στην Τεχνητή Νοημοσύνη: Πράξη Απελπισίας ή Στρατηγική Διορατικότητα;

Οι Τεχνολογικοί Κολοσσοί Ενστερνίζονται την Πυρηνική Ενέργεια για να Καλύψουν τις Ενεργειακές Ανάγκες της Τεχνητής Νοημοσύνης

Η Dailymotion Αποκαλύπτει την Επανάσταση της Βίντεο Πλατφόρμας με Τεχνητή Νοημοσύνη