Google DeepMind telah mengambil langkah signifikan menuju robot yang lebih cerdas dan mandiri dengan merilis Gemini Robotics On-Device, sistem AI canggih yang sepenuhnya berjalan di perangkat robot itu sendiri, bukan di cloud.
Diperkenalkan pada 24 Juni 2025, model vision-language-action (VLA) ini menjadi kemajuan besar dalam AI robotika dengan menghilangkan kebutuhan akan konektivitas internet yang terus-menerus. Teknologi ini dikembangkan dari platform Gemini Robotics milik Google yang diluncurkan pada bulan Maret, yang menghadirkan penalaran multimodal dan pemahaman dunia nyata ke mesin melalui framework Gemini 2.0.
Meski berjalan secara lokal, model on-device ini menawarkan kemampuan yang mengesankan. Dalam pengujian internal Google, performanya mendekati model Gemini Robotics berbasis cloud dan melampaui alternatif on-device lain, terutama pada tugas out-of-distribution yang menantang serta instruksi multi-langkah yang kompleks.
"Karena model ini beroperasi tanpa ketergantungan pada jaringan data, sangat bermanfaat untuk aplikasi yang sensitif terhadap latensi, serta memastikan ketahanan di lingkungan dengan konektivitas yang tidak stabil atau bahkan tanpa koneksi sama sekali," ujar Google DeepMind dalam pengumumannya.
Gemini Robotics On-Device menunjukkan ketangkasan serba guna yang kuat di berbagai skenario pengujian. Dalam demonstrasi, robot yang didukung model ini berhasil menyelesaikan tugas-tugas yang membutuhkan ketangkasan tinggi seperti membuka resleting tas dan melipat pakaian tanpa bantuan cloud. Sistem ini mampu memahami perintah bahasa alami dan beradaptasi dengan perubahan lingkungan secara real-time.
Google juga merilis Gemini Robotics SDK untuk membantu pengembang mengevaluasi dan menyesuaikan model ini. Menariknya, ini adalah model VLA pertama dari Google yang tersedia untuk fine-tuning, memungkinkan pengembang mengadaptasinya ke aplikasi spesifik hanya dengan 50 hingga 100 demonstrasi.
Awalnya dilatih untuk robot ALOHA, Google telah mengadaptasi model ini agar dapat digunakan pada platform lain, termasuk robot dua lengan Franka FR3 dan robot humanoid Apollo dari Apptronik. Fleksibilitas ini membuka potensi aplikasi luas di berbagai industri, mulai dari manufaktur hingga layanan kesehatan.
Pengembangan ini hadir di tengah persaingan ketat dalam bidang robotika berbasis AI, dengan perusahaan seperti Nvidia, Hugging Face, dan RLWRLD juga mengembangkan model dasar untuk robot. Pendekatan on-device dari Google menjawab keterbatasan krusial di bidang ini dengan memungkinkan robot berfungsi secara efektif di lingkungan di mana konektivitas cloud tidak memungkinkan atau tidak praktis.