Google DeepMind telah mengambil langkah penting ke arah menjadikan robot lebih pintar dan berdikari dengan pelancaran Gemini Robotics On-Device, satu sistem AI berkuasa tinggi yang beroperasi sepenuhnya pada robot itu sendiri tanpa bergantung kepada awan.
Diumumkan pada 24 Jun 2025, model vision-language-action (VLA) ini mewakili kemajuan besar dalam AI robotik dengan menghapuskan keperluan untuk sambungan internet berterusan. Teknologi ini dibina berasaskan platform Gemini Robotics Google yang dilancarkan pada bulan Mac, yang memperkenalkan penaakulan multimodal dan kefahaman dunia sebenar kepada mesin melalui kerangka Gemini 2.0.
Model dalam-peranti ini menawarkan keupayaan yang mengagumkan walaupun beroperasi secara tempatan. Dalam penanda aras Google, ia menunjukkan prestasi hampir setara dengan model Gemini Robotics berasaskan awan, malah mengatasi alternatif dalam-peranti lain, terutamanya dalam tugas luar taburan yang mencabar dan arahan pelbagai langkah yang kompleks.
"Oleh kerana model ini beroperasi secara bebas daripada rangkaian data, ia sangat berguna untuk aplikasi yang sensitif terhadap kependaman, dan memastikan ketahanan di persekitaran dengan sambungan terputus-putus atau tiada sambungan langsung," kata Google DeepMind dalam pengumumannya.
Gemini Robotics On-Device mempamerkan ketangkasan serba guna yang kukuh dalam pelbagai senario ujian. Dalam demonstrasi, robot yang dikuasakan oleh model ini berjaya menyelesaikan tugas-tugas yang memerlukan ketangkasan tinggi seperti membuka zip beg dan melipat pakaian tanpa bantuan awan. Sistem ini mampu memahami arahan bahasa semula jadi dan menyesuaikan diri dengan persekitaran yang berubah secara masa nyata.
Google turut memperkenalkan Gemini Robotics SDK untuk membantu pembangun menilai dan menyesuaikan model ini. Menariknya, ini merupakan model VLA pertama yang ditawarkan Google untuk penalaan lanjut (fine-tuning), membolehkan pembangun menyesuaikannya untuk aplikasi khusus dengan hanya 50 hingga 100 demonstrasi.
Pada mulanya dilatih untuk robot ALOHA, Google telah menyesuaikan model ini untuk berfungsi dengan platform lain, termasuk robot dua lengan Franka FR3 dan robot humanoid Apollo keluaran Apptronik. Serba boleh ini menunjukkan potensi aplikasi yang luas merangkumi pelbagai industri daripada pembuatan hingga penjagaan kesihatan.
Perkembangan ini hadir ketika persaingan dalam bidang robotik berkuasa AI semakin sengit, dengan syarikat seperti Nvidia, Hugging Face, dan RLWRLD turut membangunkan model asas untuk robot. Pendekatan dalam-peranti Google menangani kekangan kritikal dalam bidang ini dengan membolehkan robot berfungsi secara efektif di persekitaran di mana sambungan awan tidak praktikal atau mustahil.