Google DeepMind ने Gemini Robotics On-Device के लॉन्च के साथ रोबोट्स को और अधिक स्मार्ट और स्वतंत्र बनाने की दिशा में एक महत्वपूर्ण कदम उठाया है। यह शक्तिशाली एआई सिस्टम पूरी तरह से रोबोट पर ही चलता है, न कि क्लाउड में।
24 जून, 2025 को पेश किए गए इस विज़न-लैंग्वेज-एक्शन (VLA) मॉडल ने रोबोटिक्स एआई में बड़ा बदलाव लाया है, क्योंकि अब लगातार इंटरनेट कनेक्टिविटी की आवश्यकता नहीं रह गई है। यह तकनीक मार्च में लॉन्च किए गए गूगल के Gemini Robotics प्लेटफॉर्म पर आधारित है, जिसने Gemini 2.0 फ्रेमवर्क के माध्यम से मशीनों को मल्टीमोडल रीजनिंग और वास्तविक दुनिया की समझ दी थी।
ऑन-डिवाइस मॉडल, स्थानीय रूप से चलते हुए भी, प्रभावशाली क्षमताएँ प्रदान करता है। गूगल के बेंचमार्क्स में, इसका प्रदर्शन क्लाउड-आधारित Gemini Robotics मॉडल के करीब रहा, और अन्य ऑन-डिवाइस विकल्पों की तुलना में बेहतर रहा, खासकर जटिल और बहु-चरणीय निर्देशों वाले कठिन कार्यों में।
"चूंकि यह मॉडल डेटा नेटवर्क से स्वतंत्र रूप से काम करता है, इसलिए यह लेटेंसी-सेंसिटिव एप्लिकेशन्स के लिए उपयोगी है और ऐसे वातावरण में मजबूती सुनिश्चित करता है जहाँ कनेक्टिविटी अस्थिर या शून्य हो," गूगल डीपमाइंड ने अपनी घोषणा में कहा।
Gemini Robotics On-Device ने विभिन्न परीक्षण परिदृश्यों में मजबूत सामान्य-उद्देश्यीय कुशलता का प्रदर्शन किया है। डेमो में, इस मॉडल से लैस रोबोट्स ने बिना क्लाउड सहायता के बैग खोलने और कपड़े मोड़ने जैसे जटिल कार्य सफलतापूर्वक पूरे किए। यह सिस्टम प्राकृतिक भाषा में दिए गए आदेशों को समझ सकता है और बदलते परिवेश के अनुसार रियल-टाइम में खुद को अनुकूलित कर सकता है।
गूगल एक Gemini Robotics SDK भी जारी कर रहा है, जिससे डेवलपर्स मॉडल का मूल्यांकन और अनुकूलन कर सकें। खास बात यह है कि यह पहला VLA मॉडल है जिसे गूगल फाइन-ट्यूनिंग के लिए उपलब्ध करा रहा है, जिससे डेवलपर्स केवल 50 से 100 डेमोंस्ट्रेशन के साथ इसे विशिष्ट अनुप्रयोगों के लिए अनुकूलित कर सकते हैं।
शुरुआत में ALOHA रोबोट्स के लिए प्रशिक्षित किए गए इस मॉडल को गूगल ने अन्य प्लेटफॉर्म्स जैसे दो-भुजाओं वाले Franka FR3 रोबोट और Apptronik के Apollo ह्यूमनॉइड रोबोट के लिए भी अनुकूलित किया है। यह बहुपरता निर्माण से लेकर स्वास्थ्य सेवा तक विभिन्न उद्योगों में इसके व्यापक उपयोग की संभावना को दर्शाती है।
यह विकास ऐसे समय में हुआ है जब एआई-संचालित रोबोटिक्स में प्रतिस्पर्धा तेज हो रही है, और Nvidia, Hugging Face, तथा RLWRLD जैसी कंपनियाँ भी रोबोट्स के लिए फाउंडेशन मॉडल्स पर काम कर रही हैं। गूगल का ऑन-डिवाइस दृष्टिकोण इस क्षेत्र की एक महत्वपूर्ण सीमा को संबोधित करता है, जिससे रोबोट्स उन वातावरणों में भी प्रभावी ढंग से कार्य कर सकते हैं जहाँ क्लाउड कनेक्टिविटी व्यावहारिक या संभव नहीं है।