اتخذت Google DeepMind خطوة كبيرة نحو جعل الروبوتات أكثر ذكاءً واستقلالية مع إطلاق Gemini Robotics On-Device، وهو نظام ذكاء اصطناعي قوي يعمل بالكامل على الروبوت نفسه بدلاً من السحابة.
تم الكشف عن هذا النموذج الذي يجمع بين الرؤية واللغة والعمل (VLA) في 24 يونيو 2025، ويعد تطوراً كبيراً في ذكاء الروبوتات من خلال إلغاء الحاجة للاتصال الدائم بالإنترنت. تعتمد هذه التقنية على منصة Gemini Robotics التي أطلقتها جوجل في مارس، والتي جلبت قدرات الاستدلال متعدد الوسائط وفهم العالم الحقيقي للآلات من خلال إطار Gemini 2.0.
يقدم النموذج على الجهاز إمكانيات مذهلة رغم تشغيله محلياً. ووفقاً لمعايير جوجل، فإنه يحقق أداءً قريباً من نموذج Gemini Robotics السحابي، ويتفوق على البدائل الأخرى التي تعمل على الجهاز، خاصة في المهام الصعبة خارج نطاق التدريب والتعليمات المعقدة متعددة الخطوات.
وقالت Google DeepMind في إعلانها: "بما أن النموذج يعمل بشكل مستقل عن شبكة البيانات، فهو مفيد للتطبيقات الحساسة للزمن، ويضمن المتانة في البيئات ذات الاتصال المتقطع أو المعدوم".
يُظهر Gemini Robotics On-Device براعة عامة قوية في مختلف سيناريوهات الاختبار. ففي العروض التوضيحية، تمكنت الروبوتات المدعومة بهذا النموذج من إكمال مهام تتطلب مهارة عالية مثل فتح الحقائب وسحب السحابات وطي الملابس دون الحاجة إلى دعم سحابي. كما يمكن للنظام فهم الأوامر باللغة الطبيعية والتكيف مع البيئات المتغيرة في الوقت الفعلي.
تقوم جوجل أيضاً بإطلاق حزمة تطوير برامج (SDK) لـ Gemini Robotics لمساعدة المطورين على تقييم وتخصيص النموذج. والجدير بالذكر أن هذا هو أول نموذج VLA تتيحه جوجل للتخصيص الدقيق، مما يسمح للمطورين بتكييفه مع تطبيقات محددة من خلال 50 إلى 100 تجربة فقط.
وبينما تم تدريب النموذج في البداية على روبوتات ALOHA، فقد قامت جوجل بالفعل بتكييفه للعمل مع منصات أخرى، بما في ذلك روبوت Franka FR3 ثنائي الذراعين وروبوت Apollo البشري من Apptronik. وتشير هذه المرونة إلى إمكانيات تطبيق واسعة عبر الصناعات من التصنيع إلى الرعاية الصحية.
يأتي هذا التطور في ظل اشتداد المنافسة في مجال الروبوتات المدعومة بالذكاء الاصطناعي، حيث تعمل شركات مثل Nvidia وHugging Face وRLWRLD جميعها على تطوير نماذج أساسية للروبوتات. ويعالج نهج جوجل القائم على الجهاز قيداً أساسياً في هذا المجال من خلال تمكين الروبوتات من العمل بكفاءة في البيئات التي يكون فيها الاتصال السحابي غير عملي أو مستحيلاً.