Google DeepMind, robotları daha akıllı ve bağımsız hale getirme yolunda önemli bir adım attı ve Gemini Robotics On-Device'i piyasaya sürdü. Bu güçlü yapay zekâ sistemi, tamamen robotun kendi üzerinde çalışıyor ve bulut bağlantısına ihtiyaç duymuyor.
24 Haziran 2025'te tanıtılan bu görsel-dil-eylem (VLA) modeli, sürekli internet bağlantısı gerekliliğini ortadan kaldırarak robotik yapay zekâda büyük bir ilerlemeye işaret ediyor. Teknoloji, Mart ayında duyurulan ve Gemini 2.0 çerçevesiyle makinelere çok modlu akıl yürütme ve gerçek dünya anlayışı kazandıran Gemini Robotics platformu üzerine inşa edildi.
Cihaz üzerinde çalışan model, yerel olarak çalışmasına rağmen etkileyici yetenekler sunuyor. Google'ın yaptığı kıyaslamalarda, bulut tabanlı Gemini Robotics modeliyle yakın bir performans sergilerken, özellikle zorlu ve dağılım dışı görevlerde ve karmaşık çok adımlı talimatlarda diğer cihaz üzeri alternatiflerden daha iyi sonuçlar veriyor.
"Model, veri ağına bağımsız olarak çalıştığı için gecikmeye duyarlı uygulamalarda faydalı ve bağlantının kesik ya da hiç olmadığı ortamlarda sağlamlık sağlıyor," diye belirtti Google DeepMind duyurusunda.
Gemini Robotics On-Device, farklı test senaryolarında genel amaçlı çeviklikte güçlü bir performans sergiliyor. Modelle çalışan robotlar, bulut desteği olmadan çanta fermuarı açmak ve kıyafet katlamak gibi yüksek çeviklik gerektiren görevleri başarıyla tamamladı. Sistem, doğal dilde verilen komutları anlayabiliyor ve değişen ortamlara gerçek zamanlı olarak uyum sağlayabiliyor.
Google ayrıca geliştiricilerin modeli değerlendirmesine ve özelleştirmesine yardımcı olacak bir Gemini Robotics SDK'sı da sunuyor. Özellikle, Google'ın ince ayar için erişime açtığı ilk VLA modeli olması dikkat çekiyor; böylece geliştiriciler, yalnızca 50 ila 100 gösterimle modeli belirli uygulamalara uyarlayabiliyor.
Başlangıçta ALOHA robotları için eğitilen model, Google tarafından şimdiden çift kollu Franka FR3 robotu ve Apptronik'in Apollo insansı robotu gibi diğer platformlarda da çalışacak şekilde uyarlandı. Bu çok yönlülük, üretimden sağlığa kadar birçok sektörde geniş uygulama potansiyeline işaret ediyor.
Bu gelişme, Nvidia, Hugging Face ve RLWRLD gibi şirketlerin de robotlar için temel modeller üzerinde çalıştığı bir dönemde, yapay zekâ destekli robotik alanındaki rekabetin kızıştığı bir zamanda geldi. Google'ın cihaz üzeri yaklaşımı, robotların bulut bağlantısının pratik olmadığı veya imkânsız olduğu ortamlarda da etkili şekilde çalışmasını sağlayarak alandaki kritik bir sınırlamayı ortadan kaldırıyor.