أعلنت جوجل عن توسع كبير في نظام الذكاء الاصطناعي الخاص بها Project Mariner، حيث أتاحت قدراته في التحكم بالحاسوب للمطورين عبر منصتي Gemini API وVertex AI.
تم الكشف عن مشروع Mariner لأول مرة في أواخر عام 2024، ويجسد هذا المشروع طموح جوجل في تغيير طريقة تفاعل المستخدمين مع الواجهات الرقمية من خلال وكلاء الذكاء الاصطناعي. يستطيع النظام فهم وتحليل المعلومات المعروضة على شاشة الحاسوب، بما في ذلك النصوص والصور والأكواد ونماذج الويب، ثم التنقل بشكل ذاتي عبر المواقع الإلكترونية وإتمام المهام المعقدة.
وقد تم تعزيز النسخة الأحدث من Project Mariner بشكل كبير لتعمل على الأجهزة الافتراضية في السحابة، على غرار وكلاء الذكاء الاصطناعي من OpenAI وأمازون. ويتيح هذا النهج السحابي للمستخدمين العمل على مشاريع أخرى بينما يقوم Project Mariner بإكمال المهام في الخلفية، مع إمكانية معالجة ما يصل إلى عشر عمليات مختلفة في الوقت نفسه، وهو تطور كبير مقارنة بالإصدار السابق الذي كان يعمل عبر المتصفح فقط.
بدأت عدة شركات بالفعل في استكشاف إمكانيات Project Mariner، من بينها شركات متخصصة في الأتمتة مثل Automation Anywhere وUiPath، إلى جانب Browserbase وAutotab وThe Interaction Company وCartwheel. ويستفيد هؤلاء الرواد الأوائل من قدرة التقنية على أتمتة سير العمل المعقد على الويب، والذي كان يتطلب تدخلاً بشرياً كبيراً في السابق.
كما قامت جوجل بتطبيق تدابير أمنية متقدمة للحماية من التهديدات مثل هجمات الحقن غير المباشر للأوامر، حيث قد يتم تضمين تعليمات خبيثة في البيانات التي يسترجعها نموذج الذكاء الاصطناعي. ووفقاً لجوجل، فقد أدت هذه التحسينات الأمنية إلى رفع معدل الحماية في Gemini بشكل كبير أثناء استخدام الأدوات، مما يجعل عائلة نماذج Gemini 2.5 الأكثر أماناً لدى الشركة حتى الآن.
ومن المقرر إتاحة وصول أوسع للمطورين إلى قدرات Project Mariner هذا الصيف، ما قد يحدث ثورة في طريقة بناء التطبيقات الذكية التي تتحكم وتتفاعل مع واجهات الحاسوب. كما يتم دمج هذه التقنية في وضع الذكاء الاصطناعي في بحث جوجل، حيث ستتولى في البداية مهام مثل شراء تذاكر الفعاليات، وحجز المطاعم، وترتيب المواعيد المحلية.