تعمل جوجل على توسيع إمكانيات الذكاء الاصطناعي لديها من خلال دمج ميزات استخدام الكمبيوتر من مشروع مارينر في واجهة Gemini API ومنصة Vertex AI، في خطوة تمثل تقدماً كبيراً في تطوير أنظمة الذكاء الاصطناعي الوكيلية.
مشروع مارينر، الذي تم الكشف عنه لأول مرة في أواخر عام 2024، هو نموذج بحثي من Google DeepMind يستكشف التفاعل بين الإنسان والوكيل عبر متصفحات الويب. يمكن للنظام مراقبة ما يُعرض في المتصفحات، وفهم الأهداف المعقدة، وتخطيط الخطوات القابلة للتنفيذ، والتنقل في المواقع الإلكترونية لإتمام المهام بشكل مستقل. كما أنه قادر على تنفيذ عدة عمليات في الوقت نفسه، حيث يستطيع الإصدار الأحدث منه إكمال ما يصل إلى عشر مهام مختلفة في آن واحد.
بدأت بالفعل عدة شركات تقنية في استكشاف إمكانيات مشروع مارينر. من بين أوائل المتبنين شركة Automation Anywhere الرائدة في أتمتة العمليات الوكيلية، وUiPath المعروفة بمنصتها للأتمتة. وتشمل الشركاء الآخرين Browserbase، التي تطور أطر عمل لأتمتة المتصفحات بالذكاء الاصطناعي، وAutotab، وThe Interaction Company، وCartwheel، وهي منصة لتحويل النصوص إلى رسوم متحركة تأسست في عام 2023.
سيسمح الدمج مع Gemini API وVertex AI للمطورين ببناء تطبيقات تعتمد على هذه القدرات الوكيلية. كما عززت جوجل بشكل كبير من إجراءات الحماية الأمنية ضد التهديدات مثل حقن التعليمات غير المباشرة، مما يجعل عائلة نماذج Gemini 2.5 الأكثر أماناً حتى الآن.
يتمتع مشتركو Google AI Ultra في الولايات المتحدة بالفعل بإمكانية الوصول إلى مشروع مارينر، مع خطط لإتاحة الوصول للمطورين بشكل أوسع هذا الصيف. كما تعتزم الشركة جلب بعض قدرات مارينر إلى منتجات جوجل الأخرى، بما في ذلك وضع الذكاء الاصطناعي في Search Labs، حيث سيمكن تنفيذ مهام مثل شراء تذاكر الفعاليات وحجز المطاعم.
يمثل هذا التطور تحولاً جذرياً في طريقة تفاعل المستخدمين مع الإنترنت، حيث قد ينتقل المستخدمون من التفاعل المباشر مع المواقع إلى تفويض المهام لوكلاء الذكاء الاصطناعي. ومع نضوج هذه القدرات، من المتوقع أن تحدث ثورة في مجال الأتمتة عبر مختلف الصناعات، وتفتح الباب أمام تطبيقات جديدة كلياً لمساعدي الذكاء الاصطناعي.