menu
close

جوجل توسع الذكاء الاصطناعي الوكيلي بدمج مشروع مارينر

أعلنت جوجل عن دمج قدرات استخدام الكمبيوتر من مشروع مارينر في واجهة Gemini API ومنصة Vertex AI، مما يمثل تقدماً كبيراً في تقنيات الذكاء الاصطناعي الوكيلي. وتستكشف عدة شركات، من بينها Automation Anywhere وUiPath وBrowserbase وAutotab وThe Interaction Company وCartwheel، تطبيقات هذه التقنية. وتخطط جوجل لإتاحة هذه القدرات للمطورين بشكل أوسع هذا الصيف، مما يمكّن أنظمة الذكاء الاصطناعي من التفاعل مع أجهزة الكمبيوتر والتحكم بها بطرق شبيهة بالبشر.
جوجل توسع الذكاء الاصطناعي الوكيلي بدمج مشروع مارينر

تعمل جوجل على توسيع قدرات الذكاء الاصطناعي لديها من خلال دمج ميزات استخدام الكمبيوتر من مشروع مارينر في واجهة Gemini API ومنصة Vertex AI، في خطوة تمثل تقدماً كبيراً في تطوير أنظمة الذكاء الاصطناعي الوكيلية.

مشروع مارينر، الذي تم الكشف عنه لأول مرة في أواخر عام 2024، هو نموذج بحثي من Google DeepMind يستكشف التفاعل بين الإنسان والوكيل عبر متصفحات الإنترنت. يستطيع النظام مراقبة ما يُعرض في المتصفحات، وفهم الأهداف المعقدة، وتخطيط الخطوات القابلة للتنفيذ، والتنقل في المواقع الإلكترونية لإتمام المهام بشكل مستقل. كما يمكنه التعامل مع عدة عمليات في وقت واحد، حيث أصبح الإصدار الأخير قادراً على إتمام ما يصل إلى عشر مهام مختلفة في آن واحد.

بدأت عدة شركات تقنية بالفعل في استكشاف إمكانيات مشروع مارينر. من بين أوائل المتبنين Automation Anywhere، الرائدة في أتمتة العمليات الوكيلية، وUiPath المعروفة بمنصتها للأتمتة. وتشمل الشركاء الآخرين Browserbase، التي تطور أطر عمل لأتمتة المتصفح بالذكاء الاصطناعي، وAutotab، وThe Interaction Company، وCartwheel، وهي منصة لتحويل النص إلى رسوم متحركة تأسست في عام 2023.

سيسمح الدمج مع Gemini API وVertex AI للمطورين ببناء تطبيقات مدعومة بهذه القدرات الوكيلية. كما عززت جوجل بشكل كبير الحماية الأمنية ضد التهديدات مثل هجمات الحقن غير المباشر للأوامر، مما يجعل عائلة نماذج Gemini 2.5 الأكثر أماناً حتى الآن.

ويتمتع مشتركو Google AI Ultra في الولايات المتحدة بالفعل بإمكانية الوصول إلى مشروع مارينر، مع خطط لإتاحة الوصول للمطورين بشكل أوسع هذا الصيف. كما تعتزم الشركة جلب بعض قدرات مارينر إلى منتجات جوجل الأخرى، بما في ذلك وضع الذكاء الاصطناعي في Search Labs، حيث ستتيح تنفيذ مهام مثل شراء تذاكر الفعاليات وحجز المطاعم.

يمثل هذا التطور تحولاً جذرياً في طريقة تفاعل المستخدمين مع الإنترنت، حيث قد ينتقل المستخدمون من التفاعل المباشر مع المواقع إلى تفويض المهام لوكلاء الذكاء الاصطناعي. ومع نضوج هذه القدرات، من المتوقع أن تحدث ثورة في الأتمتة عبر مختلف الصناعات وتفتح الباب أمام تطبيقات جديدة كلياً لمساعدي الذكاء الاصطناعي.

Source:

Latest News