menu
close

جوجل توسع قدرات التحكم بالحاسوب عبر الذكاء الاصطناعي للمطورين من خلال Gemini

تقوم جوجل بدمج إمكانيات التحكم بالحاسوب الخاصة بمشروع Mariner في واجهة Gemini API ومنصة Vertex AI، مما يتيح للمطورين بناء تطبيقات قادرة على التنقل والتفاعل مع واجهات الويب بشكل ذاتي. بدأت شركات مثل Automation Anywhere وUiPath وBrowserbase وAutotab وThe Interaction Company وCartwheel بالفعل في استكشاف هذه الإمكانيات، مع خطط لتوسيع الوصول للمطورين بشكل أوسع هذا الصيف. يمثل هذا التوسع تقدماً كبيراً في تقنيات وكلاء الذكاء الاصطناعي لدى جوجل.
جوجل توسع قدرات التحكم بالحاسوب عبر الذكاء الاصطناعي للمطورين من خلال Gemini

أعلنت جوجل عن توسع كبير في نظام الذكاء الاصطناعي الخاص بها، مشروع Mariner، حيث أتاحت إمكانيات التحكم بالحاسوب للمطورين من خلال واجهة Gemini API ومنصة Vertex AI.

تم الكشف عن مشروع Mariner لأول مرة في أواخر عام 2024، ويعكس هذا المشروع طموح جوجل في تغيير طريقة تفاعل المستخدمين مع الواجهات الرقمية عبر وكلاء الذكاء الاصطناعي. يستطيع النظام فهم وتحليل المعلومات المعروضة على شاشة الحاسوب، بما في ذلك النصوص والصور والأكواد ونماذج الويب، ثم يتنقل بشكل ذاتي بين المواقع الإلكترونية وينفذ مهام معقدة.

وقد تم تعزيز النسخة الأحدث من مشروع Mariner بشكل كبير لتعمل على الأجهزة الافتراضية في السحابة، على غرار وكلاء الذكاء الاصطناعي من OpenAI وAmazon. يتيح هذا النهج السحابي للمستخدمين العمل على مشاريع أخرى بينما يكمل Mariner المهام في الخلفية، مع إمكانية معالجة ما يصل إلى عشر عمليات مختلفة في آن واحد، وهو تحسن كبير مقارنة بالإصدار السابق الذي كان يعمل داخل المتصفح فقط.

بدأت عدة شركات بالفعل في استكشاف إمكانيات مشروع Mariner، من بينها شركات متخصصة في الأتمتة مثل Automation Anywhere وUiPath، بالإضافة إلى Browserbase وAutotab وThe Interaction Company وCartwheel. يستفيد هؤلاء الرواد من قدرة التقنية على أتمتة سير العمل المعقد على الويب، والذي كان يتطلب سابقاً تدخلاً بشرياً مكثفاً.

كما نفذت جوجل تدابير أمنية متقدمة للحماية من التهديدات مثل هجمات الحقن غير المباشر للأوامر، حيث قد يتم تضمين تعليمات خبيثة في البيانات التي يسترجعها نموذج الذكاء الاصطناعي. ووفقاً لجوجل، فقد أدت هذه التحسينات الأمنية إلى زيادة كبيرة في معدل حماية Gemini أثناء استخدام الأدوات، مما يجعل عائلة نماذج Gemini 2.5 الأكثر أماناً لدى الشركة حتى الآن.

من المقرر أن يتاح الوصول الأوسع لإمكانيات مشروع Mariner للمطورين هذا الصيف، مما قد يحدث ثورة في طريقة بناء التطبيقات الذكية القادرة على التحكم والتفاعل مع واجهات الحاسوب. كما يجري دمج هذه التقنية في وضع الذكاء الاصطناعي في بحث جوجل، حيث ستتولى في البداية مهام مثل شراء تذاكر الفعاليات، وحجز المطاعم، وتحديد المواعيد المحلية.

Source:

Latest News