حصل "مشغل" OpenAI، أول وكيل ذكاء اصطناعي حقيقي من الشركة قادر على تنفيذ المهام عبر الإنترنت بشكل مستقل، على ترقية كبيرة في مايو 2025 عندما استبدلت الشركة أساس GPT-4o بنموذج الاستدلال الأكثر تقدماً o3.
تم إطلاق "مشغل" في يناير 2025 كمعاينة بحثية، ويمثل تقدماً كبيراً في تكنولوجيا وكلاء الذكاء الاصطناعي. يعمل المساعد من خلال متصفح خاص به، مما يتيح له التفاعل مع المواقع الإلكترونية عبر النقر والكتابة والتنقل كما يفعل الإنسان. وهذا يمكّن المستخدمين من تفويض المهام المتكررة عبر الإنترنت مثل حجز الإقامات، وحجز المطاعم، وطلب البقالة، وتعبئة النماذج.
لقد حسّنت ترقية مايو إلى نموذج o3 قدرات "مشغل" بشكل ملحوظ. ووفقاً لمعايير OpenAI، فإن النسخة المدعومة بـ o3 تظهر ثباتاً ودقة أفضل بكثير أثناء التفاعل مع المتصفح، مع تحسن الأداء عبر عدة مقاييس تقييم. ففي معيار OSWorld الذي يقيس إكمال المهام عبر المتصفح، سجل نموذج o3 نتيجة 42.9 مقارنة بـ 38.1 للنسخة السابقة، بينما حقق في WebArena نتيجة 62.9 مقابل 48.1 سابقاً.
تظل السلامة محوراً أساسياً لدى OpenAI مع هذا الوكيل القوي. يعتمد "مشغل" نهج سلامة من ثلاث طبقات، يشمل تدابير حماية على مستوى النموذج، ورقابة في الوقت الفعلي، وآليات تحكم للمستخدم. تم تصميم النظام ليطلب من المستخدم التدخل في الإجراءات الحساسة مثل إدخال بيانات تسجيل الدخول أو معلومات الدفع. كما يحافظ على قيود بشأن التفاعلات عالية المخاطر مع منصات مثل البريد الإلكتروني أو الخدمات المالية.
حالياً، يتوفر "مشغل" لمشتركي ChatGPT Pro في الولايات المتحدة مقابل 200 دولار شهرياً، مع خطط لتوسيع الوصول إلى باقات Plus وTeam وEnterprise. وبينما تأخر توفر الخدمة في أوروبا بسبب اعتبارات تنظيمية، أشارت OpenAI إلى أن التوسع الدولي قادم قريباً.
تشير التحديثات الأخيرة في يونيو لنموذج o3-pro، وهو الأكثر قدرة لدى OpenAI حتى الآن، إلى أن المزيد من التحسينات على "مشغل" قد تكون في الأفق. ومع ازدياد المنافسة في سوق وكلاء الذكاء الاصطناعي مع عروض من Google وAnthropic وغيرهم، تواصل OpenAI وضع "مشغل" كحل رائد لأتمتة المهام الرقمية اليومية مع الحفاظ على ضوابط السلامة الهامة.