OpenAI ने आर्टिफिशियल इंटेलिजेंस के क्षेत्र में एक बड़ा कदम उठाया है। कंपनी ने ChatGPT Agent लॉन्च किया है, जो अपने वर्चुअल कंप्यूटर का उपयोग करके जटिल कार्यों को शुरू से अंत तक स्वतंत्र रूप से पूरा कर सकता है।
17 जुलाई 2025 को घोषित यह नया एजेंट तीन पहले से अलग-अलग क्षमताओं को एकीकृत करता है: Operator की वेबसाइट्स पर क्लिक, स्क्रॉल और टाइप करने की क्षमता; डीप रिसर्च की वेब से जानकारी एकत्रित कर उसका विश्लेषण करने की विशेषज्ञता; और ChatGPT की संवादात्मक बुद्धिमत्ता। इस एकीकरण से पहले के टूल्स की सीमाएं दूर होती हैं, जो अलग-अलग तो अच्छे थे, लेकिन पूरी कार्यप्रणाली को एक साथ संभाल नहीं पाते थे।
GPT-4o, OpenAI के प्रमुख मल्टीमॉडल मॉडल द्वारा संचालित, ChatGPT Agent अब जटिल अनुरोधों को संभाल सकता है, जैसे "तीन प्रतिस्पर्धियों का विश्लेषण कर स्लाइड डेक बनाओ" या "मेरे कैलेंडर को देखकर हालिया खबरों के आधार पर आगामी क्लाइंट मीटिंग्स की ब्रीफिंग दो"। यह सिस्टम वेबसाइट्स को विजुअली और टेक्स्ट के माध्यम से नेविगेट करता है, फॉर्म भरता है, उपयोगकर्ता की अनुमति से अधिकृत अकाउंट्स तक पहुंचता है, कोड निष्पादित करता है और स्प्रेडशीट्स व प्रेजेंटेशन सहित संपादन योग्य दस्तावेज़ तैयार करता है।
बेंचमार्क परीक्षणों में, ChatGPT Agent ने पिछले OpenAI टूल्स की तुलना में काफी बेहतर प्रदर्शन किया। इन्वेस्टमेंट बैंकिंग एनालिस्ट मॉडलिंग टास्क्स में, इसने डीप रिसर्च और o3 मॉडल दोनों को पीछे छोड़ दिया। BrowseComp बेंचमार्क पर, जो मुश्किल जानकारी खोजने के लिए है, इसने 68.9% का नया रिकॉर्ड स्कोर हासिल किया, जो डीप रिसर्च से 17.4 प्रतिशत अंक अधिक है।
हालांकि यह टूल शक्तिशाली है, OpenAI ने स्पष्ट किया है कि नियंत्रण उपयोगकर्ता के हाथ में रहेगा। एजेंट किसी भी महत्वपूर्ण कार्रवाई से पहले अनुमति मांगता है, और उपयोगकर्ता कभी भी टास्क को रोक सकते हैं, ब्राउज़र का नियंत्रण ले सकते हैं या कार्य को बीच में ही समाप्त कर सकते हैं। आज से, Pro, Plus और Team यूजर्स टूल्स ड्रॉपडाउन में 'एजेंट मोड' चुनकर इन क्षमताओं को किसी भी बातचीत में सक्रिय कर सकते हैं।
यह लॉन्च OpenAI की अब तक की सबसे साहसी कोशिश है, जिससे ChatGPT को एक प्रश्नोत्तर टूल से एक ऐसा एजेंटिक प्रोडक्ट बनाया जा सके, जो उपयोगकर्ताओं के लिए कार्य कर सके और जटिल कार्यों को ऑफलोड कर सके। जहां शुरुआती AI एजेंट्स जटिल कार्यों में अक्सर असफल रहे हैं, वहीं OpenAI का दावा है कि ChatGPT Agent पहले के सभी टूल्स से कहीं अधिक सक्षम है और इसे समय के साथ लगातार बेहतर और उपयोगी बनाया जाएगा।