OpenAI a dévoilé ChatGPT Agent, une avancée révolutionnaire qui transforme la célèbre IA d’assistante conversationnelle en collègue numérique autonome, capable d’accomplir seule des tâches complexes.
Ce nouveau système permet à ChatGPT de réfléchir et d’agir de manière proactive, en prenant en charge des tâches complexes de bout en bout grâce à son propre ordinateur virtuel. Les utilisateurs peuvent désormais demander à ChatGPT d’effectuer une grande variété de tâches informatiques, allant de la gestion d’agendas à la création de présentations modifiables, en passant par l’exécution de code.
Ce qui distingue ChatGPT Agent, c’est son approche unifiée des capacités de l’IA. Auparavant, OpenAI proposait des outils distincts avec des points forts spécifiques : Operator pouvait faire défiler, cliquer et saisir du texte sur des sites web mais n’était pas capable d’analyse approfondie, tandis que Deep Research excellait dans l’analyse et la synthèse d’informations sans pouvoir interagir avec des sites nécessitant une authentification. En intégrant ces forces complémentaires et en ajoutant de nouveaux outils, OpenAI a ouvert la voie à des capacités inédites au sein d’un même modèle.
La sécurité est au cœur du nouveau système. OpenAI a particulièrement insisté sur la protection de ChatGPT Agent contre les manipulations adverses via l’injection de prompt, un risque pour les systèmes agents où des tiers tentent d’influencer le comportement de l’IA à travers des instructions malveillantes rencontrées sur le web. L’entreprise a formé et testé l’agent pour qu’il identifie et résiste à ces injections, mis en place une surveillance pour détecter et répondre rapidement aux attaques, et exige une confirmation explicite de l’utilisateur avant toute action conséquente. Les résultats incluent des liens sources clairement identifiés ou des citations par capture d’écran afin que les utilisateurs puissent vérifier les informations. Des contrôles de confidentialité supplémentaires permettent aux utilisateurs de supprimer toutes les données de navigation et de se déconnecter immédiatement de toutes les sessions web actives en un seul clic. Lorsqu’ils interagissent avec le web via le navigateur de ChatGPT en « mode prise de contrôle », les saisies restent privées et ChatGPT ne collecte ni ne stocke de données sensibles telles que les mots de passe.
Malgré ces avancées, ChatGPT Agent n’en est qu’à ses débuts. S’il peut gérer une gamme de tâches complexes, il reste sujet à l’erreur. La nouvelle fonctionnalité Agent est actuellement disponible pour les utilisateurs de ChatGPT Plus, Pro et Team, permettant à l’IA d’effectuer de véritables tâches à l’aide d’un ordinateur virtuel intégré au navigateur.
Cette sortie marque un tournant dans l’intégration de l’IA aux flux de travail professionnels. La dernière évolution de l’intelligence artificielle dépasse la simple conversation, inaugurant une ère où les assistants numériques peuvent exécuter activement des tâches sur l’ensemble du paysage numérique. Ce développement marque un changement significatif, faisant passer l’IA de la compréhension interprétative à l’engagement direct et opérationnel avec les outils et interfaces utilisés quotidiennement par les humains. Ce lancement traduit une évolution dans la façon dont les utilisateurs interagissent avec l’IA : il ne s’agit plus seulement de poser des questions, mais d’assigner des tâches complètes. Grâce à sa capacité de raisonnement, d’action et de production de livrables, OpenAI parie que les utilisateurs souhaitent de plus en plus que l’IA ne se contente pas de les assister, mais travaille véritablement pour eux.