OpenAI a franchi une étape majeure dans l’intelligence artificielle avec le lancement de ChatGPT Agent, un système capable d’accomplir de manière autonome des tâches complexes de bout en bout grâce à son propre ordinateur virtuel.
Le nouvel agent, annoncé le 17 juillet 2025, incarne une approche unifiée qui combine trois fonctionnalités auparavant distinctes : la capacité d’Operator à interagir avec les sites web en cliquant, faisant défiler et saisissant du texte ; l’expertise de deep research dans la synthèse d’informations issues du web ; et l’intelligence conversationnelle de ChatGPT. Cette intégration répond aux limites des outils précédents, efficaces isolément mais incapables de gérer des flux de travail complets.
Propulsé par GPT-4o, le modèle multimodal phare d’OpenAI, ChatGPT Agent peut traiter des demandes sophistiquées telles que « analyser trois concurrents et créer une présentation » ou « consulter mon agenda et me faire un briefing sur les prochaines réunions clients à partir des actualités récentes ». Le système navigue sur les sites web à la fois visuellement et textuellement, remplit des formulaires, accède à des comptes autorisés avec l’accord de l’utilisateur, exécute du code et produit des documents modifiables, y compris des feuilles de calcul et des présentations.
Lors de tests de référence, ChatGPT Agent surpasse nettement les outils précédents d’OpenAI. Sur des tâches de modélisation d’analyste en banque d’investissement, il dépasse à la fois deep research et le modèle o3. Sur le benchmark BrowseComp, destiné à trouver des informations difficiles à localiser, il a atteint un nouveau record avec un score de 68,9 %, soit 17,4 points de plus que deep research.
Malgré sa puissance, OpenAI insiste sur le fait que l’utilisateur reste maître du processus. L’agent demande une autorisation avant toute action conséquente, et l’utilisateur peut interrompre, reprendre la main sur le navigateur ou stopper les tâches à tout moment. Dès aujourd’hui, les utilisateurs Pro, Plus et Team peuvent activer ces fonctionnalités via le menu déroulant des outils en sélectionnant le « mode agent » dans n’importe quelle conversation.
Ce lancement marque la tentative la plus audacieuse d’OpenAI pour transformer ChatGPT d’un simple outil de questions-réponses en un produit agentique capable d’agir et de prendre en charge des tâches complexes pour les utilisateurs. Alors que les premiers agents d’IA peinaient à gérer la complexité, OpenAI affirme que ChatGPT Agent est bien plus performant que les offres précédentes, avec des améliorations régulières prévues pour le rendre toujours plus utile au fil du temps.