OpenAI a franchi une étape majeure en intelligence artificielle avec le lancement de ChatGPT Agent, un système capable de réaliser de façon autonome des tâches complexes de bout en bout grâce à son propre ordinateur virtuel.
Le nouvel agent, annoncé le 17 juillet 2025, adopte une approche unifiée qui combine trois capacités auparavant distinctes : la faculté d’Operator d’interagir avec des sites web en cliquant, faisant défiler et saisissant du texte ; l’aptitude de deep research à synthétiser l’information provenant de l’ensemble du web ; et l’intelligence conversationnelle de ChatGPT. Cette intégration répond aux limites des outils précédents, qui fonctionnaient bien isolément mais ne pouvaient pas gérer des flux de travail complets.
Propulsé par GPT-4o, le modèle multimodal phare d’OpenAI, ChatGPT Agent peut traiter des demandes sophistiquées telles que « analyser trois concurrents et créer une présentation » ou « consulter mon calendrier et me faire un compte rendu des prochaines réunions clients à partir des actualités récentes ». Le système navigue sur les sites web de façon visuelle et textuelle, remplit des formulaires, accède à des comptes autorisés avec la permission de l’utilisateur, exécute du code et produit des documents modifiables, y compris des feuilles de calcul et des présentations.
Lors de tests comparatifs, ChatGPT Agent surpasse nettement les outils précédents d’OpenAI. Sur des tâches de modélisation d’analyste en banque d’investissement, il dépasse à la fois deep research et le modèle o3. Sur le benchmark BrowseComp visant à trouver des informations difficiles à localiser, il a atteint un nouveau sommet avec un score de 68,9 %, soit 17,4 points de pourcentage de plus que deep research.
Bien que puissant, OpenAI souligne que les utilisateurs gardent le contrôle. L’agent demande la permission avant d’effectuer des actions importantes, et les utilisateurs peuvent interrompre, prendre le contrôle du navigateur ou arrêter les tâches à tout moment. Dès aujourd’hui, les utilisateurs Pro, Plus et Équipe peuvent activer ces fonctionnalités via le menu déroulant des outils en sélectionnant le « mode agent » dans toute conversation.
Ce lancement marque la tentative la plus audacieuse d’OpenAI à ce jour pour transformer ChatGPT d’un outil de questions-réponses en un produit agentique capable d’agir et de déléguer des tâches complexes pour les utilisateurs. Alors que les premiers agents d’IA avaient du mal avec les tâches complexes, OpenAI affirme que ChatGPT Agent est nettement plus performant que les offres précédentes, avec des plans d’amélioration régulière pour le rendre de plus en plus utile au fil du temps.