Operator, l’agent IA véritablement autonome d’OpenAI capable d’exécuter de manière indépendante des tâches en ligne, a bénéficié d’une mise à niveau majeure en mai 2025 lorsque la société a remplacé sa base GPT-4o par le modèle de raisonnement o3, plus avancé.
Lancé en janvier 2025 sous forme d’aperçu de recherche, Operator représente une avancée majeure dans la technologie des agents IA. L’assistant fonctionne via son propre navigateur dédié, lui permettant d’interagir avec les sites web en cliquant, tapant et naviguant comme le ferait un humain. Cela permet aux utilisateurs de déléguer des tâches répétitives en ligne telles que la réservation d’hébergements, la réservation de restaurants, la commande de courses ou le remplissage de formulaires.
La mise à niveau vers le modèle o3 en mai a considérablement renforcé les capacités d’Operator. Selon les évaluations d’OpenAI, la version propulsée par o3 fait preuve d’une bien meilleure persévérance et précision lors des interactions avec le navigateur, avec des améliorations notables sur plusieurs indicateurs de performance. Sur le benchmark OSWorld mesurant l’accomplissement de tâches en ligne, le modèle o3 a obtenu un score de 42,9 contre 38,1 pour la version précédente, tandis que sur WebArena, il a atteint 62,9, contre 48,1 auparavant.
La sécurité demeure une priorité centrale pour OpenAI avec cet agent puissant. Operator adopte une approche de sécurité en trois couches, comprenant des garde-fous au niveau du modèle, une surveillance en temps réel et des mécanismes de contrôle utilisateur. Le système est conçu pour demander à l’utilisateur de reprendre la main pour des actions sensibles comme la saisie d’identifiants ou d’informations de paiement. Il maintient également des restrictions sur les interactions à haut risque avec des plateformes telles que les services de messagerie ou financiers.
Actuellement, Operator est disponible pour les abonnés ChatGPT Pro aux États-Unis pour 200 $ par mois, avec des plans d’extension vers les offres Plus, Team et Enterprise. Bien que la disponibilité européenne ait été retardée en raison de considérations réglementaires, OpenAI a indiqué qu’une expansion internationale était prévue.
La dernière mise à jour de juin du modèle o3-pro, le plus performant d’OpenAI à ce jour, laisse présager de nouvelles améliorations à venir pour Operator. Alors que le paysage des agents IA devient de plus en plus concurrentiel avec les offres de Google, Anthropic et d’autres acteurs, OpenAI continue de positionner Operator comme une solution de référence pour l’automatisation des tâches numériques quotidiennes tout en maintenant des garde-fous de sécurité essentiels.