OpenAI ha dado un salto significativo en inteligencia artificial con el lanzamiento de ChatGPT Agent, un sistema capaz de completar de forma independiente tareas complejas de principio a fin utilizando su propio ordenador virtual.
El nuevo agente, anunciado el 17 de julio de 2025, representa un enfoque unificado que combina tres capacidades previamente separadas: la habilidad de Operator para interactuar con sitios web haciendo clic, desplazándose y escribiendo; la destreza de deep research para sintetizar información de toda la web; y la inteligencia conversacional de ChatGPT. Esta integración resuelve las limitaciones de herramientas anteriores que funcionaban bien de forma aislada, pero no podían gestionar flujos de trabajo de principio a fin.
Impulsado por GPT-4o, el modelo multimodal insignia de OpenAI, ChatGPT Agent puede gestionar solicitudes sofisticadas como "analiza tres competidores y crea una presentación" o "revisa mi calendario e infórmame sobre próximas reuniones con clientes en función de noticias recientes". El sistema navega por sitios web tanto de forma visual como textual, completa formularios, accede a cuentas autorizadas con permiso del usuario, ejecuta código y produce documentos editables, incluyendo hojas de cálculo y presentaciones.
En pruebas de referencia, ChatGPT Agent supera significativamente a las herramientas anteriores de OpenAI. En tareas de modelado de analistas de banca de inversión, supera tanto a deep research como al modelo o3. En el benchmark BrowseComp para localizar información difícil de encontrar, logró una nueva puntuación récord del 68,9 %, 17,4 puntos porcentuales por encima de deep research.
Aunque es una herramienta potente, OpenAI recalca que los usuarios mantienen el control. El agente solicita permiso antes de realizar acciones relevantes, y los usuarios pueden interrumpir, tomar el control del navegador o detener tareas en cualquier momento. Desde hoy, los usuarios de Pro, Plus y Team pueden activar estas capacidades desde el menú de herramientas seleccionando el 'modo agente' en cualquier conversación.
Este lanzamiento supone el intento más audaz de OpenAI hasta la fecha para transformar ChatGPT de una herramienta de preguntas y respuestas en un producto agente capaz de ejecutar acciones y delegar tareas complejas para los usuarios. Aunque los primeros agentes de IA han tenido dificultades con tareas complejas, OpenAI afirma que ChatGPT Agent es mucho más capaz que las ofertas anteriores, y prevé mejoras regulares para hacerlo cada vez más útil con el tiempo.