menu
close

OpenAI unifica herramientas de IA con ChatGPT Agent para tareas autónomas

El 17 de julio de 2025, OpenAI lanzó ChatGPT Agent, un sistema agente unificado que combina las capacidades de navegación web de Operator, la fortaleza analítica de deep research y la inteligencia conversacional de ChatGPT. Esta potente herramienta permite a los usuarios delegar tareas complejas como el análisis de la competencia, la preparación de reuniones y la planificación de viajes, permitiendo que ChatGPT utilice su propio ordenador virtual para navegar por sitios web, analizar información y entregar documentos editables. Aunque aún se encuentra en fases iniciales, este lanzamiento representa el esfuerzo más ambicioso de OpenAI para transformar ChatGPT de una herramienta de preguntas y respuestas en un asistente digital autónomo.
OpenAI unifica herramientas de IA con ChatGPT Agent para tareas autónomas

OpenAI ha dado un salto significativo en inteligencia artificial con el lanzamiento de ChatGPT Agent, un sistema capaz de completar de forma independiente tareas complejas de principio a fin utilizando su propio ordenador virtual.

El nuevo agente, anunciado el 17 de julio de 2025, representa un enfoque unificado que combina tres capacidades previamente separadas: la habilidad de Operator para interactuar con sitios web haciendo clic, desplazándose y escribiendo; la destreza de deep research para sintetizar información de toda la web; y la inteligencia conversacional de ChatGPT. Esta integración resuelve las limitaciones de herramientas anteriores que funcionaban bien de forma aislada, pero no podían gestionar flujos de trabajo de principio a fin.

Impulsado por GPT-4o, el modelo multimodal insignia de OpenAI, ChatGPT Agent puede gestionar solicitudes sofisticadas como "analiza tres competidores y crea una presentación" o "revisa mi calendario e infórmame sobre próximas reuniones con clientes en función de noticias recientes". El sistema navega por sitios web tanto de forma visual como textual, completa formularios, accede a cuentas autorizadas con permiso del usuario, ejecuta código y produce documentos editables, incluyendo hojas de cálculo y presentaciones.

En pruebas de referencia, ChatGPT Agent supera significativamente a las herramientas anteriores de OpenAI. En tareas de modelado de analistas de banca de inversión, supera tanto a deep research como al modelo o3. En el benchmark BrowseComp para localizar información difícil de encontrar, logró una nueva puntuación récord del 68,9 %, 17,4 puntos porcentuales por encima de deep research.

Aunque es una herramienta potente, OpenAI recalca que los usuarios mantienen el control. El agente solicita permiso antes de realizar acciones relevantes, y los usuarios pueden interrumpir, tomar el control del navegador o detener tareas en cualquier momento. Desde hoy, los usuarios de Pro, Plus y Team pueden activar estas capacidades desde el menú de herramientas seleccionando el 'modo agente' en cualquier conversación.

Este lanzamiento supone el intento más audaz de OpenAI hasta la fecha para transformar ChatGPT de una herramienta de preguntas y respuestas en un producto agente capaz de ejecutar acciones y delegar tareas complejas para los usuarios. Aunque los primeros agentes de IA han tenido dificultades con tareas complejas, OpenAI afirma que ChatGPT Agent es mucho más capaz que las ofertas anteriores, y prevé mejoras regulares para hacerlo cada vez más útil con el tiempo.

Source:

Latest News