OpenAI совершила значительный прорыв в области искусственного интеллекта, запустив ChatGPT Agent — систему, способную самостоятельно выполнять сложные задачи от начала до конца с помощью собственного виртуального компьютера.
Новый агент, анонсированный 17 июля 2025 года, представляет собой объединённый подход, который сочетает три ранее отдельных возможности: умение Operator взаимодействовать с веб-сайтами путём кликов, прокрутки и ввода текста; способность deep research синтезировать информацию из различных источников в интернете; и разговорный интеллект ChatGPT. Такая интеграция решает ограничения предыдущих инструментов, которые хорошо работали по отдельности, но не справлялись с полными рабочими процессами.
Работая на базе GPT-4o — флагманской мультимодальной модели OpenAI, ChatGPT Agent способен выполнять сложные запросы, такие как «проанализируй трёх конкурентов и создай презентацию» или «посмотри мой календарь и подготовь бриф по предстоящим встречам с клиентами на основе последних новостей». Система осуществляет навигацию по сайтам как визуально, так и текстово, заполняет формы, получает доступ к авторизованным аккаунтам с разрешения пользователя, выполняет код и создаёт редактируемые документы, включая таблицы и презентации.
В тестах производительности ChatGPT Agent значительно превосходит предыдущие инструменты OpenAI. В задачах моделирования для инвестиционных аналитиков он обходит как deep research, так и модель o3. В бенчмарке BrowseComp по поиску труднодоступной информации агент достиг нового рекордного результата — 68,9%, что на 17,4 процентных пункта выше, чем у deep research.
Несмотря на мощные возможности, OpenAI подчёркивает, что контроль остаётся за пользователем. Агент запрашивает разрешение перед выполнением важных действий, а пользователь может в любой момент прервать выполнение задачи, взять управление браузером или остановить процесс. Уже сегодня пользователи тарифов Pro, Plus и Team могут активировать эти возможности через выпадающее меню инструментов, выбрав «режим агента» в любом чате.
Этот запуск — самая смелая попытка OpenAI превратить ChatGPT из инструмента для ответов на вопросы в агентный продукт, способный выполнять действия и брать на себя сложные задачи пользователей. Несмотря на то, что ранние ИИ-агенты испытывали трудности с комплексными задачами, OpenAI утверждает, что ChatGPT Agent значительно превосходит предыдущие решения, а регулярные обновления будут делать его всё более полезным со временем.