A OpenAI deu um salto significativo em inteligência artificial com o lançamento do ChatGPT Agent, um sistema capaz de concluir tarefas complexas de forma independente, do início ao fim, utilizando seu próprio computador virtual.
O novo agente, anunciado em 17 de julho de 2025, representa uma abordagem unificada que combina três capacidades anteriormente separadas: a habilidade do Operator de interagir com sites clicando, rolando e digitando; a competência do deep research em sintetizar informações de toda a web; e a inteligência conversacional do ChatGPT. Essa integração resolve limitações de ferramentas anteriores, que funcionavam bem isoladamente, mas não conseguiam lidar com fluxos de trabalho de ponta a ponta.
Impulsionado pelo GPT-4o, o modelo multimodal de ponta da OpenAI, o ChatGPT Agent pode lidar com solicitações sofisticadas como "analise três concorrentes e crie uma apresentação de slides" ou "verifique minha agenda e me prepare para reuniões com clientes com base em notícias recentes". O sistema navega em sites tanto visual quanto textualmente, preenche formulários, acessa contas autorizadas com permissão do usuário, executa códigos e produz documentos editáveis, incluindo planilhas e apresentações.
Em testes de benchmark, o ChatGPT Agent supera significativamente as ferramentas anteriores da OpenAI. Em tarefas de modelagem de analista de banco de investimento, ele supera tanto o deep research quanto o modelo o3. No benchmark BrowseComp, para localizar informações difíceis de encontrar, atingiu um novo recorde de 68,9%, 17,4 pontos percentuais acima do deep research.
Apesar de seu poder, a OpenAI enfatiza que os usuários permanecem no controle. O agente solicita permissão antes de tomar ações relevantes, e os usuários podem interromper, assumir o navegador ou parar as tarefas a qualquer momento. A partir de hoje, usuários Pro, Plus e Team podem ativar essas capacidades através do menu de ferramentas, selecionando o 'modo agente' em qualquer conversa.
Esse lançamento marca a tentativa mais ousada da OpenAI de transformar o ChatGPT de uma ferramenta de perguntas e respostas em um produto agente capaz de tomar ações e delegar tarefas complexas para os usuários. Embora agentes de IA anteriores tenham tido dificuldades com tarefas complexas, a OpenAI afirma que o ChatGPT Agent é muito mais capaz do que as ofertas anteriores, com planos de melhorias regulares para torná-lo cada vez mais útil ao longo do tempo.