A Anthropic lançou oficialmente seus modelos de IA de próxima geração — Claude Opus 4 e Claude Sonnet 4 — marcando um avanço significativo nas capacidades de inteligência artificial e operação autônoma.
O Claude Opus 4, posicionado como o principal modelo de codificação do mundo, atinge 72,5% de desempenho no SWE-bench e 43,2% no Terminal-bench, superando concorrentes como OpenAI e Google. Seu recurso mais impressionante é a capacidade de trabalhar de forma autônoma por quase sete horas em tarefas complexas, mantendo o foco ao longo de milhares de etapas — uma habilidade inédita em modelos anteriores de IA.
“Claude Opus 4 oferece raciocínio realmente avançado para codificação. Quando nossa equipe o utilizou em um projeto open source complexo, ele codificou de forma autônoma por quase sete horas — um salto enorme nas capacidades de IA que deixou a equipe impressionada”, comentou um dos primeiros testadores da Rakuten.
O Claude Sonnet 4, projetado como uma opção mais econômica, melhora significativamente em relação ao seu antecessor, Claude Sonnet 3.7, com habilidades de codificação aprimoradas, melhor seguimento de instruções e menor propensão a atalhos — tornando-o 65% menos propenso a usar brechas ao concluir tarefas.
Ambos os modelos apresentam várias capacidades inovadoras. Eles contam com uma arquitetura híbrida que suporta tanto respostas quase instantâneas quanto modos de raciocínio estendido para análises mais profundas. Um novo recurso beta chamado “raciocínio estendido com uso de ferramentas” permite que os modelos alternem entre raciocinar e utilizar ferramentas externas, como busca na web, para melhorar as respostas. Quando têm acesso a arquivos locais, podem extrair e salvar informações-chave, construindo o que a Anthropic chama de “conhecimento tácito” ao longo do tempo.
Junto com os modelos, a Anthropic tornou o Claude Code disponível de forma geral, com integrações para VS Code, JetBrains e GitHub, permitindo programação em dupla de maneira fluida. A empresa também apresentou quatro novas capacidades de API: uma ferramenta de execução de código, um conector MCP, uma API de arquivos e cache de prompts por até uma hora.
Ambos os modelos estão disponíveis imediatamente na API da Anthropic, Amazon Bedrock e Vertex AI do Google Cloud. Os preços permanecem consistentes com as gerações anteriores: Opus 4 a US$ 15/US$ 75 por milhão de tokens (entrada/saída) e Sonnet 4 a US$ 3/US$ 15. O Claude Sonnet 4 está disponível para todos os usuários, inclusive nos planos gratuitos, enquanto o Opus 4 é restrito aos usuários Pro, Max, Team e Enterprise.
Com esses avanços, a Anthropic elevou significativamente o padrão do que assistentes de IA podem realizar de forma autônoma, potencialmente transformando a maneira como desenvolvedores, pesquisadores e empresas utilizam inteligência artificial para fluxos de trabalho complexos e de múltiplas etapas.