A Anthropic revelou os seus modelos de IA de nova geração a 22 de maio de 2025, apresentando o Claude Opus 4 e o Claude Sonnet 4 com capacidades que ultrapassam os limites do que os sistemas de IA conseguem realizar sem intervenção humana.
O Claude Opus 4, que a Anthropic descreve como "o melhor modelo de programação do mundo", alcançou uma pontuação inovadora de 72,5% no SWE-bench, um rigoroso benchmark de engenharia de software que avalia o desempenho em tarefas de programação do mundo real. Durante testes na Rakuten, o modelo demonstrou uma resistência notável ao trabalhar de forma autónoma num projeto open-source complexo durante quase sete horas – um salto significativo face à atenção de apenas alguns minutos dos modelos de IA anteriores.
O Claude Sonnet 4, concebido como uma alternativa mais eficiente ao Opus 4, oferece capacidades superiores de programação e raciocínio em comparação com o seu antecessor, o Claude Sonnet 3.7. Surpreendentemente, obteve uma pontuação ainda mais elevada no SWE-bench, com 72,7%, superando concorrentes como o Codex-1 da OpenAI (72,1%) e o Gemini 2.5 Pro da Google (63,2%).
Ambos os modelos apresentam capacidades de raciocínio híbrido, permitindo alternar entre respostas quase instantâneas e períodos de reflexão prolongada para raciocínio mais profundo. Podem utilizar ferramentas como a pesquisa web durante o seu processo de análise e – quando têm acesso a ficheiros locais – conseguem extrair e guardar informações-chave para manter a continuidade e construir conhecimento ao longo do tempo.
Os novos modelos representam uma mudança de paradigma na funcionalidade da IA, transformando-se de simples chatbots em agentes de trabalho autónomos capazes de lidar com fluxos de trabalho complexos e multi-etapa ao longo de milhares de passos. Esta evolução permite à IA enfrentar projetos de um dia inteiro, desde a conceção até à conclusão, mantendo o contexto ao longo de todo o processo.
O Claude Sonnet 4 está disponível para todos os utilizadores do Claude, incluindo os do plano gratuito, enquanto o Claude Opus 4 está acessível apenas para subscritores dos planos Pro, Max, Team e Enterprise. Ambos os modelos estão também disponíveis através da API da Anthropic, Amazon Bedrock e Vertex AI da Google Cloud, com preços idênticos aos modelos anteriores: Opus 4 a $15/$75 por milhão de tokens (entrada/saída) e Sonnet 4 a $3/$15.