A Anthropic alcançou um marco significativo no desenvolvimento de inteligência artificial com o seu modelo Claude 4 Opus, que demonstra capacidades de programação ao nível de programadores humanos experientes.
Lançado em maio de 2025, o Claude 4 Opus afirmou-se como o modelo de IA líder em programação, atingindo um recorde de 72,5% no SWE-bench, um rigoroso benchmark de engenharia de software que avalia o desempenho em problemas reais do GitHub. Este resultado supera largamente o GPT-4.1 da OpenAI, que obteve 54,6% no mesmo teste.
O que distingue o Claude 4 Opus é a sua capacidade inédita de manter o foco e o contexto durante longos períodos. Em testes realizados na Rakuten, o modelo trabalhou autonomamente num complexo projeto de refatoração open-source durante quase sete horas sem perder concentração ou coerência — uma capacidade que transforma a IA de uma ferramenta de resposta rápida para um verdadeiro colaborador em projetos de longa duração.
Com uma janela de contexto de 200.000 tokens, o Claude 4 Opus consegue processar bases de código empresariais completas, navegar por alterações complexas em múltiplos ficheiros e adaptar-se a estilos de programação específicos, mantendo uma qualidade excecional em projetos extensos de geração e refatoração de código. Segundo feedback de programadores, o modelo demonstra competências equivalentes às de um programador de informática doutorado com experiência intermédia.
Este avanço representa mais do que progresso técnico — sinaliza uma mudança fundamental na forma como as organizações abordam o trabalho de conhecimento. Tarefas que antes exigiam atenção humana contínua podem agora ser delegadas a sistemas de IA capazes de manter o foco e o contexto durante horas ou até dias. As implicações económicas são significativas, especialmente numa altura em que analistas do setor preveem que 2025 será o ano em que funções operacionais de atendimento ao cliente de entrada nos setores da saúde, finanças e jurídico começarão a sofrer uma substituição substancial por IA.
Embora o Claude 4 Opus se destaque na programação, também demonstra fortes capacidades em investigação, redação e descoberta científica. O modelo está disponível através de vários canais, incluindo a API da Anthropic, Amazon Bedrock e Vertex AI da Google Cloud, com preços a partir de 15 dólares por milhão de tokens de entrada e 75 dólares por milhão de tokens de saída.
À medida que sistemas de IA como o Claude 4 Opus continuam a evoluir, o desafio para as organizações deixa de ser questionar se a IA pode igualar as competências humanas, passando a ser a adaptação a um futuro em que os nossos colaboradores mais produtivos poderão ser cada vez mais digitais e não humanos.