Anthropic presentó sus modelos de IA de nueva generación, Claude Opus 4 y Claude Sonnet 4, durante su conferencia para desarrolladores 'Code with Claude 2025' el 22 de mayo. Estos modelos representan el mayor avance técnico de la compañía hasta la fecha, especialmente en ingeniería de software y capacidades de agentes autónomos.
Claude Opus 4, presentado como "el mejor modelo de programación del mundo", obtuvo una puntuación del 72,5% en el benchmark de programación SWE-bench, superando a GPT-4.1 de OpenAI (54,6%) y a Gemini 2.5 Pro de Google. En pruebas realizadas en Rakuten, Opus 4 demostró ser capaz de programar de forma autónoma durante casi siete horas, un salto espectacular respecto a la limitada capacidad de atención de minutos de los modelos anteriores de IA.
Ambos modelos incorporan sistemas de razonamiento híbrido que permiten respuestas casi instantáneas o procesos de pensamiento extendidos paso a paso. Son capaces de utilizar múltiples herramientas en paralelo, incluida la búsqueda web, y, cuando se les concede acceso a archivos locales, pueden extraer y almacenar información clave para construir lo que Anthropic denomina "conocimiento tácito" con el tiempo.
Claude Sonnet 4, que mejora la versión Sonnet 3.7 lanzada en febrero, ofrece mayores capacidades de resolución de problemas y un seguimiento de instrucciones superior. Está disponible para todos los usuarios de Claude, incluidos los de la versión gratuita, mientras que Opus 4 está restringido a los planes Pro, Max, Team y Enterprise.
El lanzamiento coincide con un rápido crecimiento de Anthropic, que ha duplicado sus ingresos anualizados hasta alcanzar los 2.000 millones de dólares en el primer trimestre de 2025 y ha multiplicado por ocho el número de clientes que gastan más de 100.000 dólares al año. La empresa ha asegurado recientemente una línea de crédito de 2.500 millones de dólares para impulsar el desarrollo de su IA.
A pesar de los logros técnicos, Anthropic ha implementado estrictas medidas de seguridad para Claude Opus 4, clasificándolo bajo su protocolo de Nivel de Seguridad de IA 3 (ASL-3) tras detectar posibles riesgos en pruebas internas. Ambos modelos están disponibles a través de la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud, con precios fijados en 15/75 dólares por millón de tokens para Opus 4 y 3/15 dólares para Sonnet 4.