Anthropic ha alcanzado un hito significativo en el desarrollo de inteligencia artificial con su modelo Claude 4 Opus, que ha demostrado habilidades de programación equiparables a las de programadores humanos experimentados.
Lanzado en mayo de 2025, Claude 4 Opus se ha consolidado como el modelo de IA líder en programación, logrando una puntuación récord del 72,5% en SWE-bench, una exigente prueba de referencia en ingeniería de software que evalúa el rendimiento ante problemas reales de GitHub. Esto supone una mejora sustancial respecto a GPT-4.1 de OpenAI, que obtuvo un 54,6% en la misma prueba.
Lo que distingue a Claude 4 Opus es su capacidad sin precedentes para mantener la concentración y el contexto durante largos periodos de tiempo. En pruebas realizadas en Rakuten, el modelo trabajó de forma autónoma en un complejo proyecto de refactorización de código abierto durante casi siete horas sin perder coherencia ni atención, transformando así la IA de una herramienta de respuesta rápida a un colaborador genuino para proyectos de jornada completa.
Con una ventana de contexto de 200.000 tokens, Claude 4 Opus puede procesar bases de código empresariales completas, gestionar cambios complejos en múltiples archivos y adaptarse a estilos de programación específicos, ofreciendo una calidad excepcional en proyectos extensos de generación y refactorización. Según los comentarios de desarrolladores, el modelo demuestra habilidades equivalentes a las de un programador informático con doctorado y experiencia profesional.
Este avance representa algo más que un progreso técnico: señala un cambio fundamental en la forma en que las organizaciones abordan el trabajo del conocimiento. Tareas que antes requerían atención humana continua pueden ahora delegarse en sistemas de IA capaces de mantener el enfoque y el contexto durante horas o incluso días. Las implicaciones económicas son significativas, especialmente porque los analistas del sector prevén que 2025 será el año en que los puestos operativos de atención al cliente de nivel inicial en los sectores sanitario, financiero y legal comenzarán a experimentar una sustitución laboral sustancial.
Aunque Claude 4 Opus destaca en programación, también demuestra sólidas capacidades en investigación, redacción y descubrimiento científico. El modelo está disponible a través de varios canales, incluyendo la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud, con precios a partir de 15 dólares por millón de tokens de entrada y 75 dólares por millón de tokens de salida.
A medida que sistemas de IA como Claude 4 Opus continúan evolucionando, el reto para las organizaciones ya no es preguntarse si la IA puede igualar las habilidades humanas, sino adaptarse a un futuro en el que nuestros colaboradores más productivos podrían ser cada vez más digitales en lugar de humanos.