Anthropic ha lanzado oficialmente sus modelos de IA de nueva generación—Claude Opus 4 y Claude Sonnet 4—marcando un avance significativo en las capacidades de inteligencia artificial y operación autónoma.
Claude Opus 4, posicionado como el modelo líder mundial en programación, alcanza un rendimiento del 72,5% en SWE-bench y del 43,2% en Terminal-bench, superando a competidores como OpenAI y Google. Su característica más destacada es la capacidad de trabajar de forma autónoma durante casi siete horas en tareas complejas, manteniendo la concentración a lo largo de miles de pasos—una capacidad que ningún modelo anterior había demostrado.
"Claude Opus 4 ofrece un razonamiento realmente avanzado para la programación. Cuando nuestro equipo lo probó en un proyecto de código abierto complejo, programó de forma autónoma durante casi siete horas—un salto enorme en las capacidades de la IA que dejó al equipo asombrado", señaló un probador inicial de Rakuten.
Claude Sonnet 4, concebido como una opción más económica, mejora notablemente a su predecesor, Claude Sonnet 3.7, con habilidades de programación mejoradas, mejor seguimiento de instrucciones y una menor tendencia a buscar atajos—siendo un 65% menos propenso a utilizar lagunas o trampas al completar tareas.
Ambos modelos introducen varias capacidades revolucionarias. Incorporan una arquitectura híbrida que permite tanto respuestas casi instantáneas como modos de pensamiento extendido para razonamientos más profundos. Una nueva función beta llamada "pensamiento extendido con uso de herramientas" permite a los modelos alternar entre el razonamiento y el uso de herramientas externas, como la búsqueda web, para mejorar las respuestas. Cuando se les da acceso a archivos locales, pueden extraer y guardar información clave, construyendo lo que Anthropic denomina "conocimiento tácito" con el tiempo.
Junto a los modelos, Anthropic ha puesto Claude Code a disposición general con integraciones para VS Code, JetBrains y GitHub, permitiendo programación en pareja de forma fluida. La empresa también ha presentado cuatro nuevas capacidades de API: una herramienta de ejecución de código, un conector MCP, una API de archivos y almacenamiento en caché de prompts hasta una hora.
Ambos modelos están disponibles de inmediato en la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. Los precios se mantienen respecto a generaciones anteriores: Opus 4 a 15$/75$ por millón de tokens (entrada/salida) y Sonnet 4 a 3$/15$. Claude Sonnet 4 está disponible para todos los usuarios, incluidos los de planes gratuitos, mientras que Opus 4 se limita a usuarios Pro, Max, Team y Enterprise.
Con estos avances, Anthropic eleva considerablemente el listón de lo que los asistentes de IA pueden lograr de forma autónoma, con el potencial de transformar la manera en que desarrolladores, investigadores y empresas aprovechan la inteligencia artificial para flujos de trabajo complejos y de múltiples pasos.