menu
close

Anthropic presenta Claude 4: Nuevos estándares en codificación de IA

Anthropic lanzó recientemente Claude Opus 4 y Claude Sonnet 4, estableciendo nuevos estándares en las capacidades de codificación y razonamiento de la inteligencia artificial. Claude Opus 4 lidera los benchmarks de la industria con un 72.5% en SWE-bench, mientras que Sonnet 4 ofrece un rendimiento superior a un precio más accesible. Ambos modelos cuentan con razonamiento híbrido, permitiéndoles alternar entre respuestas instantáneas y pensamiento extendido con integración de herramientas, mejorando significativamente su capacidad para manejar tareas complejas y de múltiples pasos.
Anthropic presenta Claude 4: Nuevos estándares en codificación de IA

Anthropic ha lanzado oficialmente sus modelos de IA de próxima generación, Claude Opus 4 y Claude Sonnet 4, marcando un avance significativo en las capacidades de la inteligencia artificial a partir del 22 de mayo de 2025.

Claude Opus 4, posicionado como el modelo insignia de Anthropic, ha sido denominado por la empresa como "el mejor modelo de codificación del mundo". Lidera en SWE-bench con una puntuación de 72.5% y en Terminal-bench con 43.2%, ofreciendo un rendimiento sostenido en tareas de larga duración que requieren esfuerzo enfocado a lo largo de miles de pasos. El modelo puede trabajar de manera continua durante varias horas, superando ampliamente a los modelos Sonnet anteriores y ampliando lo que los agentes de IA pueden lograr.

Claude Sonnet 4 representa una mejora significativa respecto a Claude Sonnet 3.7, ofreciendo mejores capacidades de codificación y razonamiento, además de responder de manera más precisa a las instrucciones. De manera interesante, alcanza un 72.7% en SWE-bench y, con cómputo paralelo en tiempo de prueba, llega a una precisión del 80.2%, superando en codificación incluso al modelo Opus 4 de mayor tamaño. Anthropic lo describe como un modelo que equilibra "rendimiento y eficiencia para casos de uso internos y externos, con mayor capacidad de direccionamiento para un mayor control en las implementaciones".

Ambos modelos introducen nuevas capacidades avanzadas, incluyendo pensamiento extendido con uso de herramientas, permitiendo que Claude alterne entre razonamiento y uso de herramientas para mejorar sus respuestas. Pueden utilizar herramientas en paralelo, seguir instrucciones con mayor precisión y, cuando los desarrolladores les dan acceso a archivos locales, demuestran una memoria significativamente mejorada, extrayendo y guardando datos clave para mantener la continuidad y construir conocimiento tácito con el tiempo.

Los modelos pueden extraer y guardar hechos en "memoria" para manejar tareas de manera más confiable, construyendo lo que Anthropic describe como "conocimiento tácito" a lo largo del tiempo. Tanto Opus 4 como Sonnet 4 son modelos "híbridos" capaces de respuestas casi instantáneas y pensamiento extendido para razonamiento más profundo. Con el modo de razonamiento activado, pueden tomarse más tiempo para considerar posibles soluciones antes de responder, mostrando un resumen "amigable para el usuario" de su proceso de pensamiento.

Ambos modelos están disponibles en la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. Los precios se mantienen consistentes con los modelos Opus y Sonnet anteriores: Opus 4 a $15/$75 por millón de tokens (entrada/salida) y Sonnet 4 a $3/$15.

Para usuarios individuales, Anthropic ofrece planes de suscripción escalonados. El plan gratuito proporciona acceso a Claude Sonnet 4 con límites diarios de uso, mientras que el plan Pro ($20/mes o $200/año) ofrece aproximadamente cinco veces más uso que el plan gratuito, acceso tanto a Claude 4 Sonnet como a Claude 4 Opus mediante un selector de modelos, y acceso prioritario durante periodos de alta demanda.

El lanzamiento de Claude 4 marca una nueva era en los modelos de lenguaje de gran escala. Estas ofertas representan un salto en lo que es posible para aplicaciones empresariales, de investigación y creativas, con una ventana de contexto de 200,000 tokens, benchmarks líderes en codificación y razonamiento, y un sólido marco de seguridad diseñado para escenarios complejos, críticos y en constante cambio del mundo real.

Source:

Latest News