menu
close

Google presenta Gemini 2.5 Flash con capacidades avanzadas de razonamiento

Google ha lanzado Gemini 2.5 Flash en modo de vista previa, aportando mejoras significativas a su modelo de IA rápido y rentable. Esta nueva versión introduce capacidades de razonamiento híbrido que permiten a los desarrolladores controlar el proceso de pensamiento del modelo sin sacrificar velocidad ni eficiencia. La vista previa ya está disponible en Google AI Studio, Vertex AI y la app de Gemini, con disponibilidad general prevista para principios de junio de 2025.
Google presenta Gemini 2.5 Flash con capacidades avanzadas de razonamiento

Google ha lanzado una versión preliminar de Gemini 2.5 Flash, la última iteración de su modelo de IA eficiente diseñado para equilibrar el rendimiento con la velocidad y la rentabilidad.

Sobre la base de Gemini 2.0 Flash, el nuevo modelo 2.5 Flash ofrece una mejora importante en las capacidades de razonamiento manteniendo su reputación de eficiencia. Google lo describe como "una mejora significativa en las capacidades de razonamiento, sin dejar de priorizar la velocidad y el coste".

La característica más destacada de Gemini 2.5 Flash es su sistema de razonamiento híbrido. Es el "primer modelo de razonamiento totalmente híbrido de Google, que permite a los desarrolladores activar o desactivar el razonamiento, y establecer presupuestos de razonamiento para optimizar el equilibrio entre calidad, coste y latencia". Este enfoque innovador otorga a los desarrolladores un control sin precedentes sobre cómo el modelo procesa tareas complejas.

En la práctica, esto significa que los desarrolladores pueden especificar un "presupuesto de razonamiento" que controla cuánto razonamiento realiza el modelo. Pueden ajustar "el número de tokens que el modelo puede generar mientras razona" desde 0 hasta 24.576 tokens mediante un control deslizante en Google AI Studio y Vertex AI, o a través de un parámetro en la API. Cuando el presupuesto de razonamiento se establece en cero, el modelo iguala el coste y la latencia de Gemini 2.0 Flash.

La estructura de precios refleja esta flexibilidad: los tokens de entrada cuestan 15 céntimos por millón y los tokens de salida 60 céntimos por millón sin razonamiento. Con las capacidades de razonamiento activadas, el coste aumenta a 3,50 dólares por millón de tokens.

Las pruebas de referencia muestran resultados impresionantes. Gemini 2.5 Flash "destaca en Hard Prompts en LMArena, solo superado por 2.5 Pro" y "presenta métricas comparables a otros modelos líderes por una fracción del coste y tamaño", manteniéndose "como el modelo con la mejor relación calidad-precio".

Google describe 2.5 Flash como su "modelo de trabajo más eficiente, diseñado para la velocidad y el bajo coste", señalando que ha "mejorado en los principales benchmarks de razonamiento, multimodalidad, código y contexto largo, siendo aún más eficiente y utilizando entre un 20 y un 30% menos de tokens" en las evaluaciones.

El nuevo modelo está disponible actualmente en modo de vista previa a través de varios canales. Se está desplegando "en Google AI Studio (desarrolladores), Vertex AI (empresas) y la app de Gemini (para todos)". Según los anuncios de Google en I/O 2025, la versión actualizada estará "disponible de forma general en Google AI Studio para desarrolladores y en Vertex AI para empresas a principios de junio", y Gemini 2.5 Pro llegará "poco después".

A medida que Google sigue ampliando sus capacidades de IA, Gemini 2.5 Flash representa un avance significativo para hacer que el razonamiento avanzado sea más accesible y rentable tanto para desarrolladores como para usuarios.

Source:

Latest News