Google ha lanzado una versión preliminar de Gemini 2.5 Flash, la última iteración de su modelo de IA eficiente diseñado para equilibrar el rendimiento con la velocidad y la rentabilidad.
Sobre la base de Gemini 2.0 Flash, el nuevo modelo 2.5 Flash ofrece una mejora importante en las capacidades de razonamiento, manteniendo su reputación de eficiencia. Google lo describe como "una mejora importante en las capacidades de razonamiento, sin dejar de priorizar la velocidad y el costo".
La característica más destacada de Gemini 2.5 Flash es su sistema de razonamiento híbrido. Es el "primer modelo de razonamiento totalmente híbrido de Google, que permite a los desarrolladores activar o desactivar el razonamiento y establecer presupuestos de pensamiento para optimizar el equilibrio entre calidad, costo y latencia". Este enfoque innovador otorga a los desarrolladores un control sin precedentes sobre cómo el modelo procesa tareas complejas.
En la práctica, esto significa que los desarrolladores pueden especificar un "presupuesto de pensamiento" que controla cuánto razonamiento realiza el modelo. Pueden ajustar "la cantidad de tokens que el modelo puede generar mientras razona" de 0 a 24,576 tokens usando un control deslizante en Google AI Studio y Vertex AI, o mediante un parámetro en la API. Cuando el presupuesto de pensamiento se establece en cero, el modelo iguala el costo y la latencia de Gemini 2.0 Flash.
La estructura de precios refleja esta flexibilidad, con tokens de entrada que cuestan 15 centavos por millón y tokens de salida 60 centavos por millón sin razonamiento. Con las capacidades de razonamiento activadas, el costo aumenta a $3.50 por millón de tokens.
Las pruebas de referencia muestran resultados impresionantes. Gemini 2.5 Flash "tiene un rendimiento sobresaliente en Hard Prompts en LMArena, solo superado por 2.5 Pro" y "presenta métricas comparables a otros modelos líderes por una fracción del costo y tamaño", continuando "como el modelo con la mejor relación precio-rendimiento".
Google describe 2.5 Flash como su "modelo de trabajo más eficiente diseñado para velocidad y bajo costo", señalando que "ha mejorado en puntos clave de referencia para razonamiento, multimodalidad, código y contexto largo, siendo aún más eficiente, usando entre 20 y 30% menos tokens" en las evaluaciones.
El nuevo modelo está disponible actualmente en modo de vista previa a través de múltiples canales. Se está implementando "en Google AI Studio (desarrolladores), Vertex AI (empresas) y la app de Gemini (para todos)". Según los anuncios de Google en I/O 2025, la versión actualizada estará "disponible de manera general en Google AI Studio para desarrolladores y en Vertex AI para empresas a principios de junio", con Gemini 2.5 Pro disponible "poco después".
A medida que Google continúa expandiendo sus capacidades de IA, Gemini 2.5 Flash representa un avance significativo para hacer que el razonamiento avanzado sea más accesible y rentable tanto para desarrolladores como para usuarios.