Google ha expandido significativamente su ecosistema de inteligencia artificial con varios lanzamientos importantes, posicionándose a la vanguardia de la tecnología generativa de IA.
La familia Gemini 2.5 ha crecido con los modelos Flash y Pro, que ahora están disponibles de manera general para uso en producción. Gemini 2.5 Flash y Pro ya son estables y están disponibles, permitiendo a los desarrolladores crear aplicaciones de producción con confianza. Empresas como Spline, Rooms, Snap y SmartBear ya han estado utilizando estas versiones en producción durante varias semanas. El crecimiento y la demanda de Gemini 2.5 Pro ha sido la más pronunciada de cualquier modelo de Google hasta la fecha, lo que llevó a la compañía a hacer estable la versión 06-05 manteniendo el mismo precio. Google espera que Pro sobresalga en escenarios que requieren la mayor inteligencia y capacidades, como tareas de programación y agentes autónomos.
Adicionalmente, Google ha presentado Gemini 2.5 Flash-Lite en vista previa, su modelo 2.5 más rápido y eficiente en costos hasta ahora. Esta nueva adición está diseñada como una opción rentable para tareas de alto volumen como clasificación o resumen a gran escala, ofreciendo mejor desempeño en la mayoría de las evaluaciones y menor tiempo hasta el primer token, además de lograr una mayor cantidad de tokens por segundo en decodificación. Flash-Lite es un modelo de razonamiento que permite el control dinámico del presupuesto de procesamiento a través de un parámetro en la API. A diferencia de otros modelos de la familia, el razonamiento está desactivado por defecto ya que Flash-Lite está optimizado para costo y velocidad. A pesar de esta optimización, sigue soportando todas las herramientas nativas, incluyendo Grounding con Google Search, ejecución de código, contexto de URL y llamadas a funciones.
En el ámbito de la generación de imágenes, Google ha lanzado Imagen 4, que fue anunciado por primera vez en I/O 2025 el mes pasado. Google lo describe como su "mejor modelo de texto a imagen hasta ahora", con una "representación de texto significativamente mejorada" respecto a modelos anteriores. El nuevo modelo ofrece una claridad notable en detalles finos como telas intrincadas, gotas de agua y pelaje de animales, y destaca tanto en estilos fotorrealistas como abstractos. Otras mejoras incluyen soporte para resolución 2K y mejor ortografía y tipografía. Imagen 4 y una versión premium Imagen 4 Ultra ya están disponibles para usuarios de vista previa de pago en la API de Gemini, con pruebas gratuitas limitadas en Google AI Studio. Imagen 4 tiene un costo de $0.04 dólares por imagen generada, mientras que la versión Ultra cuesta $0.06 dólares por imagen.
Complementando estos lanzamientos está Gemini CLI, un agente de IA de código abierto que lleva el poder de Gemini directamente a las terminales de los desarrolladores para programación, resolución de problemas y gestión de tareas. Los usuarios pueden acceder a Gemini 2.5 Pro de forma gratuita con una cuenta personal de Google, o utilizar claves de Google AI Studio o Vertex AI para un acceso ampliado. Gemini CLI ofrece la mayor cuota de uso de la industria, con 60 solicitudes de modelo por minuto y 1,000 solicitudes por día sin costo. Proporciona potentes capacidades de IA, desde comprensión de código y manipulación de archivos hasta ejecución de comandos y solución dinámica de problemas, ofreciendo una mejora fundamental en la experiencia de la línea de comandos y permitiendo a los usuarios escribir código, depurar problemas y optimizar flujos de trabajo usando lenguaje natural.
Estos lanzamientos en conjunto refuerzan la posición de Google en el competitivo panorama de la IA, proporcionando a desarrolladores y usuarios herramientas más potentes, eficientes y accesibles para una amplia gama de aplicaciones.