menu
close

Google presenta Imagen 4 y amplía la familia Gemini 2.5

Google ha lanzado Imagen 4, su modelo de generación de imágenes a partir de texto más avanzado hasta la fecha, disponible ahora en vista previa de pago a través de la API de Gemini y Google AI Studio. Este lanzamiento coincide con la disponibilidad general de los modelos Gemini 2.5 Flash y Pro, junto con la introducción de Gemini 2.5 Flash-Lite, el modelo más rápido y rentable de la familia 2.5. Los desarrolladores también pueden acceder a Gemini directamente desde su terminal gracias al nuevo Gemini CLI de código abierto.
Google presenta Imagen 4 y amplía la familia Gemini 2.5

Google ha ampliado significativamente sus capacidades de inteligencia artificial con el lanzamiento de Imagen 4, su modelo más avanzado de generación de imágenes a partir de texto, disponible ahora en vista previa de pago a través de la API de Gemini y Google AI Studio.

Imagen 4 representa una mejora sustancial respecto a versiones anteriores, especialmente en la calidad del renderizado de texto dentro de las imágenes generadas. El lanzamiento incluye dos variantes: el modelo estándar de Imagen 4, con un precio de $0.04 USD por imagen generada, e Imagen 4 Ultra, a $0.06 USD por imagen, que ofrece mayor precisión al seguir las instrucciones del usuario. Ambos modelos incorporan la tecnología de marca de agua SynthID, invisible para el ojo humano pero que ayuda a identificar contenido generado por IA.

Este lanzamiento forma parte de la expansión de la familia de modelos Gemini 2.5 de Google. La compañía ha puesto a disposición general los modelos Gemini 2.5 Flash y Pro tras exitosos periodos de prueba, e introdujo Gemini 2.5 Flash-Lite en vista previa. Flash-Lite se posiciona como el modelo 2.5 más rápido y rentable de Google, optimizado para tareas de alto volumen y baja latencia como clasificación, traducción y enrutamiento inteligente.

A pesar de su enfoque en la eficiencia, Gemini 2.5 Flash-Lite mantiene las capacidades clave de la familia 2.5, incluyendo una ventana de contexto de un millón de tokens y soporte para herramientas nativas como integración con Google Search y ejecución de código. A diferencia de otros modelos de la familia que tienen activadas por defecto las capacidades de razonamiento, Flash-Lite permite a los desarrolladores controlar el presupuesto de razonamiento mediante parámetros de la API, con el razonamiento desactivado por defecto para optimizar velocidad y costos.

Para fortalecer aún más su oferta para desarrolladores, Google lanzó Gemini CLI, un agente de IA de código abierto que lleva Gemini directamente a la terminal. Esta herramienta permite a los desarrolladores acceder a Gemini 2.5 Pro mediante una interfaz de línea de comandos para programación, resolución de problemas y gestión de tareas. El carácter de código abierto de Gemini CLI (bajo licencia Apache 2.0) permite a los desarrolladores inspeccionar el código, verificar implicaciones de seguridad y contribuir a su desarrollo.

Los últimos lanzamientos de IA de Google demuestran su compromiso por ofrecer a los desarrolladores herramientas cada vez más potentes y flexibles, adaptadas a diferentes precios y casos de uso, desde generación de imágenes de alta calidad hasta procesamiento eficiente de texto y asistencia de IA desde la terminal.

Source:

Latest News