menu
close

Google presenta Imagen 4 y amplía la gama Gemini 2.5

Google ha lanzado Imagen 4, su modelo de generación de imágenes a partir de texto más avanzado hasta la fecha, disponible ahora en vista previa de pago a través de la API de Gemini y Google AI Studio. Este lanzamiento coincide con la disponibilidad general de los modelos Gemini 2.5 Flash y Pro, junto con la introducción de Gemini 2.5 Flash-Lite, el modelo más rápido y rentable de la familia 2.5. Los desarrolladores también pueden acceder a Gemini directamente desde el terminal gracias al nuevo Gemini CLI de código abierto.
Google presenta Imagen 4 y amplía la gama Gemini 2.5

Google ha ampliado significativamente sus capacidades de inteligencia artificial con el lanzamiento de Imagen 4, su modelo más avanzado de generación de imágenes a partir de texto, que ya está disponible en vista previa de pago a través de la API de Gemini y Google AI Studio.

Imagen 4 supone una mejora sustancial respecto a versiones anteriores, especialmente en la calidad de la representación de texto dentro de las imágenes generadas. El lanzamiento incluye dos variantes: el modelo estándar Imagen 4, con un precio de 0,04 dólares por imagen generada, e Imagen 4 Ultra, a 0,06 dólares por imagen, que ofrece mayor precisión en el seguimiento de las instrucciones del usuario. Ambos modelos incorporan la tecnología de marca de agua SynthID, invisible para el ojo humano pero que ayuda a identificar contenido generado por IA.

Este lanzamiento forma parte de la expansión de la familia de modelos Gemini 2.5 de Google. La compañía ha puesto a disposición general los modelos Gemini 2.5 Flash y Pro tras periodos de vista previa exitosos, al tiempo que presenta Gemini 2.5 Flash-Lite en vista previa. Flash-Lite se posiciona como el modelo 2.5 más rápido y rentable de Google, optimizado para tareas de alto volumen y baja latencia como clasificación, traducción y enrutamiento inteligente.

A pesar de su enfoque en la eficiencia, Gemini 2.5 Flash-Lite mantiene las capacidades clave de la familia 2.5, incluyendo una ventana de contexto de un millón de tokens y soporte para herramientas nativas como la integración con Google Search y la ejecución de código. A diferencia de otros modelos de la familia, que tienen activadas por defecto las capacidades de razonamiento, Flash-Lite permite a los desarrolladores controlar el presupuesto de razonamiento a través de parámetros de la API, estando desactivado por defecto para optimizar velocidad y coste.

Para mejorar aún más su oferta para desarrolladores, Google ha lanzado Gemini CLI, un agente de IA de código abierto que lleva Gemini directamente al terminal. Esta herramienta permite acceder a Gemini 2.5 Pro mediante una interfaz de línea de comandos para programación, resolución de problemas y gestión de tareas. El carácter abierto de Gemini CLI (bajo licencia Apache 2.0) permite a los desarrolladores inspeccionar el código, verificar implicaciones de seguridad y contribuir a su desarrollo.

Los últimos lanzamientos de IA de Google demuestran su compromiso por ofrecer a los desarrolladores herramientas cada vez más potentes y flexibles, adaptadas a distintos precios y casos de uso, desde la generación de imágenes de alta calidad hasta el procesamiento eficiente de texto y la asistencia por IA en el terminal.

Source:

Latest News