menu
close

Google lanza Imagen 4 con renderizado de texto revolucionario

Google ha presentado Imagen 4, su modelo de inteligencia artificial de texto a imagen más avanzado hasta la fecha, disponible para desarrolladores a través de la API de Gemini y Google AI Studio a partir del 15 de julio de 2025. Esta nueva versión ofrece mejoras significativas en la calidad de imagen, especialmente en la capacidad de renderizar texto, e introduce dos variantes del modelo para diferentes necesidades creativas. La tecnología permite a los desarrolladores generar imágenes altamente detalladas a partir de descripciones de texto, con aplicaciones en diseño, marketing, entretenimiento y otros campos creativos.
Google lanza Imagen 4 con renderizado de texto revolucionario

Google DeepMind ha lanzado oficialmente Imagen 4, su modelo de generación de imágenes a partir de texto más sofisticado hasta el momento, ofreciendo a los desarrolladores potentes herramientas para crear imágenes generadas por IA.

El lanzamiento, disponible desde el 15 de julio a través de la API de Gemini y Google AI Studio, introduce dos modelos distintos dentro de la familia Imagen 4. El modelo estándar, Imagen 4, con un precio de $0.04 dólares por imagen generada, es la oferta principal de Google para una amplia variedad de tareas de generación de imágenes. Para aplicaciones más exigentes que requieren una interpretación precisa de los textos, Imagen 4 Ultra ofrece capacidades mejoradas a $0.06 dólares por imagen.

Imagen 4 representa un avance significativo respecto a su predecesor, destacando por su "notable claridad en los detalles finos" como telas intrincadas, gotas de agua y pelaje de animales. El modelo sobresale tanto en estilos fotorrealistas como abstractos, y soporta varios formatos de aspecto y resoluciones de hasta 2K.

Quizá lo más destacado es que Imagen 4 resuelve un desafío persistente en la generación de imágenes por IA: el renderizado de texto. Esta mejora hace que la tecnología sea especialmente valiosa para crear materiales de marketing, carteles, invitaciones, cómics y otros visuales que combinan imágenes con texto.

"Imagen 4 es un gran paso adelante en calidad", señaló Josh Woodward, líder del grupo Labs de Google. "Hemos puesto mucha atención y realizado mejoras en cómo genera texto y tipografía, por lo que es ideal para crear diapositivas, invitaciones o cualquier otra cosa donde se necesite combinar imágenes y texto".

La integración de esta tecnología en el ecosistema de Google, incluidas las aplicaciones de Workspace, la posiciona para potenciar la productividad en diversos flujos de trabajo creativos y profesionales. Google indicó que en las próximas semanas se introducirán niveles de facturación adicionales, con límites de uso más altos disponibles bajo solicitud. La compañía también planea lanzar una variante más rápida de Imagen 4, que podría operar hasta diez veces más rápido que Imagen 3.

Source:

Latest News