Google ha dado un gran paso adelante en sus capacidades de generación de contenidos multimedia mediante IA con el lanzamiento de Veo 3 e Imagen 4 durante su conferencia anual para desarrolladores I/O, celebrada el 20 de mayo de 2025.
Veo 3, el último modelo de generación de vídeo de Google, supone un avance significativo al incorporar por primera vez la capacidad de generar audio. El modelo puede crear vídeos con sonidos de fondo sincronizados, como el ruido del tráfico o el canto de los pájaros, e incluso generar diálogos entre personajes con sincronización labial precisa. Veo 3 demuestra una mejor comprensión de la física del mundo real y de las expresiones humanas, lo que se traduce en resultados de vídeo más realistas y detallados.
Junto a Veo 3, Google presentó Imagen 4, su modelo de generación de imágenes más avanzado hasta la fecha. Imagen 4 destaca por su capacidad para renderizar detalles minuciosos, como tejidos complejos, gotas de agua o pelaje de animales, con una claridad sobresaliente. El modelo soporta diferentes relaciones de aspecto y puede crear imágenes en resoluciones de hasta 2K, lo que las hace aptas para impresión o presentaciones. Google también ha anunciado el lanzamiento de una "variante rápida" de Imagen 4, que será hasta diez veces más veloz que su predecesora y estará optimizada para prototipado rápido y flujos creativos ágiles.
Estos potentes modelos de IA constituyen la base de Flow, la nueva herramienta de Google para la creación cinematográfica impulsada por inteligencia artificial. Flow combina las capacidades de Veo, Imagen y Gemini para ayudar a los narradores a crear clips y escenas cinematográficas. La herramienta ofrece funciones como Camera Controls para movimientos de cámara precisos, SceneBuilder para ampliar tomas de forma fluida y Asset Management para organizar los elementos creativos. Flow permite a los creadores mantener la coherencia de personajes y escenas a lo largo de varios clips, proporcionando una experiencia narrativa más cohesionada.
Veo 3 está disponible actualmente para los suscriptores de Google AI Ultra en Estados Unidos, con un precio de 249,99 dólares al mes, mientras que Imagen 4 se puede utilizar a través de la app Gemini, Whisk, Vertex AI y varias aplicaciones de Google Workspace. Todo el contenido generado por estos modelos incluye marcas de agua SynthID para garantizar la transparencia y combatir la desinformación.
Estos avances reflejan el compromiso de Google por ampliar el acceso a sus capacidades de IA, anunciando además que las aplicaciones Gemini ya cuentan con más de 400 millones de usuarios activos mensuales, lo que demuestra la rápida adopción de sus tecnologías de inteligencia artificial.