Google ha llevado la generación de videos con inteligencia artificial a un nuevo nivel con el lanzamiento de Veo 3, un modelo revolucionario que añade capacidades de audio a los videos generados por IA por primera vez.
Presentado en Google I/O 2025 en mayo, Veo 3 representa un avance significativo respecto a los generadores de video con IA anteriores, al incorporar diálogos sincronizados, sonidos ambientales y música de fondo directamente en los clips generados. "Por primera vez, estamos saliendo de la era silenciosa de la generación de videos", afirmó Demis Hassabis, CEO de Google DeepMind, durante el anuncio.
La tecnología destaca por crear videos realistas con física precisa, sincronización labial exacta y movimientos naturales. Los usuarios pueden generar videos proporcionando descripciones de texto o imágenes de referencia, y la IA añade automáticamente los elementos de audio apropiados que coinciden con el contenido visual. Esta capacidad diferencia a Veo 3 de competidores como Sora de OpenAI, que actualmente no cuenta con generación de audio nativa.
Junto con Veo 3, Google ha mejorado su popular modelo Veo 2 con varias funciones nuevas y potentes. Entre ellas se incluyen videos impulsados por referencias para mantener coherencia en personajes y objetos, controles avanzados de cámara para movimientos cinematográficos, outpainting para extender los cuadros de video más allá de los bordes originales, y funcionalidades inteligentes para agregar o eliminar objetos.
Para mostrar el potencial creativo de estas herramientas, Google ha presentado Flow, una nueva plataforma de creación cinematográfica con IA que combina los modelos Veo, Imagen y Gemini. Varios cineastas ya han creado cortometrajes de calidad profesional utilizando esta tecnología, incluyendo la emotiva historia de ciencia ficción "Kitsune" de Henry Daubrez y la exploración de la identidad en "Dear Stranger" de Junie Lau.
Veo 3 está disponible actualmente para suscriptores en EE. UU. del plan AI Ultra de Google, que cuesta $249.99 dólares al mes, a través de la app Gemini, así como para usuarios empresariales mediante la plataforma Vertex AI de Google. La tecnología incluye la marca de agua SynthID para ayudar a identificar contenido generado por IA y abordar preocupaciones sobre deepfakes y desinformación.