Google ha llevado la generación de vídeo con inteligencia artificial a un nuevo nivel con el lanzamiento de Veo 3, un modelo revolucionario que incorpora capacidades de audio a los vídeos generados por IA por primera vez.
Presentado en el Google I/O 2025 en mayo, Veo 3 supone un avance significativo respecto a los generadores de vídeo con IA anteriores, al integrar diálogos sincronizados, sonidos ambientales y música de fondo directamente en los clips generados. "Por primera vez, salimos de la era muda de la generación de vídeo", afirmó Demis Hassabis, CEO de Google DeepMind, durante el anuncio.
La tecnología destaca por crear vídeos realistas con física precisa, sincronización labial exacta y movimientos naturales. Los usuarios pueden generar vídeos proporcionando descripciones de texto o imágenes de referencia, y la IA añade automáticamente los elementos de audio apropiados que coinciden con el contenido visual. Esta capacidad diferencia a Veo 3 de competidores como Sora de OpenAI, que actualmente no ofrece generación de audio nativa.
Junto a Veo 3, Google ha mejorado su popular modelo Veo 2 con varias funciones nuevas y potentes. Entre ellas se incluyen vídeo basado en referencias para mantener la coherencia de personajes y objetos, controles de cámara avanzados para movimientos cinematográficos, outpainting para ampliar los fotogramas más allá de los bordes originales y funcionalidades inteligentes para añadir o eliminar objetos.
Para mostrar el potencial creativo de estas herramientas, Google ha presentado Flow, una nueva plataforma de creación cinematográfica con IA que combina los modelos Veo, Imagen y Gemini. Varios cineastas ya han creado cortometrajes de calidad profesional utilizando esta tecnología, como la emotiva historia de ciencia ficción "Kitsune" de Henry Daubrez y la exploración sobre la identidad "Dear Stranger" de Junie Lau.
Veo 3 está disponible actualmente para los suscriptores estadounidenses del plan AI Ultra de Google, que cuesta 249,99 dólares al mes, a través de la app Gemini, así como para usuarios empresariales mediante la plataforma Vertex AI de Google. La tecnología incluye la marca de agua SynthID para ayudar a identificar contenido generado por IA y abordar preocupaciones sobre deepfakes y desinformación.