O Google elevou a geração de vídeos por IA a um novo patamar com o lançamento do Veo 3, um modelo revolucionário que adiciona capacidades de áudio aos vídeos gerados por inteligência artificial pela primeira vez.
Apresentado no Google I/O 2025 em maio, o Veo 3 representa um avanço significativo em relação aos geradores de vídeo por IA anteriores ao incorporar diálogos sincronizados, sons ambientes e trilhas sonoras diretamente nos clipes gerados. "Pela primeira vez, estamos saindo da era do silêncio na geração de vídeos", afirmou Demis Hassabis, CEO do Google DeepMind, durante o anúncio.
A tecnologia se destaca na criação de vídeos realistas, com física precisa, sincronia labial fiel e movimentos naturais. Os usuários podem gerar vídeos fornecendo descrições em texto ou referências de imagens, e a IA adiciona automaticamente elementos de áudio apropriados de acordo com o conteúdo visual. Essa capacidade diferencia o Veo 3 de concorrentes como o Sora, da OpenAI, que atualmente não possui geração nativa de áudio.
Junto com o Veo 3, o Google aprimorou seu popular modelo Veo 2 com diversos novos recursos poderosos. Entre eles estão vídeos baseados em referências para manter personagens e objetos consistentes, controles avançados de câmera para movimentos cinematográficos, outpainting para expandir quadros além das bordas originais e funcionalidades inteligentes de adição e remoção de objetos.
Para demonstrar o potencial criativo dessas ferramentas, o Google lançou o Flow, uma nova plataforma de criação cinematográfica por IA que combina os modelos Veo, Imagen e Gemini. Diversos cineastas já produziram curtas-metragens de qualidade profissional utilizando a tecnologia, incluindo a história sci-fi emocional "Kitsune", de Henry Daubrez, e a exploração de identidade "Dear Stranger", de Junie Lau.
O Veo 3 está disponível atualmente para assinantes do plano AI Ultra do Google, que custa US$ 249,99 por mês, através do app Gemini nos EUA, além de usuários corporativos via a plataforma Vertex AI. A tecnologia inclui marca d'água SynthID para ajudar a identificar conteúdos gerados por IA e combater preocupações com deepfakes e desinformação.