A Google elevou a geração de vídeo por inteligência artificial a um novo patamar com o lançamento do Veo 3, um modelo inovador que adiciona capacidades de áudio aos vídeos gerados por IA pela primeira vez.
Apresentado na Google I/O 2025 em maio, o Veo 3 representa um avanço significativo em relação aos anteriores geradores de vídeo por IA, ao incorporar diálogos sincronizados, sons ambiente e música de fundo diretamente nos clipes gerados. "Pela primeira vez, estamos a sair da era silenciosa da geração de vídeo", afirmou Demis Hassabis, CEO da Google DeepMind, durante o anúncio.
A tecnologia destaca-se na criação de vídeos realistas, com física precisa, sincronização labial rigorosa e movimentos naturais. Os utilizadores podem gerar vídeos fornecendo descrições de texto ou referências de imagem, sendo que a IA adiciona automaticamente elementos sonoros adequados ao conteúdo visual. Esta funcionalidade distingue o Veo 3 de concorrentes como o Sora da OpenAI, que atualmente não possui geração de áudio nativa.
A par do Veo 3, a Google melhorou o seu popular modelo Veo 2 com várias novas funcionalidades poderosas. Entre elas estão o vídeo orientado por referências para personagens e objetos consistentes, controlos de câmara avançados para movimentos cinematográficos, outpainting para expandir os limites dos frames de vídeo e funcionalidades inteligentes de adição e remoção de objetos.
Para demonstrar o potencial criativo destas ferramentas, a Google lançou o Flow, uma nova plataforma de realização cinematográfica por IA que combina os modelos Veo, Imagen e Gemini. Vários cineastas já criaram curtas-metragens de qualidade profissional com esta tecnologia, incluindo a história de ficção científica emocional "Kitsune" de Henry Daubrez e a exploração da identidade em "Dear Stranger" de Junie Lau.
O Veo 3 está atualmente disponível para subscritores norte-americanos do plano AI Ultra da Google, no valor de $249,99 por mês, através da aplicação Gemini, bem como para utilizadores empresariais via a plataforma Vertex AI da Google. A tecnologia inclui marca de água SynthID para ajudar a identificar conteúdos gerados por IA e responder a preocupações sobre deepfakes e desinformação.