O YouTube expandiu significativamente suas capacidades de IA ao integrar o avançado modelo de geração de vídeos Veo 2, da Google DeepMind, à sua plataforma Shorts, permitindo que criadores produzam conteúdos de vídeo de alta qualidade a partir de simples comandos de texto.
A integração possibilita que criadores gerem clipes de vídeo por IA para suas postagens, representando a resposta competitiva do Google ao gerador de texto para vídeo Sora, da OpenAI. Embora o YouTube já oferecesse fundos gerados por IA para Shorts por meio do recurso Dream Screen, o Veo 2 leva isso além ao permitir a criação de clipes de vídeo independentes que podem ser adicionados a qualquer Short.
Segundo o YouTube, o Veo 2 gera vídeos de última geração e alta qualidade em uma ampla variedade de temas e estilos, correspondendo melhor à visão dos criadores. A tecnologia processa vídeos mais rapidamente do que versões anteriores e demonstra melhor compreensão da física do mundo real e do movimento humano, resultando em produções mais detalhadas e realistas. Os criadores podem até especificar estilos, lentes ou efeitos cinematográficos, tornando o Dream Screen uma ferramenta intuitiva para expressão criativa.
Para usar os novos recursos, os criadores podem acessar o Dream Screen pela opção Tela Verde da câmera do Shorts, onde podem inserir comandos de texto para gerar vídeos. A funcionalidade foi lançada em fevereiro de 2025 para criadores nos Estados Unidos, Canadá, Austrália e Nova Zelândia, com planos do YouTube de expandir o acesso para mais regiões.
Para lidar com possíveis preocupações sobre uso indevido, o YouTube utiliza a tecnologia SynthID da DeepMind para inserir marcas d'água digitais em vídeos criados por IA. Todo conteúdo gerado por IA é claramente rotulado para ajudar os espectadores a identificá-lo como tal. Essa abordagem responsável de implantação inclui um lançamento inicial limitado para produtos selecionados antes de expandir para plataformas como o YouTube Shorts em 2025, com todos os vídeos gerados por IA marcados com marcas d'água invisíveis do SynthID.
O desenvolvimento mais recente faz parte da estratégia mais ampla de vídeo por IA do Google, que recentemente lançou o Veo 3 em maio de 2025. Esse novo modelo avança ainda mais as capacidades de geração de vídeo ao adicionar recursos de áudio, incluindo diálogos, trilhas sonoras e efeitos sonoros. À medida que essas tecnologias continuam evoluindo, prometem transformar a forma como o conteúdo é criado em uma das maiores plataformas de vídeo do mundo, potencialmente democratizando a produção de vídeos de alta qualidade para criadores sem grandes conhecimentos técnicos ou equipamentos.