Google har løftet AI-videogenerering til nye højder med lanceringen af Veo 3, en banebrydende model, der for første gang tilføjer lydmuligheder til AI-genererede videoer.
Veo 3 blev præsenteret på Google I/O 2025 i maj og repræsenterer et markant fremskridt i forhold til tidligere AI-videogeneratorer ved at integrere synkroniseret dialog, omgivelseslyde og baggrundsmusik direkte i de genererede klip. "For første gang træder vi ud af den stille æra for videogenerering," udtalte Demis Hassabis, CEO for Google DeepMind, under præsentationen.
Teknologien udmærker sig ved at skabe realistiske videoer med nøjagtig fysik, præcis læbesynkronisering og naturlige bevægelser. Brugere kan generere videoer ved at give tekstbeskrivelser eller billedreferencer, hvorefter AI'en automatisk tilføjer passende lydelementer, der matcher det visuelle indhold. Denne evne adskiller Veo 3 fra konkurrenter som OpenAI's Sora, der i øjeblikket mangler indbygget lydgenerering.
Sideløbende med Veo 3 har Google opgraderet deres populære Veo 2-model med flere kraftfulde nye funktioner. Disse omfatter referencebaseret video for konsistente karakterer og objekter, avanceret kamerakontrol for filmisk bevægelse, outpainting til at udvide videorammer ud over de oprindelige grænser samt intelligent tilføjelse og fjernelse af objekter.
For at demonstrere de kreative muligheder med disse værktøjer har Google introduceret Flow, en ny AI-filmplatform, der kombinerer Veo, Imagen og Gemini-modellerne. Flere filmskabere har allerede produceret professionelle kortfilm med teknologien, herunder Henry Daubrez' følelsesladede sci-fi-fortælling "Kitsune" og Junie Laus identitetsudforskning i "Dear Stranger".
Veo 3 er i øjeblikket tilgængelig for amerikanske abonnenter på Googles AI Ultra-plan til $249,99 om måneden via Gemini-appen samt for erhvervsbrugere gennem Googles Vertex AI-platform. Teknologien inkluderer SynthID-vandmærkning for at hjælpe med at identificere AI-genereret indhold og imødegå bekymringer om deepfakes og misinformation.