Google har tagit ett stort steg framåt inom AI-generering av media genom lanseringen av Veo 3 och Imagen 4 på sin årliga I/O-utvecklarkonferens den 20 maj 2025.
Veo 3, Googles senaste videogenereringsmodell, markerar ett betydande framsteg genom att för första gången introducera ljudgenerering. Modellen kan skapa videor med synkroniserade bakgrundsljud som trafikbuller eller fågelkvitter, och generera dialog mellan karaktärer med exakt läpprörelse-synkronisering. Veo 3 visar förbättrad förståelse för verklighetstrogna fysikaliska lagar och mänskliga uttryck, vilket resulterar i mer realistiska och detaljerade videoutdata.
Vid sidan av Veo 3 presenterade Google även Imagen 4, företagets mest avancerade bildgenereringsmodell hittills. Imagen 4 utmärker sig genom att återge fina detaljer som intrikata tyger, vattendroppar och djurpäls med imponerande skärpa. Modellen stödjer olika bildformat och kan skapa bilder i upplösningar upp till 2K, vilket gör dem lämpliga för utskrifter eller presentationer. Google har även aviserat planer på att släppa en "snabb variant" av Imagen 4 som kommer vara upp till tio gånger snabbare än föregångaren, optimerad för snabb prototypframtagning och kreativa arbetsflöden.
Dessa kraftfulla AI-modeller utgör grunden för Flow, Googles nya AI-drivna filmverktyg. Flow kombinerar funktionaliteten från Veo, Imagen och Gemini för att hjälpa berättare skapa filmiska klipp och scener. Verktyget erbjuder funktioner som Camera Controls för precisa kamerarörelser, SceneBuilder för att sömlöst förlänga tagningar, samt Asset Management för att organisera kreativa element. Flow gör det möjligt för kreatörer att bibehålla konsekventa karaktärer och scener över flera klipp, vilket ger en mer sammanhållen berättarupplevelse.
Veo 3 är för närvarande tillgänglig för Google AI Ultra-prenumeranter i USA till ett pris av 249,99 dollar per månad, medan Imagen 4 kan nås via Gemini-appen, Whisk, Vertex AI och olika Google Workspace-applikationer. Allt innehåll som genereras av dessa modeller inkluderar SynthID-vattenstämplar för att säkerställa transparens och motverka desinformation.
Dessa framsteg speglar Googles engagemang för att utöka sina AI-möjligheter till fler användare. Företaget meddelade även att Gemini-appar nu har över 400 miljoner aktiva användare varje månad, vilket visar på den snabba spridningen av Googles AI-teknologier.