Google presenterar nästa generations AI-verktyg för avancerad medieskapande

På Google I/O 2025 introducerade företaget Veo 3, en banbrytande AI-modell som genererar videor med synkroniserat ljud, inklusive bakgrundsljud och karaktärsdialog. Google lanserade även Imagen 4, som återger intrikata detaljer med enastående skärpa och stödjer upp till 2K-upplösning. Dessa avancerade AI-modeller driver Flow, Googles nya filmverktyg utformat för att hjälpa kreatörer förverkliga sina filmiska visioner.

Google har tagit ett stort steg framåt inom AI-generering av media genom lanseringen av Veo 3 och Imagen 4 på sin årliga I/O-utvecklarkonferens den 20 maj 2025.

Veo 3, Googles senaste videogenereringsmodell, markerar ett betydande framsteg genom att för första gången introducera ljudgenerering. Modellen kan skapa videor med synkroniserade bakgrundsljud som trafikbuller eller fågelkvitter, och generera dialog mellan karaktärer med exakt läpprörelse-synkronisering. Veo 3 visar förbättrad förståelse för verklighetstrogna fysikaliska lagar och mänskliga uttryck, vilket resulterar i mer realistiska och detaljerade videoutdata.

Vid sidan av Veo 3 presenterade Google även Imagen 4, företagets mest avancerade bildgenereringsmodell hittills. Imagen 4 utmärker sig genom att återge fina detaljer som intrikata tyger, vattendroppar och djurpäls med imponerande skärpa. Modellen stödjer olika bildformat och kan skapa bilder i upplösningar upp till 2K, vilket gör dem lämpliga för utskrifter eller presentationer. Google har även aviserat planer på att släppa en "snabb variant" av Imagen 4 som kommer vara upp till tio gånger snabbare än föregångaren, optimerad för snabb prototypframtagning och kreativa arbetsflöden.

Dessa kraftfulla AI-modeller utgör grunden för Flow, Googles nya AI-drivna filmverktyg. Flow kombinerar funktionaliteten från Veo, Imagen och Gemini för att hjälpa berättare skapa filmiska klipp och scener. Verktyget erbjuder funktioner som Camera Controls för precisa kamerarörelser, SceneBuilder för att sömlöst förlänga tagningar, samt Asset Management för att organisera kreativa element. Flow gör det möjligt för kreatörer att bibehålla konsekventa karaktärer och scener över flera klipp, vilket ger en mer sammanhållen berättarupplevelse.

Veo 3 är för närvarande tillgänglig för Google AI Ultra-prenumeranter i USA till ett pris av 249,99 dollar per månad, medan Imagen 4 kan nås via Gemini-appen, Whisk, Vertex AI och olika Google Workspace-applikationer. Allt innehåll som genereras av dessa modeller inkluderar SynthID-vattenstämplar för att säkerställa transparens och motverka desinformation.

Dessa framsteg speglar Googles engagemang för att utöka sina AI-möjligheter till fler användare. Företaget meddelade även att Gemini-appar nu har över 400 miljoner aktiva användare varje månad, vilket visar på den snabba spridningen av Googles AI-teknologier.

Source:

Google presenterar nästa generations AI-verktyg för avancerad medieskapande

Latest News

ByteDances Doubao AI erbjuder nu hjälp via videosamtal i realtid

OnePlus överger Alert Slider till förmån för AI-drivna Plus Key

Tyska teknikjättar går samman för EU-stödd AI-gigafabrik

Amerikanska åklagare granskade Builder.ai innan AI-startupen på 1,5 miljarder dollar kollapsade

Norges oljefond gör AI obligatoriskt för all personal

OpenTools.ai lanserar AI-nyhetsnav för teknikproffs

Google utökar AI-datorstyrning till utvecklare via Gemini

Google Förbättrar Gemini-modeller med Transparenta Tankesammanfattningar

Google presenterar nästa generations AI-verktyg för avancerad medieskapande

Related Articles

ByteDances Doubao AI erbjuder nu hjälp via videosamtal i realtid

Google utökar AI-datorstyrning till utvecklare via Gemini

Google Förbättrar Gemini-modeller med Transparenta Tankesammanfattningar

Google utökar AI-kostnadskontroller till Gemini 2.5 Pro

Google återupplivar smarta glasögon med Gemini-drivna översättningar

Latest News

ByteDances Doubao AI erbjuder nu hjälp via videosamtal i realtid

OnePlus överger Alert Slider till förmån för AI-drivna Plus Key

Tyska teknikjättar går samman för EU-stödd AI-gigafabrik

Amerikanska åklagare granskade Builder.ai innan AI-startupen på 1,5 miljarder dollar kollapsade

Norges oljefond gör AI obligatoriskt för all personal

OpenTools.ai lanserar AI-nyhetsnav för teknikproffs

Google utökar AI-datorstyrning till utvecklare via Gemini

Google Förbättrar Gemini-modeller med Transparenta Tankesammanfattningar