menu
close

Google esittelee seuraavan sukupolven tekoälytyökalut edistyneeseen mediatuotantoon

Google I/O 2025 -tapahtumassa yhtiö julkisti Veo 3:n, uraauurtavan tekoälymallin, joka tuottaa videoita synkronoidulla äänellä, mukaan lukien taustaäänet ja hahmojen vuoropuhelut. Google toi markkinoille myös Imagen 4:n, joka tuottaa yksityiskohtia poikkeuksellisella tarkkuudella ja tukee jopa 2K-resoluutiota. Nämä edistyneet tekoälymallit toimivat perustana Flow'lle, Googlen uudelle elokuvatyökalulle, jonka avulla tekijät voivat toteuttaa elokuvallisia visioitaan.
Google esittelee seuraavan sukupolven tekoälytyökalut edistyneeseen mediatuotantoon

Google on ottanut merkittävän harppauksen tekoälypohjaisessa mediatuotannossa julkaisemalla Veo 3:n ja Imagen 4:n vuosittaisessa I/O-kehittäjätapahtumassaan 20. toukokuuta 2025.

Veo 3, Googlen uusin videotuotantomalli, edustaa suurta edistysaskelta tuomalla ensimmäistä kertaa mukaan myös äänentuotannon ominaisuudet. Malli kykenee luomaan videoita, joissa on synkronoidut taustaäänet, kuten liikenteen melu tai lintujen laulu, ja se voi tuottaa myös hahmojen välistä vuoropuhelua tarkalla huulisynkronoinnilla. Veo 3 osoittaa parantunutta ymmärrystä todellisen maailman fysiikasta ja ihmisten ilmeistä, mikä johtaa entistä realistisempiin ja yksityiskohtaisempiin videotuotoksiin.

Veo 3:n rinnalla Google esitteli Imagen 4:n, tähän mennessä kehittyneimmän kuvantuotantomallinsa. Imagen 4 loistaa yksityiskohtaisten elementtien, kuten monimutkaisten kankaiden, vesipisaroiden ja eläinten turkin, tuottamisessa poikkeuksellisella tarkkuudella. Malli tukee erilaisia kuvasuhteita ja kykenee luomaan jopa 2K-resoluution kuvia, jotka soveltuvat esimerkiksi tulostukseen tai esityksiin. Google ilmoitti myös aikovansa julkaista Imagen 4:stä "nopean version", joka on jopa kymmenen kertaa edeltäjäänsä nopeampi ja optimoitu nopeaan prototypointiin sekä luoviin työnkulkuihin.

Nämä tehokkaat tekoälymallit muodostavat perustan Flow'lle, Googlen uudelle tekoälypohjaiselle elokuvatyökalulle. Flow yhdistää Veon, Imagenin ja Geminin ominaisuudet auttaakseen tarinankertojia luomaan elokuvamaisia kohtauksia ja otoksia. Työkalu tarjoaa muun muassa Camera Controls -ominaisuuden tarkkaan kameran liikkeiden hallintaan, SceneBuilderin saumattomaan otosten laajentamiseen sekä Asset Managementin luovien elementtien järjestämiseen. Flow mahdollistaa hahmojen ja kohtausten johdonmukaisuuden useiden otosten välillä, mikä tukee yhtenäistä tarinankerrontaa.

Veo 3 on tällä hetkellä saatavilla Google AI Ultra -tilaajille Yhdysvalloissa hintaan 249,99 dollaria kuukaudessa, kun taas Imagen 4 on käytettävissä Gemini-sovelluksen, Whiskin, Vertex AI:n ja eri Google Workspace -sovellusten kautta. Kaikki näillä malleilla tuotettu sisältö sisältää SynthID-vesileiman läpinäkyvyyden varmistamiseksi ja väärän tiedon torjumiseksi.

Nämä edistysaskeleet kuvastavat Googlen sitoutumista tekoälykyvykkyyksien laajentamiseen yhä useammille käyttäjille. Yhtiö kertoi myös, että Gemini-sovelluksilla on nyt yli 400 miljoonaa kuukausittaista aktiivista käyttäjää, mikä osoittaa tekoälyteknologioiden nopeaa omaksumista.

Source:

Latest News