Google DeepMind on virallisesti julkaissut Imagen 4:n, tähän asti kehittyneimmän tekstistä-kuvaksi -generointimallinsa, tarjoten kehittäjille tehokkaita uusia työkaluja tekoälypohjaisten visuaalien luomiseen.
Julkaisu, joka tuli saataville 15. heinäkuuta sekä Gemini API:n että Google AI Studion kautta, esittelee kaksi erillistä mallia Imagen 4 -perheessä. Vakiomalli Imagen 4, jonka hinta on 0,04 dollaria per luotu kuva, toimii Googlen lippulaivana monipuolisiin kuvagenerointitehtäviin. Vaativampiin käyttötarkoituksiin, joissa vaaditaan tarkkaa tekstikehotteiden noudattamista, Imagen 4 Ultra tarjoaa parannetut ominaisuudet hintaan 0,06 dollaria per kuva.
Imagen 4 merkitsee merkittävää harppausta edeltäjäänsä verrattuna, ja Google korostaa sen "huomattavaa tarkkuutta yksityiskohdissa" kuten monimutkaisissa kankaissa, vesipisaroissa ja eläinten turkissa. Malli suoriutuu erinomaisesti sekä valokuvamaisissa että abstrakteissa tyyleissä, tukien erilaisia kuvasuhteita ja jopa 2K-tarkkuuksia.
Ehkä merkittävimpänä uudistuksena Imagen 4 ratkaisee tekoälykuvageneroinnin pitkäaikaisen haasteen dramaattisesti parannetulla tekstin luonnilla. Tämä parannus tekee teknologiasta erityisen hyödyllisen markkinointimateriaalien, julisteiden, kutsujen, sarjakuvien ja muiden kuvien luomiseen, joissa yhdistyvät kuva ja teksti.
"Imagen 4 on valtava harppaus laadussa", toteaa Josh Woodward, joka johtaa Googlen Labs-ryhmää. "Olemme kiinnittäneet paljon huomiota ja tehneet korjauksia siihen, miten se tuottaa tekstiä ja typografiaa, joten se on erinomainen esimerkiksi esityskalvojen tai kutsujen tekoon – mihin tahansa, missä halutaan yhdistää kuvaa ja tekstiä."
Teknologian integrointi Googlen ekosysteemiin, mukaan lukien Workspace-sovellukset, mahdollistaa tuottavuuden kasvattamisen monilla luovilla ja ammatillisilla työskentelyalueilla. Google on ilmoittanut tuovansa lähiviikkoina käyttöön uusia hinnoittelutasoja, ja korkeampia käyttörajoja on saatavilla pyynnöstä. Yhtiö aikoo myös julkaista Imagen 4:n nopeamman version, joka voi toimia jopa kymmenen kertaa Imagen 3:a nopeammin.