Google DeepMind službeno je lansirao Imagen 4, svoj najsuvremeniji model za generiranje slika iz teksta, nudeći programerima moćne nove alate za stvaranje AI-generiranih vizuala.
Ova verzija, dostupna od 15. srpnja putem Gemini API-ja i Google AI Studija, uvodi dva različita modela unutar obitelji Imagen 4. Standardni Imagen 4 model, po cijeni od 0,04 USD po generiranoj slici, predstavlja Googleovu glavnu ponudu za širok raspon zadataka generiranja slika. Za zahtjevnije primjene koje traže precizno pridržavanje tekstualnih uputa, Imagen 4 Ultra nudi naprednije mogućnosti po cijeni od 0,06 USD po slici.
Imagen 4 predstavlja značajan napredak u odnosu na svog prethodnika, a Google ističe njegovu "izvanrednu jasnoću u finim detaljima" poput složenih tkanina, kapljica vode i životinjske dlake. Model se odlično snalazi u fotorealističnim i apstraktnim stilovima, podržava različite omjere stranica i rezolucije do 2K.
Možda najvažnije, Imagen 4 rješava dugotrajan izazov u AI generiranju slika zahvaljujući dramatično poboljšanom prikazu teksta. Ovo poboljšanje čini tehnologiju posebno vrijednom za izradu marketinških materijala, postera, pozivnica, stripova i drugih vizuala koji kombiniraju slike i tekst.
"Imagen 4 je ogroman korak naprijed u kvaliteti," istaknuo je Josh Woodward, voditelj Googleove Labs grupe. "Posvetili smo puno pažnje i ispravki načinu na koji generira tekst i tipografiju, pa je izvrstan za izradu prezentacija ili pozivnica, ili bilo čega gdje trebate spojiti slike i tekst."
Integracija ove tehnologije u Googleov ekosustav, uključujući Workspace aplikacije, omogućuje povećanje produktivnosti u raznim kreativnim i profesionalnim radnim procesima. Google je najavio da će u narednim tjednima biti uvedeni dodatni modeli naplate, uz veće limite korištenja na zahtjev. Tvrtka također planira lansirati bržu varijantu Imagen 4, koja bi mogla raditi i do deset puta brže od Imagen 3.