Google DeepMind heeft officieel Imagen 4 gelanceerd, het meest geavanceerde tekst-naar-beeld generatiemodel tot nu toe, waarmee ontwikkelaars krachtige nieuwe tools krijgen voor het creëren van AI-gegenereerde visuals.
De release, die vanaf 15 juli beschikbaar is via zowel de Gemini API als Google AI Studio, introduceert twee verschillende modellen binnen de Imagen 4-familie. Het standaard Imagen 4-model, geprijsd op $0,04 per gegenereerde afbeelding, is het vlaggenschip van Google voor een breed scala aan beeldgeneratietaken. Voor veeleisendere toepassingen die een zeer nauwkeurige interpretatie van tekstprompts vereisen, biedt Imagen 4 Ultra verbeterde mogelijkheden voor $0,06 per afbeelding.
Imagen 4 betekent een aanzienlijke vooruitgang ten opzichte van zijn voorganger. Google benadrukt de "opmerkelijke helderheid in fijne details" zoals ingewikkelde stoffen, waterdruppels en dierenbont. Het model blinkt uit in zowel fotorealistische als abstracte stijlen en ondersteunt diverse beeldverhoudingen en resoluties tot 2K.
Misschien wel het meest opvallend is dat Imagen 4 een hardnekkige uitdaging in AI-beeldgeneratie aanpakt met zijn sterk verbeterde tekstrendering. Deze verbetering maakt de technologie bijzonder waardevol voor het creëren van marketingmateriaal, posters, uitnodigingen, strips en andere visuals waarin beeld en tekst worden gecombineerd.
"Imagen 4 is een enorme stap vooruit in kwaliteit," aldus Josh Woodward, hoofd van Google's Labs-groep. "We hebben veel aandacht besteed aan en verbeteringen aangebracht in hoe het model tekst en typografie genereert, waardoor het ideaal is voor het maken van slides of uitnodigingen, of elke andere toepassing waarbij je beeld en tekst wilt combineren."
De integratie van deze technologie in het Google-ecosysteem, waaronder Workspace-applicaties, zorgt ervoor dat de productiviteit in diverse creatieve en professionele workflows wordt verhoogd. Google heeft aangegeven dat er in de komende weken extra prijsniveaus worden geïntroduceerd, met hogere limieten op aanvraag. Het bedrijf is daarnaast van plan een snellere variant van Imagen 4 uit te brengen, die tot tien keer sneller zou kunnen werken dan Imagen 3.