Google DeepMind har officielt lanceret Imagen 4, deres hidtil mest sofistikerede tekst-til-billede-genereringsmodel, der giver udviklere kraftfulde nye værktøjer til at skabe AI-genererede visuelle elementer.
Lanceringen, som blev tilgængelig den 15. juli via både Gemini API og Google AI Studio, introducerer to forskellige modeller inden for Imagen 4-familien. Den standard Imagen 4-model, prissat til $0,04 pr. genereret billede, fungerer som Googles flagskibsmodel til en bred vifte af billedgenereringsopgaver. For mere krævende anvendelser, der kræver præcis overholdelse af tekstprompter, tilbyder Imagen 4 Ultra forbedrede muligheder til $0,06 pr. billede.
Imagen 4 repræsenterer et markant fremskridt i forhold til sin forgænger, hvor Google fremhæver dens "bemærkelsesværdige klarhed i fine detaljer" såsom indviklede tekstiler, vanddråber og dyrepels. Modellen udmærker sig både i fotorealistiske og abstrakte stilarter og understøtter forskellige billedformater samt opløsninger op til 2K.
Måske mest bemærkelsesværdigt er, at Imagen 4 løser en vedvarende udfordring inden for AI-billedgenerering med sin markant forbedrede tekstgengivelse. Denne forbedring gør teknologien særligt værdifuld til at skabe markedsføringsmaterialer, plakater, invitationer, tegneserier og andre visuelle produkter, der kombinerer billeder og tekst.
"Imagen 4 er et kæmpe skridt fremad i kvalitet," udtaler Josh Woodward, der leder Googles Labs-gruppe. "Vi har brugt meget tid på at forbedre, hvordan modellen genererer tekst og typografi, så den er fantastisk til at lave slides eller invitationer – eller alt andet, hvor du skal blande billeder og tekst."
Teknologiens integration i Googles økosystem, herunder Workspace-applikationer, positionerer den til at øge produktiviteten på tværs af forskellige kreative og professionelle arbejdsgange. Google har oplyst, at yderligere prismodeller vil blive introduceret i de kommende uger, og at højere grænser for brug kan gives efter anmodning. Virksomheden planlægger også at lancere en hurtigere variant af Imagen 4, der kan blive op til ti gange hurtigere end Imagen 3.