Google har uden den store fanfare, men med betydelig effekt, opgraderet sin Imagen 4 Ultra-model og cementeret den som et af verdens førende AI-systemer til billedgenerering. Den forbedrede model indtager nu tredjepladsen på Artificial Analysis’ Image Arena-rangliste og positionerer sig dermed som en direkte konkurrent til branchens sværvægtere: OpenAIs GPT-4o og ByteDances Seedream 3.0.
Imagen 4 Ultra blev første gang præsenteret på Google I/O 2025 i maj og markerer et markant teknologisk spring i forhold til forgængeren. Modellen udmærker sig ved at gengive komplekse detaljer som stofteksturer, vanddråber og dyrepels med imponerende klarhed. Brugere har bemærket væsentlige forbedringer i både fotorealistiske og abstrakte billedstile, og modellen kan generere billeder i opløsninger op til 2K.
En af de mest markante forbedringer i Imagen 4 Ultra omhandler et velkendt problem i AI-billedgenerering: tekstgengivelse. Modellen har nu betydeligt forbedrede typografiske evner, hvilket gør den særligt velegnet til at skabe eksempelvis lykønskningskort, plakater og andre designs, hvor tekst og billede kombineres.
Google har gjort Imagen 4 Ultra tilgængelig via flere kanaler, herunder Gemini-appen, Google AI Studio og Vertex AI for erhvervskunder. Med en pris på 0,06 USD pr. genereret billede tilbyder modellen en konkurrencedygtig prisstruktur sammenlignet med GPT-4o’s cirka 0,17 USD pr. billede, samtidig med at den leverer resultater på omkring 9,5 sekunder mod GPT-4o’s 53 sekunder.
Opgraderingen understreger Googles ambition om at konkurrere på højeste niveau inden for generativ AI. Ifølge brancheanalytikere demonstrerer Google DeepMinds løbende forbedringer af Imagen-familien virksomhedens dedikation til at udvide grænserne for, hvad der er muligt med AI-genereret visuelt indhold.
Fremadrettet har Google meldt ud, at kommende opdateringer til Imagen 4 Ultra vil fokusere på at inddrage brugerfeedback for yderligere at forfine modellens evner samt på at reducere ventetiden for billedgenerering. Derudover arbejder virksomheden på en "Fast"-version af Imagen 4, som forventes at blive op til 10 gange hurtigere end Imagen 3 og dermed endnu mere anvendelig til realtidsapplikationer.