Google har i det tysta men kraftfullt uppgraderat sin modell Imagen 4 Ultra och etablerat den som ett av världens främsta AI-system för bildgenerering. Den förbättrade modellen ligger nu på tredje plats på Artificial Analysis Image Arena-topplista, vilket gör den till en direkt konkurrent till branschledarna OpenAI:s GPT-4o och ByteDance:s Seedream 3.0.
Imagen 4 Ultra, som först presenterades på Google I/O 2025 i maj, utgör ett betydande framsteg jämfört med sin föregångare. Modellen utmärker sig i återgivning av intrikata detaljer som tygstrukturer, vattendroppar och djurpäls med imponerande skärpa. Användare har noterat stora förbättringar både i fotorealistiska och abstrakta bildstilar, och modellen kan generera bilder i upplösningar upp till 2K.
En av de mest anmärkningsvärda förbättringarna i Imagen 4 Ultra gäller en långvarig utmaning inom AI-bildgenerering: textåtergivning. Modellen visar på betydligt förbättrade typografiska egenskaper, vilket gör den särskilt värdefull för att skapa gratulationskort, affischer och andra designer där bild och text kombineras.
Google har gjort Imagen 4 Ultra tillgänglig via flera kanaler, däribland Gemini-appen, Google AI Studio och Vertex AI för företagskunder. Med ett pris på 0,06 dollar per genererad bild erbjuder den en konkurrenskraftig prissättning jämfört med GPT-4o:s cirka 0,17 dollar per bild, samtidigt som resultaten levereras på cirka 9,5 sekunder mot GPT-4o:s 53 sekunder.
Uppgraderingen signalerar Googles beslutsamhet att konkurrera på högsta nivå inom generativ AI. Enligt branschanalytiker visar Google DeepMinds fortsatta utveckling av Imagen-familjen företagets engagemang för att tänja på gränserna för vad som är möjligt inom AI-genererat visuellt innehåll.
Framöver har Google meddelat att kommande uppdateringar av Imagen 4 Ultra kommer att fokusera på att ta tillvara användarfeedback för att ytterligare finslipa modellens kapacitet, samt arbeta för att minska genereringstiden. Företaget utvecklar också en "Fast"-version av Imagen 4 som utlovas vara upp till tio gånger snabbare än Imagen 3, vilket ytterligare stärker dess användbarhet för realtidsapplikationer.