menu
close

Google släpper Imagen 4 med revolutionerande texthantering

Google har lanserat Imagen 4, sin mest avancerade AI-modell för text-till-bild hittills, tillgänglig för utvecklare via Gemini API och Google AI Studio från och med den 15 juli 2025. Den senaste versionen innebär stora förbättringar av bildkvaliteten, särskilt vad gäller återgivning av text, och introducerar två modellvarianter för olika kreativa behov. Tekniken gör det möjligt för utvecklare att skapa mycket detaljerade bilder utifrån textbeskrivningar, med användningsområden inom design, marknadsföring, underhållning och andra kreativa fält.
Google släpper Imagen 4 med revolutionerande texthantering

Google DeepMind har officiellt lanserat Imagen 4, sin mest sofistikerade modell för text-till-bild-generering hittills, och erbjuder utvecklare kraftfulla nya verktyg för att skapa AI-genererade bilder.

Lanseringen, som blev tillgänglig den 15 juli via både Gemini API och Google AI Studio, introducerar två distinkta modeller inom Imagen 4-familjen. Den standardiserade Imagen 4-modellen, prissatt till 0,04 USD per genererad bild, är Googles flaggskeppserbjudande för ett brett spektrum av bildgenereringsuppgifter. För mer krävande tillämpningar som kräver exakt återgivning av textpromptar erbjuder Imagen 4 Ultra utökade funktioner till priset 0,06 USD per bild.

Imagen 4 innebär ett betydande steg framåt jämfört med föregångaren, där Google lyfter fram dess "anmärkningsvärda klarhet i fina detaljer" såsom intrikata tyger, vattendroppar och djurpäls. Modellen utmärker sig både i fotorealistiska och abstrakta stilar, och stöder olika bildformat och upplösningar upp till 2K.

Kanske mest anmärkningsvärt är att Imagen 4 adresserar en ihållande utmaning inom AI-genererad bild: dramatiskt förbättrad återgivning av text. Denna förbättring gör tekniken särskilt värdefull för att skapa marknadsföringsmaterial, affischer, inbjudningar, serier och andra visuella produktioner där bild och text kombineras.

"Imagen 4 är ett enormt steg framåt i kvalitet," säger Josh Woodward, chef för Googles Labs-grupp. "Vi har lagt mycket fokus och förbättringar på hur modellen genererar text och typografi, så den är fantastisk för att skapa presentationer eller inbjudningar, eller vad som helst där du vill blanda bild och text."

Teknikens integration i Googles ekosystem, inklusive Workspace-applikationer, positionerar den för att öka produktiviteten i olika kreativa och professionella arbetsflöden. Google har meddelat att ytterligare prismodeller kommer att introduceras under de kommande veckorna, med högre kapacitetsgränser tillgängliga på begäran. Företaget planerar även att släppa en snabbare variant av Imagen 4, som kan bli upp till tio gånger snabbare än Imagen 3.

Source:

Latest News