Google släpper Imagen 4 med revolutionerande texthantering

Google har lanserat Imagen 4, sin mest avancerade AI-modell för text-till-bild hittills, tillgänglig för utvecklare via Gemini API och Google AI Studio från och med den 15 juli 2025. Den senaste versionen innebär stora förbättringar av bildkvaliteten, särskilt vad gäller återgivning av text, och introducerar två modellvarianter för olika kreativa behov. Tekniken gör det möjligt för utvecklare att skapa mycket detaljerade bilder utifrån textbeskrivningar, med användningsområden inom design, marknadsföring, underhållning och andra kreativa fält.

Google DeepMind har officiellt lanserat Imagen 4, sin mest sofistikerade modell för text-till-bild-generering hittills, och erbjuder utvecklare kraftfulla nya verktyg för att skapa AI-genererade bilder.

Lanseringen, som blev tillgänglig den 15 juli via både Gemini API och Google AI Studio, introducerar två distinkta modeller inom Imagen 4-familjen. Den standardiserade Imagen 4-modellen, prissatt till 0,04 USD per genererad bild, är Googles flaggskeppserbjudande för ett brett spektrum av bildgenereringsuppgifter. För mer krävande tillämpningar som kräver exakt återgivning av textpromptar erbjuder Imagen 4 Ultra utökade funktioner till priset 0,06 USD per bild.

Imagen 4 innebär ett betydande steg framåt jämfört med föregångaren, där Google lyfter fram dess "anmärkningsvärda klarhet i fina detaljer" såsom intrikata tyger, vattendroppar och djurpäls. Modellen utmärker sig både i fotorealistiska och abstrakta stilar, och stöder olika bildformat och upplösningar upp till 2K.

Kanske mest anmärkningsvärt är att Imagen 4 adresserar en ihållande utmaning inom AI-genererad bild: dramatiskt förbättrad återgivning av text. Denna förbättring gör tekniken särskilt värdefull för att skapa marknadsföringsmaterial, affischer, inbjudningar, serier och andra visuella produktioner där bild och text kombineras.

"Imagen 4 är ett enormt steg framåt i kvalitet," säger Josh Woodward, chef för Googles Labs-grupp. "Vi har lagt mycket fokus och förbättringar på hur modellen genererar text och typografi, så den är fantastisk för att skapa presentationer eller inbjudningar, eller vad som helst där du vill blanda bild och text."

Teknikens integration i Googles ekosystem, inklusive Workspace-applikationer, positionerar den för att öka produktiviteten i olika kreativa och professionella arbetsflöden. Google har meddelat att ytterligare prismodeller kommer att introduceras under de kommande veckorna, med högre kapacitetsgränser tillgängliga på begäran. Företaget planerar även att släppa en snabbare variant av Imagen 4, som kan bli upp till tio gånger snabbare än Imagen 3.

Source:

Google släpper Imagen 4 med revolutionerande texthantering

Latest News

Google lanserar ultrabilliga Gemini 2.5 Flash-Lite för kostnadskänslig AI

Google lanserar Gemini CLI: AI-assistent för utvecklarnas terminaler

Google AI revolutionerar cancervården med banbrytande detektionsverktyg

Googles AI på enheten ger robotar autonom intelligens

Företag Saknar Avgörande Mänskliga Färdigheter för Framgång i AI-eran

VentureBeat avslöjar stor AI-marknadsförändring i analys för 2025

OpenAI:s GPT-5 ska förena AI-förmågor i en kraftfull modell

Metas AI-satsning på 14,8 miljarder dollar: Desperation eller strategiskt geni?

Teknikjättar satsar på kärnkraft för att möta AI:s energibehov

Dailymotion lanserar AI-drivet videoplattformsgenombrott

Google släpper Imagen 4 med revolutionerande texthantering

Related Articles

Googles AI på enheten ger robotar autonom intelligens

Google lanserar Gemini CLI: AI-assistent för utvecklarnas terminaler

Google lanserar ultrabilliga Gemini 2.5 Flash-Lite för kostnadskänslig AI

Moonshot AI:s biljon-parametriga Kimi K2 utmanar AI-jättarna

Google utökar Gemini Live med djupare appintegrationer

Latest News

Google lanserar ultrabilliga Gemini 2.5 Flash-Lite för kostnadskänslig AI

Google lanserar Gemini CLI: AI-assistent för utvecklarnas terminaler

Google AI revolutionerar cancervården med banbrytande detektionsverktyg

Googles AI på enheten ger robotar autonom intelligens

Företag Saknar Avgörande Mänskliga Färdigheter för Framgång i AI-eran

VentureBeat avslöjar stor AI-marknadsförändring i analys för 2025

OpenAI:s GPT-5 ska förena AI-förmågor i en kraftfull modell

Metas AI-satsning på 14,8 miljarder dollar: Desperation eller strategiskt geni?

Teknikjättar satsar på kärnkraft för att möta AI:s energibehov

Dailymotion lanserar AI-drivet videoplattformsgenombrott