menu
close

Google lanserar Imagen 4 och utökar Gemini 2.5-serien

Google har släppt Imagen 4, sin mest avancerade text-till-bild-modell hittills, nu tillgänglig i betald förhandsvisning via Gemini API och Google AI Studio. Lanseringen sammanfaller med allmän tillgänglighet för Gemini 2.5 Flash och Pro, samt introduktionen av Gemini 2.5 Flash-Lite – Googles mest kostnadseffektiva och snabbaste modell i 2.5-familjen. Utvecklare kan nu även använda Gemini direkt i terminalen via den nya öppna Gemini CLI.
Google lanserar Imagen 4 och utökar Gemini 2.5-serien

Google har kraftigt utökat sina AI-möjligheter med lanseringen av Imagen 4, företagets mest avancerade modell för text-till-bild-generering, nu tillgänglig i betald förhandsvisning via Gemini API och Google AI Studio.

Imagen 4 innebär en betydande förbättring jämfört med tidigare versioner, särskilt vad gäller textåtergivning i genererade bilder. Lanseringen omfattar två varianter: standardmodellen Imagen 4, prissatt till 0,04 USD per genererad bild, samt Imagen 4 Ultra för 0,06 USD per bild, som erbjuder ännu högre precision i att följa användarens instruktioner. Båda modellerna har SynthID-vattenmärkning, en teknik som är osynlig för det mänskliga ögat men hjälper till att identifiera AI-genererat innehåll.

Denna lansering är en del av Googles bredare expansion av Gemini 2.5-familjen. Företaget har gjort Gemini 2.5 Flash och Pro allmänt tillgängliga efter framgångsrika förhandsperioder, samtidigt som Gemini 2.5 Flash-Lite nu introduceras i förhandsvisning. Flash-Lite är positionerad som Googles mest kostnadseffektiva och snabbaste 2.5-modell, optimerad för uppgifter med höga volymer och låg latens, såsom klassificering, översättning och intelligent dirigering.

Trots sitt fokus på effektivitet behåller Gemini 2.5 Flash-Lite de centrala funktionerna från 2.5-familjen, inklusive ett kontextfönster på 1 miljon token och stöd för inbyggda verktyg som Google Sök-integrering och kodexekvering. Till skillnad från andra modeller i familjen, där "tänkande" är aktiverat som standard, låter Flash-Lite utvecklare styra "tänkarbudgetar" via API-parametrar, med tänkande avstängt som standard för att optimera hastighet och kostnad.

Som ytterligare stöd för utvecklare har Google släppt Gemini CLI, en öppen AI-agent som tar Gemini direkt till terminalen. Verktyget gör det möjligt för utvecklare att använda Gemini 2.5 Pro via kommandoradsgränssnitt för kodning, problemlösning och uppgiftshantering. Eftersom Gemini CLI är öppen källkod (Apache 2.0-licens) kan utvecklare granska koden, verifiera säkerhetsaspekter och bidra till vidareutvecklingen.

Googles senaste AI-lanseringar visar företagets ambition att erbjuda utvecklare allt kraftfullare och mer flexibla verktyg i olika prisklasser och användningsområden – från högkvalitativ bildgenerering till effektiv textbearbetning och AI-assistans direkt i terminalen.

Source:

Latest News