Google har markant udvidet sine AI-muligheder med lanceringen af Imagen 4, deres hidtil mest avancerede tekst-til-billede-genereringsmodel, som nu er tilgængelig i betalt forhåndsvisning gennem Gemini API og Google AI Studio.
Imagen 4 markerer en væsentlig forbedring i forhold til tidligere versioner, især når det gælder tekstgengivelse i de genererede billeder. Lanceringen omfatter to varianter: standardmodellen Imagen 4, der koster $0,04 pr. genereret billede, og Imagen 4 Ultra til $0,06 pr. billede, som tilbyder øget præcision i opfyldelse af brugerens instruktioner. Begge modeller benytter SynthID-vandmærketeknologi, der er usynlig for det menneskelige øje, men hjælper med at identificere AI-genereret indhold.
Denne lancering er en del af Googles bredere udvidelse af Gemini 2.5-familien. Virksomheden har gjort Gemini 2.5 Flash og Pro generelt tilgængelige efter vellykkede forhåndsvisninger og introducerer samtidig Gemini 2.5 Flash-Lite i forhåndsvisning. Flash-Lite er positioneret som Googles mest omkostningseffektive og hurtigste 2.5-model, optimeret til opgaver med stort volumen og lav ventetid, såsom klassificering, oversættelse og intelligent routing.
På trods af fokus på effektivitet bevarer Gemini 2.5 Flash-Lite de centrale egenskaber fra 2.5-familien, herunder et kontekstvindue på 1 million tokens og understøttelse af indbyggede værktøjer som Google Søgning-integration og kodeeksekvering. I modsætning til andre modeller i familien, hvor tænkeevner er aktiveret som standard, giver Flash-Lite udviklere mulighed for at styre tænke-budgetter via API-parametre, hvor tænkning som udgangspunkt er slået fra for at optimere hastighed og omkostninger.
For yderligere at styrke tilbuddet til udviklere har Google lanceret Gemini CLI, en open source AI-agent, der bringer Gemini direkte til terminalen. Dette værktøj giver udviklere adgang til Gemini 2.5 Pro via kommandolinjegrænsefladen til kodning, problemløsning og opgavestyring. Gemini CLI's open source-karakter (under Apache 2.0-licens) gør det muligt for udviklere at inspicere koden, verificere sikkerhedsaspekter og bidrage til videreudviklingen.
Googles seneste AI-lanceringer understreger virksomhedens engagement i at tilbyde udviklere stadig mere kraftfulde og fleksible værktøjer på tværs af forskellige prisklasser og anvendelsesområder – fra billedgenerering i høj kvalitet til effektiv tekstbehandling og AI-assistance direkte i terminalen.