menu
close

Google predstavlja Imagen 4 i proširuje Gemini 2.5 liniju modela

Google je lansirao Imagen 4, svoj najnapredniji model za generiranje slika na temelju teksta, koji je sada dostupan u plaćenom pregledu putem Gemini API-ja i Google AI Studija. Ovo lansiranje poklapa se s općom dostupnošću Gemini 2.5 Flash i Pro modela, uz predstavljanje Gemini 2.5 Flash-Lite, najisplativijeg i najbržeg modela u obitelji 2.5. Programeri sada mogu pristupiti Geminiju izravno iz terminala zahvaljujući novom open-source Gemini CLI alatu.
Google predstavlja Imagen 4 i proširuje Gemini 2.5 liniju modela

Google je značajno proširio svoje AI mogućnosti predstavljanjem Imagen 4, svog najnaprednijeg modela za generiranje slika na temelju teksta, koji je sada dostupan u plaćenom pregledu putem Gemini API-ja i Google AI Studija.

Imagen 4 donosi znatna poboljšanja u odnosu na prethodne verzije, osobito u kvaliteti prikaza teksta unutar generiranih slika. Lansiranje uključuje dvije varijante: standardni Imagen 4 model po cijeni od 0,04 USD po generiranoj slici te Imagen 4 Ultra po cijeni od 0,06 USD po slici, koji nudi veću preciznost u praćenju korisničkih uputa. Oba modela koriste SynthID tehnologiju vodenog žiga, koja je nevidljiva ljudskom oku, ali omogućuje identifikaciju AI-generiranog sadržaja.

Ovo lansiranje dio je šireg proširenja Googleove Gemini 2.5 obitelji modela. Tvrtka je nakon uspješnog razdoblja testiranja općenito učinila dostupnima Gemini 2.5 Flash i Pro modele, dok je Gemini 2.5 Flash-Lite predstavljen u preview verziji. Flash-Lite je pozicioniran kao najisplativiji i najbrži 2.5 model, optimiziran za zadatke velikog obujma i osjetljive na latenciju, poput klasifikacije, prevođenja i inteligentnog usmjeravanja.

Unatoč naglasku na učinkovitosti, Gemini 2.5 Flash-Lite zadržava ključne mogućnosti obitelji 2.5, uključujući kontekstualni prozor od milijun tokena i podršku za izvorne alate poput integracije s Google pretraživanjem i izvršavanja koda. Za razliku od ostalih modela iz obitelji, kod kojih su "thinking" mogućnosti uključene po defaultu, Flash-Lite omogućuje programerima kontrolu nad "thinking" budžetom putem API parametara, pri čemu je ova opcija isključena po defaultu radi optimizacije brzine i troškova.

Kako bi dodatno unaprijedio ponudu za programere, Google je predstavio Gemini CLI, open-source AI agenta koji Geminija dovodi izravno u terminal. Ovaj alat omogućuje pristup Gemini 2.5 Pro modelu putem naredbenog retka za kodiranje, rješavanje problema i upravljanje zadacima. Open-source priroda Gemini CLI-ja (pod Apache 2.0 licencom) omogućuje programerima pregled koda, provjeru sigurnosnih implikacija i doprinos razvoju alata.

Najnovija AI izdanja iz Googlea potvrđuju predanost tvrtke pružanju sve moćnijih i fleksibilnijih alata programerima, na različitim cjenovnim razinama i za razne namjene – od visokokvalitetnog generiranja slika, preko učinkovitog procesiranja teksta, do AI asistencije iz terminala.

Source:

Latest News