Google și-a extins semnificativ capabilitățile de inteligență artificială odată cu lansarea Imagen 4, cel mai avansat model de generare text-în-imagine al companiei, disponibil acum în previzualizare plătită prin Gemini API și Google AI Studio.
Imagen 4 reprezintă o îmbunătățire substanțială față de versiunile anterioare, în special în ceea ce privește calitatea redării textului în imaginile generate. Lansarea include două variante: modelul standard Imagen 4, la prețul de 0,04 USD per imagine generată, și Imagen 4 Ultra, la 0,06 USD per imagine, care oferă o precizie sporită în urmarea instrucțiunilor utilizatorului. Ambele modele includ tehnologia de watermarking SynthID, invizibilă pentru ochiul uman, dar care ajută la identificarea conținutului generat de AI.
Această lansare face parte din extinderea mai amplă a familiei de modele Gemini 2.5. Compania a făcut disponibile la scară largă modelele Gemini 2.5 Flash și Pro, după perioade de previzualizare de succes, și a introdus Gemini 2.5 Flash-Lite în regim de previzualizare. Flash-Lite este poziționat drept cel mai eficient și rapid model 2.5 al Google, optimizat pentru sarcini cu volum mare și sensibilitate la latență, precum clasificare, traducere și rutare inteligentă.
În ciuda accentului pus pe eficiență, Gemini 2.5 Flash-Lite păstrează capabilitățile cheie ale familiei 2.5, inclusiv o fereastră de context de 1 milion de tokeni și suport pentru instrumente native precum integrarea cu Google Search și execuția de cod. Spre deosebire de alte modele din familie care au activată implicit funcția de „gândire”, Flash-Lite permite dezvoltatorilor să controleze bugetul de gândire prin parametri API, cu această funcție dezactivată implicit pentru optimizarea vitezei și costurilor.
Pentru a-și îmbunătăți și mai mult oferta pentru dezvoltatori, Google a lansat Gemini CLI, un agent AI open-source care aduce Gemini direct în terminal. Acest instrument permite accesarea Gemini 2.5 Pro printr-o interfață de linie de comandă pentru programare, rezolvare de probleme și managementul sarcinilor. Natura open-source a Gemini CLI (sub licență Apache 2.0) le permite dezvoltatorilor să inspecteze codul, să verifice implicațiile de securitate și să contribuie la dezvoltarea acestuia.
Cele mai recente lansări AI ale Google demonstrează angajamentul companiei de a oferi dezvoltatorilor instrumente din ce în ce mai puternice și flexibile, adaptate diferitelor niveluri de preț și scenarii de utilizare, de la generarea de imagini de înaltă calitate până la procesarea eficientă a textului și asistență AI direct din terminal.