Google výrazne rozšíril svoje AI možnosti vydaním Imagen 4, svojho najpokročilejšieho modelu na generovanie obrázkov z textu, ktorý je teraz dostupný v platenej ukážke cez Gemini API a Google AI Studio.
Imagen 4 predstavuje výrazné zlepšenie oproti predchádzajúcim verziám, najmä v kvalite vykresľovania textu v generovaných obrázkoch. Vydanie zahŕňa dve varianty: štandardný model Imagen 4 s cenou 0,04 USD za výstupný obrázok a Imagen 4 Ultra za 0,06 USD za obrázok, ktorý ponúka vyššiu presnosť pri dodržiavaní používateľských inštrukcií. Obe verzie obsahujú technológiu vodoznaku SynthID, ktorá je pre ľudské oko neviditeľná, ale pomáha identifikovať AI-generovaný obsah.
Toto vydanie je súčasťou širšej expanzie rodiny modelov Gemini 2.5. Spoločnosť sprístupnila modely Gemini 2.5 Flash a Pro po úspešných testovacích obdobiach a zároveň predstavila Gemini 2.5 Flash-Lite v režime ukážky. Flash-Lite je pozicionovaný ako najúspornejší a najrýchlejší model z radu 2.5, optimalizovaný pre úlohy s vysokým objemom a nízkou latenciou, ako sú klasifikácia, preklad či inteligentné smerovanie.
Napriek dôrazu na efektivitu si Gemini 2.5 Flash-Lite zachováva kľúčové schopnosti rodiny 2.5, vrátane kontextového okna s kapacitou 1 milión tokenov a podpory natívnych nástrojov, ako je integrácia s Google Search či vykonávanie kódu. Na rozdiel od iných modelov z tejto rodiny, ktoré majú "myslenie" predvolene zapnuté, umožňuje Flash-Lite vývojárom kontrolovať rozpočet na myslenie prostredníctvom API parametrov, pričom myslenie je v predvolenom nastavení vypnuté pre optimalizáciu rýchlosti a nákladov.
Google ďalej rozširuje možnosti pre vývojárov vydaním Gemini CLI, open-source AI agenta, ktorý prináša Gemini priamo do terminálu. Tento nástroj umožňuje prístup k Gemini 2.5 Pro cez príkazový riadok na účely programovania, riešenia problémov a správy úloh. Open-source povaha Gemini CLI (pod licenciou Apache 2.0) umožňuje vývojárom kontrolovať zdrojový kód, preverovať bezpečnostné aspekty a prispievať k jeho ďalšiemu vývoju.
Najnovšie AI novinky od Googlu potvrdzujú záväzok spoločnosti poskytovať vývojárom čoraz výkonnejšie a flexibilnejšie nástroje v rôznych cenových hladinách a pre rôzne použitia – od generovania kvalitných obrázkov cez efektívne spracovanie textu až po AI asistenciu priamo v termináli.