menu
close

Google predstavuje Imagen 4 a rozširuje rad Gemini 2.5

Google uviedol Imagen 4, svoj najpokročilejší model na generovanie obrázkov z textu, ktorý je teraz dostupný v platenej ukážke prostredníctvom Gemini API a Google AI Studio. Tento krok sprevádza všeobecná dostupnosť modelov Gemini 2.5 Flash a Pro, spolu s predstavením Gemini 2.5 Flash-Lite – najrýchlejšieho a najúspornejšieho modelu z rodiny 2.5. Vývojári môžu navyše využívať Gemini priamo v termináli vďaka novo vydanému open-source Gemini CLI.
Google predstavuje Imagen 4 a rozširuje rad Gemini 2.5

Google výrazne rozšíril svoje AI možnosti vydaním Imagen 4, svojho najpokročilejšieho modelu na generovanie obrázkov z textu, ktorý je teraz dostupný v platenej ukážke cez Gemini API a Google AI Studio.

Imagen 4 predstavuje výrazné zlepšenie oproti predchádzajúcim verziám, najmä v kvalite vykresľovania textu v generovaných obrázkoch. Vydanie zahŕňa dve varianty: štandardný model Imagen 4 s cenou 0,04 USD za výstupný obrázok a Imagen 4 Ultra za 0,06 USD za obrázok, ktorý ponúka vyššiu presnosť pri dodržiavaní používateľských inštrukcií. Obe verzie obsahujú technológiu vodoznaku SynthID, ktorá je pre ľudské oko neviditeľná, ale pomáha identifikovať AI-generovaný obsah.

Toto vydanie je súčasťou širšej expanzie rodiny modelov Gemini 2.5. Spoločnosť sprístupnila modely Gemini 2.5 Flash a Pro po úspešných testovacích obdobiach a zároveň predstavila Gemini 2.5 Flash-Lite v režime ukážky. Flash-Lite je pozicionovaný ako najúspornejší a najrýchlejší model z radu 2.5, optimalizovaný pre úlohy s vysokým objemom a nízkou latenciou, ako sú klasifikácia, preklad či inteligentné smerovanie.

Napriek dôrazu na efektivitu si Gemini 2.5 Flash-Lite zachováva kľúčové schopnosti rodiny 2.5, vrátane kontextového okna s kapacitou 1 milión tokenov a podpory natívnych nástrojov, ako je integrácia s Google Search či vykonávanie kódu. Na rozdiel od iných modelov z tejto rodiny, ktoré majú "myslenie" predvolene zapnuté, umožňuje Flash-Lite vývojárom kontrolovať rozpočet na myslenie prostredníctvom API parametrov, pričom myslenie je v predvolenom nastavení vypnuté pre optimalizáciu rýchlosti a nákladov.

Google ďalej rozširuje možnosti pre vývojárov vydaním Gemini CLI, open-source AI agenta, ktorý prináša Gemini priamo do terminálu. Tento nástroj umožňuje prístup k Gemini 2.5 Pro cez príkazový riadok na účely programovania, riešenia problémov a správy úloh. Open-source povaha Gemini CLI (pod licenciou Apache 2.0) umožňuje vývojárom kontrolovať zdrojový kód, preverovať bezpečnostné aspekty a prispievať k jeho ďalšiemu vývoju.

Najnovšie AI novinky od Googlu potvrdzujú záväzok spoločnosti poskytovať vývojárom čoraz výkonnejšie a flexibilnejšie nástroje v rôznych cenových hladinách a pre rôzne použitia – od generovania kvalitných obrázkov cez efektívne spracovanie textu až po AI asistenciu priamo v termináli.

Source:

Latest News