menu
close

Google představuje Imagen 4 a rozšiřuje řadu Gemini 2.5

Google uvedl Imagen 4, svůj dosud nejpokročilejší model pro převod textu na obrázek, který je nyní dostupný v placeném náhledu prostřednictvím Gemini API a Google AI Studio. Tento krok doprovází obecná dostupnost modelů Gemini 2.5 Flash a Pro a také představení Gemini 2.5 Flash-Lite, nejrychlejšího a nejúspornějšího modelu z rodiny 2.5. Vývojáři mohou nově přistupovat ke Gemini přímo z terminálu díky open-source nástroji Gemini CLI.
Google představuje Imagen 4 a rozšiřuje řadu Gemini 2.5

Google významně rozšířil své schopnosti v oblasti umělé inteligence uvedením Imagen 4, svého dosud nejpokročilejšího modelu pro generování obrázků z textu, který je nyní dostupný v placeném náhledu prostřednictvím Gemini API a Google AI Studio.

Imagen 4 představuje výrazné zlepšení oproti předchozím verzím, zejména v kvalitě vykreslování textu v generovaných obrázcích. Uvedení zahrnuje dvě varianty: standardní model Imagen 4 za cenu 0,04 USD za výstupní obrázek a Imagen 4 Ultra za 0,06 USD za obrázek, který nabízí vyšší přesnost při plnění uživatelských instrukcí. Oba modely využívají technologii SynthID pro vodoznakování, která je pro lidské oko neviditelná, ale umožňuje identifikaci obsahu vytvořeného umělou inteligencí.

Tato novinka je součástí širší expanze rodiny modelů Gemini 2.5. Společnost zpřístupnila modely Gemini 2.5 Flash a Pro po úspěšném testovacím období a zároveň představila Gemini 2.5 Flash-Lite v režimu náhledu. Flash-Lite je prezentován jako nejrychlejší a nejúspornější model řady 2.5, optimalizovaný pro úlohy s vysokým objemem dat a citlivostí na latenci, jako je klasifikace, překlad či inteligentní směrování.

Přestože je důraz kladen na efektivitu, Gemini 2.5 Flash-Lite si zachovává klíčové schopnosti rodiny 2.5, včetně kontextového okna o velikosti 1 milionu tokenů a podpory nativních nástrojů, jako je integrace s Google Search nebo spouštění kódu. Na rozdíl od ostatních modelů rodiny, které mají schopnost "myšlení" zapnutou ve výchozím nastavení, umožňuje Flash-Lite vývojářům řídit rozpočet na "myšlení" prostřednictvím parametrů API, přičemž ve výchozím stavu je tato funkce vypnutá pro optimalizaci rychlosti a nákladů.

Google dále rozšiřuje nabídku pro vývojáře uvedením Gemini CLI, open-source AI agenta, který přináší Gemini přímo do terminálu. Tento nástroj umožňuje vývojářům přístup k Gemini 2.5 Pro prostřednictvím příkazové řádky pro programování, řešení problémů a správu úkolů. Otevřený charakter Gemini CLI (licence Apache 2.0) umožňuje vývojářům kontrolovat zdrojový kód, ověřovat bezpečnostní aspekty a přispívat k jeho dalšímu rozvoji.

Nejnovější AI novinky od Googlu potvrzují závazek společnosti poskytovat vývojářům stále výkonnější a flexibilnější nástroje napříč různými cenovými hladinami a scénáři použití – od generování kvalitních obrázků přes efektivní zpracování textu až po asistenci s umělou inteligencí přímo v terminálu.

Source:

Latest News