Google představuje Imagen 4 a rozšiřuje řadu Gemini 2.5

Google uvedl Imagen 4, svůj dosud nejpokročilejší model pro převod textu na obrázek, který je nyní dostupný v placeném náhledu prostřednictvím Gemini API a Google AI Studio. Tento krok doprovází obecná dostupnost modelů Gemini 2.5 Flash a Pro a také představení Gemini 2.5 Flash-Lite, nejrychlejšího a nejúspornějšího modelu z rodiny 2.5. Vývojáři mohou nově přistupovat ke Gemini přímo z terminálu díky open-source nástroji Gemini CLI.

Google významně rozšířil své schopnosti v oblasti umělé inteligence uvedením Imagen 4, svého dosud nejpokročilejšího modelu pro generování obrázků z textu, který je nyní dostupný v placeném náhledu prostřednictvím Gemini API a Google AI Studio.

Imagen 4 představuje výrazné zlepšení oproti předchozím verzím, zejména v kvalitě vykreslování textu v generovaných obrázcích. Uvedení zahrnuje dvě varianty: standardní model Imagen 4 za cenu 0,04 USD za výstupní obrázek a Imagen 4 Ultra za 0,06 USD za obrázek, který nabízí vyšší přesnost při plnění uživatelských instrukcí. Oba modely využívají technologii SynthID pro vodoznakování, která je pro lidské oko neviditelná, ale umožňuje identifikaci obsahu vytvořeného umělou inteligencí.

Tato novinka je součástí širší expanze rodiny modelů Gemini 2.5. Společnost zpřístupnila modely Gemini 2.5 Flash a Pro po úspěšném testovacím období a zároveň představila Gemini 2.5 Flash-Lite v režimu náhledu. Flash-Lite je prezentován jako nejrychlejší a nejúspornější model řady 2.5, optimalizovaný pro úlohy s vysokým objemem dat a citlivostí na latenci, jako je klasifikace, překlad či inteligentní směrování.

Přestože je důraz kladen na efektivitu, Gemini 2.5 Flash-Lite si zachovává klíčové schopnosti rodiny 2.5, včetně kontextového okna o velikosti 1 milionu tokenů a podpory nativních nástrojů, jako je integrace s Google Search nebo spouštění kódu. Na rozdíl od ostatních modelů rodiny, které mají schopnost "myšlení" zapnutou ve výchozím nastavení, umožňuje Flash-Lite vývojářům řídit rozpočet na "myšlení" prostřednictvím parametrů API, přičemž ve výchozím stavu je tato funkce vypnutá pro optimalizaci rychlosti a nákladů.

Google dále rozšiřuje nabídku pro vývojáře uvedením Gemini CLI, open-source AI agenta, který přináší Gemini přímo do terminálu. Tento nástroj umožňuje vývojářům přístup k Gemini 2.5 Pro prostřednictvím příkazové řádky pro programování, řešení problémů a správu úkolů. Otevřený charakter Gemini CLI (licence Apache 2.0) umožňuje vývojářům kontrolovat zdrojový kód, ověřovat bezpečnostní aspekty a přispívat k jeho dalšímu rozvoji.

Nejnovější AI novinky od Googlu potvrzují závazek společnosti poskytovat vývojářům stále výkonnější a flexibilnější nástroje napříč různými cenovými hladinami a scénáři použití – od generování kvalitních obrázků přes efektivní zpracování textu až po asistenci s umělou inteligencí přímo v terminálu.

Source:

Google představuje Imagen 4 a rozšiřuje řadu Gemini 2.5

Latest News

Umělá inteligence se stává běžnou součástí života: 1,8 miliardy uživatelů po celém světě, uvádí zpráva

OpenTools.AI představuje AI News Hub pro technologické profesionály

EU odkládá příručku k dodržování AI Act až na konec roku 2025

Soudy v Georgii určují směr pro AI v justičním systému

Sutskever přebírá vedení SSI poté, co Meta přetáhla CEO Grosse

Ultraúsporné AI čipy Ambiq Micro podněcují IPO uprostřed rostoucí poptávky na trhu

Zuckerberg spouští Meta Superintelligence Labs v odvážném obratu k AI

Grok 4 od xAI bude spuštěn s pokročilými programátorskými schopnostmi

Baidu uvolňuje modely ERNIE 4.5 jako open source a vyzývá AI giganty

Google představuje Imagen 4 a rozšiřuje řadu Gemini 2.5

Related Articles

Baidu uvolňuje modely ERNIE 4.5 jako open source a vyzývá AI giganty

Grok 4 od xAI bude spuštěn s pokročilými programátorskými schopnostmi

Robotická armáda Amazonu dosáhla milionu, nový AI mozek je činí chytřejšími

Zuckerberg spouští Meta Superintelligence Labs v odvážném obratu k AI

OpenTools.AI představuje AI News Hub pro technologické profesionály

Latest News

Umělá inteligence se stává běžnou součástí života: 1,8 miliardy uživatelů po celém světě, uvádí zpráva

OpenTools.AI představuje AI News Hub pro technologické profesionály

EU odkládá příručku k dodržování AI Act až na konec roku 2025

Soudy v Georgii určují směr pro AI v justičním systému

Sutskever přebírá vedení SSI poté, co Meta přetáhla CEO Grosse

Ultraúsporné AI čipy Ambiq Micro podněcují IPO uprostřed rostoucí poptávky na trhu

Zuckerberg spouští Meta Superintelligence Labs v odvážném obratu k AI

Grok 4 od xAI bude spuštěn s pokročilými programátorskými schopnostmi

Baidu uvolňuje modely ERNIE 4.5 jako open source a vyzývá AI giganty