menu
close

Google představuje Imagen 4 s revolučním vykreslováním textu

Google uvedl Imagen 4, svůj dosud nejpokročilejší AI model pro převod textu na obraz, který bude vývojářům k dispozici prostřednictvím Gemini API a Google AI Studia od 15. července 2025. Nejnovější verze přináší výrazné zlepšení kvality generovaných obrázků, zejména v oblasti vykreslování textu, a nabízí dvě varianty modelu pro různé kreativní potřeby. Technologie umožňuje vývojářům vytvářet vysoce detailní vizuály na základě textových popisů s využitím v designu, marketingu, zábavě a dalších kreativních oblastech.
Google představuje Imagen 4 s revolučním vykreslováním textu

Google DeepMind oficiálně spustil Imagen 4, svůj dosud nejsofistikovanější model pro generování obrázků z textu, který vývojářům nabízí nové výkonné nástroje pro tvorbu vizuálů generovaných umělou inteligencí.

Tato novinka, která je od 15. července dostupná prostřednictvím Gemini API i Google AI Studia, představuje dvě odlišné varianty v rámci rodiny Imagen 4. Standardní model Imagen 4, oceněný na 0,04 USD za výstupní obrázek, slouží jako vlajková loď Googlu pro širokou škálu úloh generování obrázků. Pro náročnější aplikace, které vyžadují přesné dodržení textových zadání, je k dispozici Imagen 4 Ultra s rozšířenými schopnostmi za 0,06 USD za obrázek.

Imagen 4 znamená významný posun oproti svému předchůdci; Google zdůrazňuje jeho „pozoruhodnou ostrost v jemných detailech“, jako jsou složité látky, kapky vody nebo zvířecí srst. Model vyniká jak ve fotorealistických, tak v abstraktních stylech a podporuje různé poměry stran i rozlišení až do 2K.

Pravděpodobně nejzásadnější inovací je výrazně vylepšené vykreslování textu, které řeší dlouhodobý problém AI generování obrázků. Díky tomu je technologie obzvlášť cenná pro tvorbu marketingových materiálů, plakátů, pozvánek, komiksů a dalších vizuálů kombinujících obraz a text.

„Imagen 4 je obrovský krok vpřed v kvalitě,“ uvedl Josh Woodward, vedoucí skupiny Google Labs. „Věnovali jsme velkou pozornost tomu, jak model generuje text a typografii, takže je skvělý pro tvorbu slidů, pozvánek nebo čehokoli, kde potřebujete kombinovat obraz a text.“

Integrace technologie do ekosystému Googlu, včetně aplikací Workspace, ji předurčuje ke zvýšení produktivity v různých kreativních i profesionálních pracovních postupech. Google také avizoval, že v následujících týdnech zavede další úrovně účtování s vyššími limity na požádání. Společnost navíc plánuje vydat rychlejší variantu Imagen 4, která by mohla být až desetkrát rychlejší než Imagen 3.

Source:

Latest News