menu
close

Google представя Imagen 4 с революционно рендиране на текст

Google пусна Imagen 4 – най-усъвършенствания си модел за генериране на изображения от текст досега, който ще бъде достъпен за разработчици чрез Gemini API и Google AI Studio от 15 юли 2025 г. Новата версия предлага значителни подобрения в качеството на изображенията, особено при рендирането на текст, и въвежда два варианта на модела за различни творчески нужди. Технологията позволява създаване на изключително детайлни визуализации по текстови описания с приложения в дизайна, маркетинга, развлеченията и други креативни сфери.
Google представя Imagen 4 с революционно рендиране на текст

Google DeepMind официално представи Imagen 4 – най-усъвършенствания си модел за генериране на изображения от текст, предоставяйки на разработчиците мощни нови инструменти за създаване на AI-визуализации.

Пускането на Imagen 4, което стана достъпно на 15 юли чрез Gemini API и Google AI Studio, въвежда два отделни модела в семейството Imagen 4. Стандартният модел Imagen 4, с цена от 0,04 щ.д. на генерирано изображение, е водещото предложение на Google за широк спектър от задачи по създаване на изображения. За по-взискателни приложения, изискващи прецизно следване на текстовите подсказки, Imagen 4 Ultra предлага разширени възможности на цена от 0,06 щ.д. на изображение.

Imagen 4 представлява значителен напредък спрямо предишната версия, като Google подчертава „забележителната яснота при фините детайли“ като сложни тъкани, водни капки и животинска козина. Моделът се отличава както във фотореалистични, така и в абстрактни стилове, поддържа различни съотношения и резолюции до 2K.

Най-впечатляващото подобрение в Imagen 4 е драматичното усъвършенстване на рендирането на текст – дългогодишно предизвикателство при AI-генерираните изображения. Това прави технологията особено ценна за създаване на маркетингови материали, плакати, покани, комикси и други визуализации, които комбинират изображения и текст.

„Imagen 4 е огромна крачка напред в качеството“, коментира Джош Уудуърд, ръководител на групата Google Labs. „Обърнахме специално внимание и направихме много подобрения в начина, по който се генерира текст и типография, така че моделът е чудесен за създаване на слайдове, покани или всякакви други материали, където е нужно да се съчетаят изображения и текст.“

Интеграцията на технологията в екосистемата на Google, включително приложенията от Workspace, я позиционира като инструмент за повишаване на продуктивността в различни творчески и професионални процеси. Google посочва, че в следващите седмици ще бъдат въведени допълнителни ценови нива, а при заявка ще се предлагат и по-високи лимити за заявки. Компанията планира и пускането на по-бърз вариант на Imagen 4, който може да работи до десет пъти по-бързо от Imagen 3.

Source:

Latest News