Google DeepMind официално представи Imagen 4 – най-усъвършенствания си модел за генериране на изображения от текст, предоставяйки на разработчиците мощни нови инструменти за създаване на AI-визуализации.
Пускането на Imagen 4, което стана достъпно на 15 юли чрез Gemini API и Google AI Studio, въвежда два отделни модела в семейството Imagen 4. Стандартният модел Imagen 4, с цена от 0,04 щ.д. на генерирано изображение, е водещото предложение на Google за широк спектър от задачи по създаване на изображения. За по-взискателни приложения, изискващи прецизно следване на текстовите подсказки, Imagen 4 Ultra предлага разширени възможности на цена от 0,06 щ.д. на изображение.
Imagen 4 представлява значителен напредък спрямо предишната версия, като Google подчертава „забележителната яснота при фините детайли“ като сложни тъкани, водни капки и животинска козина. Моделът се отличава както във фотореалистични, така и в абстрактни стилове, поддържа различни съотношения и резолюции до 2K.
Най-впечатляващото подобрение в Imagen 4 е драматичното усъвършенстване на рендирането на текст – дългогодишно предизвикателство при AI-генерираните изображения. Това прави технологията особено ценна за създаване на маркетингови материали, плакати, покани, комикси и други визуализации, които комбинират изображения и текст.
„Imagen 4 е огромна крачка напред в качеството“, коментира Джош Уудуърд, ръководител на групата Google Labs. „Обърнахме специално внимание и направихме много подобрения в начина, по който се генерира текст и типография, така че моделът е чудесен за създаване на слайдове, покани или всякакви други материали, където е нужно да се съчетаят изображения и текст.“
Интеграцията на технологията в екосистемата на Google, включително приложенията от Workspace, я позиционира като инструмент за повишаване на продуктивността в различни творчески и професионални процеси. Google посочва, че в следващите седмици ще бъдат въведени допълнителни ценови нива, а при заявка ще се предлагат и по-високи лимити за заявки. Компанията планира и пускането на по-бърз вариант на Imagen 4, който може да работи до десет пъти по-бързо от Imagen 3.