Google DeepMind официально представила Imagen 4 — свою самую совершенную на сегодняшний день модель генерации изображений по тексту, предоставляя разработчикам новые мощные инструменты для создания визуального контента с помощью ИИ.
Релиз, который стал доступен 15 июля через Gemini API и Google AI Studio, включает два отдельных варианта модели Imagen 4. Базовая версия Imagen 4, стоимостью $0,04 за одно сгенерированное изображение, является флагманским продуктом Google для широкого спектра задач генерации изображений. Для более требовательных сценариев, где необходима точная передача текстовых запросов, предусмотрена версия Imagen 4 Ultra с расширенными возможностями по цене $0,06 за изображение.
Imagen 4 представляет собой значительный шаг вперёд по сравнению с предыдущей версией. Google отмечает «поразительную чёткость мельчайших деталей», таких как сложные ткани, капли воды и шерсть животных. Модель отлично справляется как с фотореалистичными, так и с абстрактными стилями, поддерживает различные соотношения сторон и разрешения вплоть до 2K.
Особое внимание в Imagen 4 уделено качеству отображения текста — одной из главных проблем в генерации изображений с помощью ИИ. Существенно улучшенная работа с текстом делает технологию особенно ценной для создания маркетинговых материалов, постеров, приглашений, комиксов и других визуальных продуктов, сочетающих изображения и надписи.
«Imagen 4 — это огромный шаг вперёд по качеству», — отметил Джош Вудвард, руководитель группы Google Labs. — «Мы уделили много внимания и внесли множество исправлений в то, как модель генерирует текст и типографику, поэтому она идеально подходит для создания слайдов, приглашений и любых других материалов, где нужно гармонично сочетать изображения и текст».
Интеграция технологии в экосистему Google, включая приложения Workspace, позволит повысить продуктивность в различных творческих и профессиональных сценариях. Компания также сообщила, что в ближайшие недели появятся дополнительные тарифные планы, а для крупных клиентов будут доступны повышенные лимиты запросов. Кроме того, Google планирует выпустить более быструю версию Imagen 4, которая сможет работать до десяти раз быстрее, чем Imagen 3.