Google тихо, но существенно обновила свою модель Imagen 4 Ultra, закрепив за ней статус одной из ведущих в мире систем генерации изображений на базе искусственного интеллекта. Обновленная модель теперь занимает третье место в рейтинге Image Arena от Artificial Analysis, став прямым конкурентом лидеров отрасли — GPT-4o от OpenAI и Seedream 3.0 от ByteDance.
Впервые представленная на Google I/O 2025 в мае, Imagen 4 Ultra стала значительным шагом вперед по сравнению с предыдущей версией. Модель превосходно справляется с прорисовкой сложных деталей, таких как текстуры тканей, капли воды и шерсть животных, обеспечивая исключительную четкость. Пользователи отмечают заметные улучшения как в фотореалистичных, так и в абстрактных стилях изображений, при этом модель способна генерировать картинки с разрешением до 2K.
Одним из наиболее заметных улучшений Imagen 4 Ultra стало решение давней проблемы генерации текста на изображениях. Модель демонстрирует значительно улучшенные типографские возможности, что делает её особенно ценной для создания поздравительных открыток, постеров и других дизайнов, сочетающих изображения и текст.
Google предоставляет доступ к Imagen 4 Ultra через несколько каналов, включая приложение Gemini, Google AI Studio и Vertex AI для корпоративных клиентов. При стоимости $0,06 за одно сгенерированное изображение, модель предлагает конкурентоспособную ценовую политику по сравнению с GPT-4o (примерно $0,17 за изображение), а время генерации составляет около 9,5 секунд против 53 секунд у GPT-4o.
Это обновление свидетельствует о стремлении Google конкурировать на высшем уровне в сфере генеративного ИИ. По мнению отраслевых аналитиков, постоянное совершенствование семейства Imagen подразделением Google DeepMind подтверждает приверженность компании к расширению границ возможного в области визуального контента, создаваемого искусственным интеллектом.
В будущем Google планирует сосредоточиться на внедрении обратной связи от пользователей для дальнейшего повышения возможностей Imagen 4 Ultra, а также на снижении времени генерации. Компания также разрабатывает версию "Fast" для Imagen 4, которая обещает быть до 10 раз быстрее Imagen 3, что значительно повысит её применимость для задач в реальном времени.