Google DeepMind офіційно запустила Imagen 4 — свою найсучаснішу модель для генерації зображень на основі тексту, яка надає розробникам потужні нові інструменти для створення AI-візуалізацій.
Реліз, що став доступним 15 липня через Gemini API та Google AI Studio, включає дві окремі моделі в лінійці Imagen 4. Стандартна модель Imagen 4, вартістю $0,04 за одне зображення, є флагманською пропозицією Google для широкого спектру завдань генерації зображень. Для більш вимогливих застосувань, які потребують максимальної точності у відтворенні текстових підказок, Imagen 4 Ultra пропонує розширені можливості за $0,06 за зображення.
Imagen 4 є суттєвим кроком вперед у порівнянні з попередньою версією. Google підкреслює її «вражаючу чіткість у дрібних деталях», таких як складні текстури тканин, краплі води та хутро тварин. Модель відмінно працює як у фотореалістичних, так і в абстрактних стилях, підтримує різні співвідношення сторін і роздільну здатність до 2K.
Особливо важливо, що Imagen 4 вирішує давню проблему генерації тексту на зображеннях завдяки суттєво покращеному відтворенню шрифтів і написів. Це робить технологію надзвичайно цінною для створення маркетингових матеріалів, постерів, запрошень, коміксів та інших візуалів, які поєднують зображення і текст.
«Imagen 4 — це величезний крок уперед у якості», — зазначає Джош Вудвард, керівник групи Google Labs. «Ми приділили багато уваги тому, як модель генерує текст і типографіку, тож вона чудово підходить для створення слайдів, запрошень чи будь-яких інших матеріалів, де потрібно поєднувати зображення і текст».
Інтеграція технології в екосистему Google, включно з додатками Workspace, дозволяє підвищити продуктивність у різних творчих і професійних процесах. Google також повідомила, що найближчими тижнями з’являться додаткові тарифи, а для охочих буде доступне підвищення лімітів використання. Компанія планує випустити й швидшу версію Imagen 4, яка працюватиме до десяти разів швидше за Imagen 3.