Google суттєво розширила свої можливості у сфері штучного інтелекту, випустивши Imagen 4 — свою найпотужнішу на сьогодні модель генерації зображень за текстовим описом. Вона вже доступна у платному попередньому перегляді через Gemini API та Google AI Studio.
Imagen 4 демонструє значний прогрес порівняно з попередніми версіями, особливо у якості відображення тексту на згенерованих зображеннях. Випуск включає дві версії: стандартну Imagen 4 за ціною $0,04 за одне зображення та Imagen 4 Ultra за $0,06 за зображення, яка відрізняється підвищеною точністю виконання інструкцій користувача. Обидві моделі оснащені технологією водяних знаків SynthID, яка є невидимою для людського ока, але дозволяє ідентифікувати контент, створений ШІ.
Цей реліз є частиною масштабного розширення сімейства моделей Gemini 2.5. Після успішного періоду попереднього тестування компанія зробила Gemini 2.5 Flash і Pro загальнодоступними, а також представила Gemini 2.5 Flash-Lite у режимі попереднього перегляду. Flash-Lite позиціонується як найдешевша та найшвидша модель Google у лінійці 2.5, оптимізована для задач із великим обсягом даних і чутливістю до затримок, таких як класифікація, переклад і інтелектуальний роутинг.
Попри акцент на ефективності, Gemini 2.5 Flash-Lite зберігає ключові можливості сімейства 2.5, зокрема контекстне вікно на 1 мільйон токенів і підтримку вбудованих інструментів, як-от інтеграція з Google Search і виконання коду. На відміну від інших моделей сімейства, у яких "мислення" увімкнене за замовчуванням, у Flash-Lite розробники можуть керувати бюджетом на "мислення" через параметри API, причому ця функція вимкнена за замовчуванням для оптимізації швидкості та вартості.
Щоб ще більше розширити можливості для розробників, Google випустила Gemini CLI — open-source агент ШІ, який дозволяє працювати з Gemini безпосередньо у терміналі. За допомогою цього інструменту розробники можуть отримувати доступ до Gemini 2.5 Pro через командний рядок для програмування, вирішення задач і керування завданнями. Відкритий код Gemini CLI (ліцензія Apache 2.0) дає змогу перевіряти безпеку, аналізувати роботу інструменту та долучатися до його розвитку.
Останні релізи ШІ від Google демонструють прагнення компанії надавати розробникам дедалі потужніші та гнучкі інструменти для різних цінових категорій і сценаріїв використання — від генерації високоякісних зображень до ефективної обробки тексту та роботи зі штучним інтелектом у терміналі.