menu
close

Google представила Imagen 4 и расширила линейку Gemini 2.5

Google выпустила Imagen 4 — свою самую продвинутую на сегодняшний день модель генерации изображений по текстовому описанию, которая теперь доступна в платном предварительном просмотре через Gemini API и Google AI Studio. Запуск совпал с общедоступным релизом моделей Gemini 2.5 Flash и Pro, а также с анонсом Gemini 2.5 Flash-Lite — самой быстрой и экономичной модели семейства 2.5. Разработчики также получили возможность работать с Gemini напрямую из терминала благодаря новому open-source инструменту Gemini CLI.
Google представила Imagen 4 и расширила линейку Gemini 2.5

Google значительно расширила свои возможности в области искусственного интеллекта с выпуском Imagen 4 — самой совершенной модели генерации изображений по тексту, теперь доступной в платном предварительном просмотре через Gemini API и Google AI Studio.

Imagen 4 представляет собой значительный шаг вперёд по сравнению с предыдущими версиями, особенно в части качества отображения текста на сгенерированных изображениях. Выпуск включает две версии: стандартную Imagen 4 по цене $0,04 за одно изображение и Imagen 4 Ultra по $0,06 за изображение, которая отличается повышенной точностью следования пользовательским инструкциям. Обе модели оснащены технологией водяных знаков SynthID, невидимых для человеческого глаза, но позволяющих идентифицировать контент, созданный ИИ.

Этот релиз стал частью более широкой экспансии семейства моделей Gemini 2.5. После успешного периода предварительного тестирования Google сделала модели Gemini 2.5 Flash и Pro общедоступными, а также представила Gemini 2.5 Flash-Lite в режиме предварительного просмотра. Flash-Lite позиционируется как самая быстрая и экономичная модель 2.5, оптимизированная для задач с большим объёмом данных и низкой задержкой, таких как классификация, перевод и интеллектуальная маршрутизация.

Несмотря на акцент на эффективность, Gemini 2.5 Flash-Lite сохраняет ключевые возможности семейства 2.5, включая контекстное окно на 1 миллион токенов и поддержку встроенных инструментов, таких как интеграция с Google Search и выполнение кода. В отличие от других моделей семейства, где "мышление" включено по умолчанию, в Flash-Lite разработчики могут управлять бюджетом "мышления" через параметры API, при этом по умолчанию эта функция отключена для максимизации скорости и снижения стоимости.

В дополнение к этому Google выпустила Gemini CLI — open-source AI-агент, который позволяет работать с Gemini прямо из терминала. Этот инструмент предоставляет доступ к Gemini 2.5 Pro через командную строку для программирования, решения задач и управления проектами. Открытый исходный код Gemini CLI (лицензия Apache 2.0) позволяет разработчикам изучать код, проверять вопросы безопасности и вносить вклад в развитие проекта.

Последние релизы Google в области ИИ демонстрируют стремление компании предоставлять разработчикам всё более мощные и гибкие инструменты для различных сценариев использования и ценовых категорий — от высококачественной генерации изображений до эффективной обработки текста и терминальных AI-ассистентов.

Source:

Latest News