Google запустила предварительную версию Gemini 2.5 Flash — новейшей итерации своей эффективной модели искусственного интеллекта, сочетающей производительность с высокой скоростью и экономичностью.
Основываясь на успехе Gemini 2.0 Flash, новая модель 2.5 Flash предлагает значительный скачок в возможностях рассуждения, сохраняя при этом репутацию эффективной системы. Google описывает её как «значительное улучшение в возможностях рассуждения при сохранении приоритета скорости и стоимости».
Ключевая особенность Gemini 2.5 Flash — гибридная система рассуждения. Это первая полностью гибридная модель рассуждения от Google, позволяющая разработчикам включать или отключать процесс мышления, а также устанавливать лимиты на рассуждение для оптимизации баланса между качеством, стоимостью и задержкой. Такой инновационный подход даёт разработчикам беспрецедентный контроль над тем, как модель обрабатывает сложные задачи.
На практике это означает, что разработчики могут задавать «бюджет на рассуждение», определяя, сколько рассуждений выполнит модель. Можно регулировать «количество токенов, которые модель может сгенерировать в процессе рассуждения» от 0 до 24 576 с помощью ползунка в Google AI Studio и Vertex AI или через параметр API. Если бюджет на рассуждение установлен на ноль, стоимость и задержка работы модели совпадают с Gemini 2.0 Flash.
Стоимость отражает эту гибкость: входные токены стоят 15 центов за миллион, выходные — 60 центов за миллион без рассуждения. При активации режима мышления цена увеличивается до $3,50 за миллион токенов.
Тесты производительности демонстрируют впечатляющие результаты. Gemini 2.5 Flash «показывает отличные результаты на сложных запросах в LMArena, уступая только 2.5 Pro» и «имеет сопоставимые метрики с ведущими моделями при существенно меньших стоимости и размере», продолжая «оставаться лидером по соотношению цены и производительности».
Google называет 2.5 Flash своей «самой эффективной рабочей моделью, предназначенной для скорости и низкой стоимости», отмечая, что она «улучшилась по ключевым показателям рассуждения, мультимодальности, работы с кодом и длинным контекстом, став ещё более эффективной и используя на 20–30% меньше токенов» по результатам тестов.
Новая модель уже доступна в режиме предварительного просмотра по нескольким каналам. Она внедряется «в Google AI Studio (для разработчиков), Vertex AI (для корпоративных клиентов) и приложении Gemini (для всех пользователей)». Согласно анонсам Google на I/O 2025, обновлённая версия будет «общедоступна в Google AI Studio для разработчиков и в Vertex AI для предприятий в начале июня», а Gemini 2.5 Pro появится «вскоре после этого».
По мере того как Google продолжает расширять возможности искусственного интеллекта, Gemini 2.5 Flash становится важным шагом на пути к более доступному и экономичному продвинутому рассуждению для разработчиков и пользователей.