Google объявила, что Gemini 2.5 Flash и 2.5 Pro теперь стабильны и доступны для всех, предоставляя организациям надёжность и масштабируемость, необходимые для уверенного внедрения передовых ИИ-возможностей в критически важные приложения. Вместе с этими релизами компания представила Gemini 2.5 Flash-Lite в предварительном просмотре, назвав её самой быстрой и экономичной моделью серии 2.5 на сегодняшний день.
Gemini 2.5 Flash-Lite — это модель рассуждений, позволяющая гибко управлять "бюджетом мышления" с помощью параметра API. В отличие от других моделей семейства 2.5, Flash-Lite оптимизирована по стоимости и скорости с отключённым по умолчанию режимом "мышления". Несмотря на эти оптимизации, модель поддерживает все встроенные инструменты, включая Grounding с Google Search, выполнение кода и работу с контекстом по URL, а также вызов функций.
Flash-Lite обеспечивает более высокую производительность по сравнению с предыдущей версией Flash-Lite и работает в 1,5 раза быстрее, чем 2.0 Flash, при меньших затратах. Она специально разработана для массовых задач, чувствительных к задержке, таких как перевод, классификация, интеллектуальная маршрутизация и другие операции, требующие высокой масштабируемости и низкой стоимости.
Модель демонстрирует значительно лучшие результаты, чем 2.0 Flash-Lite, по тестам на программирование, математику, науку, рассуждения и мультимодальные задачи, что делает её идеальной для массовых сценариев использования.
Как и другие модели семейства Gemini 2.5, Flash-Lite обладает полезными возможностями, включая настройку "мышления" на разных уровнях, подключение к инструментам вроде Grounding с Google Search и выполнению кода, поддержку мультимодального ввода и контекст до 1 миллиона токенов.
Для обеспечения актуальности и достоверности ответов Flash-Lite может использовать Google Search как встроенный инструмент, самостоятельно определяя, когда обращаться к поиску для расширения своих знаний.
Помимо запуска Flash-Lite, Google объявила, что Gemini 2.5 Pro стала лидером мировых рейтингов WebDev Arena и LMArena. С ELO-оценкой 1415 в рейтинге программирования WebDev Arena она занимает первое место во всех рейтингах LMArena, где оцениваются предпочтения людей по разным направлениям.
Кроме того, Google интегрировала LearnLM непосредственно в Gemini 2.5, сделав её ведущей моделью для обучения в мире. Согласно последнему отчёту компании, Gemini 2.5 Pro превзошла конкурентов по всем категориям принципов образовательных наук, а преподаватели и эксперты в области педагогики предпочли её другим решениям в различных образовательных сценариях.
Gemini 2.5 Flash-Lite уже доступна в предварительном просмотре в Google AI Studio и Vertex AI наряду со стабильными версиями 2.5 Flash и Pro. Разработчики могут получить доступ к модели (gemini-2.5-flash-lite-preview-06-17) через Google Gen AI SDK, который предоставляет единый интерфейс ко всему семейству моделей Gemini 2.5 как через API для разработчиков Gemini, так и через Vertex AI Gemini API.