Google офіційно представила Gemini 2.5 Flash-Lite, що стало важливим кроком у напрямку підвищення доступності та ефективності потужного штучного інтелекту для розробників і бізнесу.
Нова модель, яку Google називає «найекономічнішою та найшвидшою моделлю 2.5», оптимізована для обробки великих обсягів даних із мінімальною затримкою. Flash-Lite виходить на ринок із найнижчою затримкою та вартістю серед моделей сімейства 2.5, пропонуючи вигідне оновлення для користувачів попередніх версій Flash 1.5 і 2.0. Вона демонструє кращу продуктивність у більшості тестів, забезпечує швидший час до першого токена та вищу швидкість декодування токенів за секунду, що робить її ідеальною для масштабних завдань, таких як класифікація чи узагальнення великих обсягів даних.
Як модель для логічних операцій, Flash-Lite дозволяє динамічно керувати «бюджетом мислення» через параметр API. На відміну від інших моделей Gemini 2.5, де мислення увімкнене за замовчуванням, Flash-Lite оптимізує витрати та швидкість, залишаючи цю функцію вимкненою, якщо її не активувати спеціально. Попри таку оптимізацію, модель підтримує всі вбудовані інструменти, включаючи інтеграцію з Google Search, виконання коду, роботу з контекстом URL та виклики функцій.
Тестування показують, що Flash-Lite працює у 1,5 раза швидше за Gemini 2.0 Flash при нижчій вартості, що робить її особливо придатною для завдань класифікації, перекладу, інтелектуального маршрутизації та інших масштабних і чутливих до вартості операцій. На відміну від інших моделей, які за замовчуванням використовують потужніші (і дорожчі) інструменти логічного мислення для відповідей на запитання, Flash-Lite дає розробникам контроль над цим процесом. Користувачі можуть вмикати або вимикати функцію мислення залежно від своїх потреб, і навіть при високій економічності Flash-Lite не обмежена у своїх можливостях.
Попередня версія Gemini 2.5 Flash-Lite вже доступна у Google AI Studio та Vertex AI разом із стабільними версіями 2.5 Flash і Pro. Обидві моделі — 2.5 Flash і Pro — також доступні у додатку Gemini, а Google інтегрувала спеціальні версії Flash-Lite і Flash у Пошук.
Це стратегічне розширення сімейства моделей Gemini демонструє прагнення Google демократизувати штучний інтелект, пропонуючи рішення, що поєднують продуктивність, вартість і швидкість для різних сценаріїв використання — від складних логічних завдань до обробки великих обсягів даних.