Google запустила попередню версію Gemini 2.5 Flash — новітню ітерацію своєї ефективної AI-моделі, створеної для оптимального балансу між продуктивністю, швидкістю та економічністю.
Базуючись на основі Gemini 2.0 Flash, нова модель 2.5 Flash забезпечує суттєве покращення можливостей міркування, зберігаючи при цьому репутацію ефективної технології. Google описує її як «значне оновлення можливостей міркування, при цьому пріоритет залишається на швидкості та вартості».
Головна особливість Gemini 2.5 Flash — це гібридна система міркування. Це перша повністю гібридна модель міркування від Google, яка дозволяє розробникам вмикати або вимикати мислення, а також встановлювати бюджети мислення для оптимізації балансу між якістю, вартістю та затримкою. Такий інноваційний підхід надає розробникам безпрецедентний контроль над тим, як модель обробляє складні завдання.
На практиці це означає, що розробники можуть задавати «бюджет мислення», який визначає, скільки міркувань виконує модель. Вони можуть регулювати «кількість токенів, які модель може згенерувати під час мислення» — від 0 до 24 576 токенів за допомогою повзунка у Google AI Studio та Vertex AI або через параметр API. Якщо бюджет мислення встановлено на нуль, модель відповідає вартості та затримці Gemini 2.0 Flash.
Ціноутворення відображає цю гнучкість: вхідні токени коштують 15 центів за мільйон, вихідні — 60 центів за мільйон без міркування. При активації мислення вартість зростає до $3,50 за мільйон токенів.
Тестування на бенчмарках демонструє вражаючі результати. Gemini 2.5 Flash «показує високі результати на складних запитах у LMArena, поступаючись лише 2.5 Pro» і «має порівняні показники з іншими провідними моделями за значно меншої вартості та розміру», зберігаючи «лідерство за співвідношенням ціна/якість».
Google називає 2.5 Flash своєю «найефективнішою робочою моделлю, створеною для швидкості та низької вартості», зазначаючи, що вона «покращилася за ключовими бенчмарками міркування, мультимодальності, коду та довгого контексту, використовуючи на 20-30% менше токенів» у тестах.
Нова модель наразі доступна у режимі попереднього перегляду через кілька каналів. Вона впроваджується у Google AI Studio (для розробників), Vertex AI (для бізнесу) та додатку Gemini (для всіх). За анонсами Google I/O 2025, оновлена версія стане «загальнодоступною у Google AI Studio для розробників і у Vertex AI для підприємств на початку червня», а Gemini 2.5 Pro з’явиться «незабаром після цього».
Оскільки Google продовжує розширювати свої AI-можливості, Gemini 2.5 Flash є значним кроком вперед у забезпеченні доступності та економічності розширеного міркування для розробників і користувачів.