Google оголосила, що Gemini 2.5 Flash і 2.5 Pro тепер стабільні й загальнодоступні, надаючи організаціям надійність і масштабованість, необхідні для впровадження передових можливостей ШІ у критично важливі застосунки. Поряд із цими релізами компанія представила у попередньому перегляді Gemini 2.5 Flash-Lite, яку описує як свою найбільш економічну та найшвидшу модель 2.5 на сьогодні.
Gemini 2.5 Flash-Lite — це модель для міркувань, яка дозволяє динамічно керувати бюджетом на «мислення» за допомогою параметра API. На відміну від інших моделей сімейства 2.5, Flash-Lite оптимізована для мінімальних витрат і максимальної швидкості, з відключеним «мисленням» за замовчуванням. Незважаючи на ці оптимізації, вона підтримує всі вбудовані інструменти, включаючи Grounding з Google Search, виконання коду, контекст за URL, а також виклик функцій.
Flash-Lite забезпечує вищу продуктивність порівняно з попередньою моделлю Flash-Lite і працює у 1,5 раза швидше, ніж 2.0 Flash, при нижчій вартості. Вона спеціально розроблена для обробки великих обсягів завдань, чутливих до затримок, таких як переклад, класифікація, інтелектуальний роутинг та інші масштабовані операції, де важлива економія.
Модель демонструє значно вищу продуктивність, ніж 2.0 Flash-Lite, у завданнях з програмування, математики, науки, міркувань і мультимодальних бенчмарках, що робить її ідеальною для обробки великих обсягів даних.
Як і інші моделі сімейства Gemini 2.5, Flash-Lite має низку корисних можливостей: можливість вмикати «мислення» з різними бюджетами, підключення до інструментів на кшталт Grounding з Google Search і виконання коду, мультимодальний ввід та контекст довжиною до 1 мільйона токенів.
Щоб забезпечити актуальність і достовірність відповідей, Flash-Lite може використовувати Google Search як вбудований інструмент, інтелектуально вирішуючи, коли звертатися до пошуку для розширення власних знань.
Окрім запуску Flash-Lite, Google повідомила, що Gemini 2.5 Pro стала провідною моделлю у світових рейтингах WebDev Arena та LMArena. З ELO-оцінкою 1415 у рейтингу програмування WebDev Arena вона лідирує на всіх таблицях LMArena, які оцінюють людські вподобання за кількома напрямками.
Додатково Google інтегрувала LearnLM безпосередньо у Gemini 2.5, зробивши її провідною моделлю для навчання у світі. Згідно з останнім звітом компанії, Gemini 2.5 Pro перевершила конкурентів у всіх категоріях принципів навчальної науки, а освітяни та експерти з педагогіки віддавали їй перевагу у різних навчальних сценаріях.
Gemini 2.5 Flash-Lite вже доступна у попередньому перегляді в Google AI Studio та Vertex AI разом зі стабільними версіями 2.5 Flash і Pro. Розробники можуть отримати доступ до моделі (gemini-2.5-flash-lite-preview-06-17) через Google Gen AI SDK, який забезпечує єдиний інтерфейс до сімейства моделей Gemini 2.5 як через Gemini Developer API, так і через Vertex AI Gemini API.