Google официално пусна Gemini 2.5 Flash-Lite, отбелязвайки значителен напредък в правенето на мощния изкуствен интелект по-достъпен и ефективен както за разработчици, така и за предприятия.
Новият модел, описван като „най-икономичния и най-бърз 2.5 модел на Google досега“, е оптимизиран за операции с голям обем и чувствителност към латентност. Flash-Lite излиза на пазара с най-ниска латентност и цена в семейството на моделите 2.5, проектиран като икономично надграждане спрямо предишните модели 1.5 и 2.0 Flash. Той предлага по-добра производителност в повечето оценки, с по-кратко време до първия токен и по-висока скорост на декодиране (tokens per second), което го прави идеален за задачи с висок трафик като класификация или мащабно обобщаване.
Като модел за разсъждение, Flash-Lite позволява динамичен контрол върху „бюджета за мислене“ чрез параметър в API. За разлика от другите модели Gemini 2.5, при които разсъждението е включено по подразбиране, Flash-Lite оптимизира разходите и скоростта, като държи тази функция изключена, освен ако не бъде изрично активирана. Въпреки тази оптимизация, моделът поддържа всички вградени инструменти, включително Google Search grounding, изпълнение на код, URL контекст и извикване на функции.
Тестове на производителността показват, че Flash-Lite е 1.5 пъти по-бърз от Gemini 2.0 Flash при по-ниска цена, което го прави особено подходящ за задачи като класификация, превод, интелигентно маршрутизиране и други ценово чувствителни операции в голям мащаб. Докато други модели по подразбиране използват по-мощни (и по-скъпи) инструменти за разсъждение при отговаряне на въпроси, Flash-Lite дава на разработчиците контрол върху този процес. Потребителите могат да включват или изключват способността за разсъждение според конкретните си нужди, а въпреки ценовата си ефективност, Flash-Lite не е ограничен в своите възможности.
Прегледът на Gemini 2.5 Flash-Lite вече е достъпен в Google AI Studio и Vertex AI, заедно със стабилните версии на 2.5 Flash и Pro. И двата модела – 2.5 Flash и Pro – са достъпни и в приложението Gemini, а Google е интегрирала персонализирани версии на 2.5 Flash-Lite и Flash в Search.
Това стратегическо разширяване на семейството Gemini демонстрира ангажимента на Google към демократизирането на изкуствения интелект, като предоставя опции, които балансират между производителност, цена и скорост за различни случаи на употреба – от сложни задачи за разсъждение до обработка на големи обеми данни.