menu
close

Google представи ултра-ефективния Gemini 2.5 Flash-Lite за ценово чувствителен ИИ

На 15 юли 2025 г. Google разшири семейството Gemini 2.5 с официалния старт на Flash-Lite – най-икономичния и най-бърз модел от серията 2.5 досега. Пускането съвпада с общата достъпност на Gemini 2.5 Flash и Pro за всички потребители. Flash-Lite е създаден да осигури превъзходна производителност при задачи с висок трафик, като същевременно поддържа най-ниска латентност и цена в гамата Gemini 2.5.
Google представи ултра-ефективния Gemini 2.5 Flash-Lite за ценово чувствителен ИИ

Google официално пусна Gemini 2.5 Flash-Lite, отбелязвайки значителен напредък в правенето на мощния изкуствен интелект по-достъпен и ефективен както за разработчици, така и за предприятия.

Новият модел, описван като „най-икономичния и най-бърз 2.5 модел на Google досега“, е оптимизиран за операции с голям обем и чувствителност към латентност. Flash-Lite излиза на пазара с най-ниска латентност и цена в семейството на моделите 2.5, проектиран като икономично надграждане спрямо предишните модели 1.5 и 2.0 Flash. Той предлага по-добра производителност в повечето оценки, с по-кратко време до първия токен и по-висока скорост на декодиране (tokens per second), което го прави идеален за задачи с висок трафик като класификация или мащабно обобщаване.

Като модел за разсъждение, Flash-Lite позволява динамичен контрол върху „бюджета за мислене“ чрез параметър в API. За разлика от другите модели Gemini 2.5, при които разсъждението е включено по подразбиране, Flash-Lite оптимизира разходите и скоростта, като държи тази функция изключена, освен ако не бъде изрично активирана. Въпреки тази оптимизация, моделът поддържа всички вградени инструменти, включително Google Search grounding, изпълнение на код, URL контекст и извикване на функции.

Тестове на производителността показват, че Flash-Lite е 1.5 пъти по-бърз от Gemini 2.0 Flash при по-ниска цена, което го прави особено подходящ за задачи като класификация, превод, интелигентно маршрутизиране и други ценово чувствителни операции в голям мащаб. Докато други модели по подразбиране използват по-мощни (и по-скъпи) инструменти за разсъждение при отговаряне на въпроси, Flash-Lite дава на разработчиците контрол върху този процес. Потребителите могат да включват или изключват способността за разсъждение според конкретните си нужди, а въпреки ценовата си ефективност, Flash-Lite не е ограничен в своите възможности.

Прегледът на Gemini 2.5 Flash-Lite вече е достъпен в Google AI Studio и Vertex AI, заедно със стабилните версии на 2.5 Flash и Pro. И двата модела – 2.5 Flash и Pro – са достъпни и в приложението Gemini, а Google е интегрирала персонализирани версии на 2.5 Flash-Lite и Flash в Search.

Това стратегическо разширяване на семейството Gemini демонстрира ангажимента на Google към демократизирането на изкуствения интелект, като предоставя опции, които балансират между производителност, цена и скорост за различни случаи на употреба – от сложни задачи за разсъждение до обработка на големи обеми данни.

Source:

Latest News