menu
close

Google представляет сверхэффективную Gemini 2.5 Flash-Lite для задач с ограниченным бюджетом на ИИ

15 июля 2025 года Google расширила семейство Gemini 2.5, официально запустив Flash-Lite — самую экономичную и быструю модель в линейке 2.5. Этот релиз совпал с общедоступным запуском Gemini 2.5 Flash и Pro для всех пользователей. Flash-Lite создана для обеспечения высокой производительности при больших объемах задач, сохраняя при этом минимальные задержки и стоимость среди моделей Gemini 2.5.
Google представляет сверхэффективную Gemini 2.5 Flash-Lite для задач с ограниченным бюджетом на ИИ

Google официально представила Gemini 2.5 Flash-Lite, что стало значительным шагом к тому, чтобы сделать мощный искусственный интеллект более доступным и эффективным как для разработчиков, так и для предприятий.

Новая модель, которую Google называет «самой экономичной и быстрой моделью 2.5 на сегодняшний день», оптимизирована для операций с большим объемом данных и чувствительных к задержкам задач. Flash-Lite выходит на рынок с самой низкой задержкой и стоимостью в семействе моделей 2.5, предлагая экономичное обновление по сравнению с предыдущими моделями Flash 1.5 и 2.0. Она демонстрирует лучшие показатели по большинству критериев оценки, обеспечивая более быстрое время до первого токена и более высокую скорость декодирования токенов в секунду, что делает её идеальной для задач с большим потоком данных, таких как масштабная классификация или суммаризация.

Как модель рассуждений, Flash-Lite позволяет динамически управлять «бюджетом на размышления» через параметр API. В отличие от других моделей Gemini 2.5, где режим рассуждения включён по умолчанию, Flash-Lite оптимизирована для снижения затрат и увеличения скорости, поэтому размышления отключены, если их специально не активировать. Несмотря на такую оптимизацию, модель поддерживает все встроенные инструменты, включая привязку к Google Search, выполнение кода, работу с контекстом URL и вызов функций.

Тесты производительности показывают, что Flash-Lite работает в 1,5 раза быстрее, чем Gemini 2.0 Flash, при меньших затратах, что делает её особенно подходящей для задач классификации, перевода, интеллектуальной маршрутизации и других масштабных операций, чувствительных к стоимости.

В то время как другие модели по умолчанию используют более мощные (и дорогие) инструменты рассуждения для ответа на вопросы, Flash-Lite предоставляет разработчикам контроль над этим процессом. Пользователи могут включать или отключать функцию размышления в зависимости от конкретных потребностей, и несмотря на свою экономичность, Flash-Lite не ограничена в своих возможностях.

Доступ к предварительной версии Gemini 2.5 Flash-Lite уже открыт в Google AI Studio и Vertex AI, наряду со стабильными версиями 2.5 Flash и Pro. Обе модели — 2.5 Flash и Pro — также доступны в приложении Gemini, а Google внедрила кастомные версии 2.5 Flash-Lite и Flash в поисковую систему.

Это стратегическое расширение семейства моделей Gemini отражает стремление Google к демократизации искусственного интеллекта, предлагая решения, которые сбалансированы по производительности, стоимости и скорости для различных сценариев — от сложных задач рассуждения до обработки больших массивов данных.

Source:

Latest News