menu
close

Google представи Gemini 2.5 Flash с усъвършенствани възможности за разсъждение

Google пусна Gemini 2.5 Flash в предварителен режим, като внесе значителни подобрения в своя бърз и икономичен AI модел. Новата версия въвежда хибридни възможности за разсъждение, които позволяват на разработчиците да контролират процеса на мислене на модела, като същевременно се запазват скоростта и ефективността. Прегледът вече е достъпен в Google AI Studio, Vertex AI и приложението Gemini, а общата наличност се очаква в началото на юни 2025 г.
Google представи Gemini 2.5 Flash с усъвършенствани възможности за разсъждение

Google стартира предварителна версия на Gemini 2.5 Flash – най-новата итерация на своя ефективен AI модел, създаден да балансира производителността със скоростта и разходите.

Въз основа на основата, положена от Gemini 2.0 Flash, новият модел 2.5 Flash предоставя значително подобрение във възможностите за разсъждение, като същевременно запазва репутацията си за ефективност. Google го описва като „значително надграждане на възможностите за разсъждение, като все още се дава приоритет на скоростта и разходите.“

Основната характеристика на Gemini 2.5 Flash е неговата хибридна система за разсъждение. Това е „първият напълно хибриден модел за разсъждение на Google, който позволява на разработчиците да включват или изключват мисленето и да задават бюджети за мислене, за да оптимизират баланса между качество, цена и латентност.“ Този иновативен подход дава на разработчиците безпрецедентен контрол върху начина, по който моделът обработва сложни задачи.

На практика това означава, че разработчиците могат да зададат „бюджет за мислене“, който контролира колко разсъждение извършва моделът. Те могат да регулират „броя на токените, които моделът може да генерира по време на мислене“ от 0 до 24 576 токена чрез плъзгач в Google AI Studio и Vertex AI или чрез параметър в API. Когато бюджетът за мислене е нула, моделът съвпада с разходите и латентността на Gemini 2.0 Flash.

Ценообразуването отразява тази гъвкавост – входящите токени струват 15 цента на милион, а изходящите токени – 60 цента на милион без разсъждение. При активирани възможности за мислене цената се увеличава до $3,50 на милион токени.

Тестовете за производителност показват впечатляващи резултати. Gemini 2.5 Flash „се представя отлично при трудни подканвания в LMArena, като отстъпва само на 2.5 Pro“ и „има сравними показатели с други водещи модели при значително по-ниска цена и размер“, като продължава „да води като модел с най-добро съотношение цена-производителност.“

Google описва 2.5 Flash като „най-ефективния си работен модел, създаден за скорост и ниска цена“, като отбелязва, че „е подобрен по ключови показатели за разсъждение, мултимодалност, код и дълъг контекст, като става още по-ефективен, използвайки с 20-30% по-малко токени“ при оценките.

Новият модел в момента е наличен в предварителен режим чрез няколко канала. Той се разпространява „в Google AI Studio (за разработчици), Vertex AI (за предприятия) и приложението Gemini (за всички).“ Според анонсите на Google от I/O 2025, обновената версия ще бъде „общодостъпна в Google AI Studio за разработчици и във Vertex AI за предприятия в началото на юни“, а Gemini 2.5 Pro ще последва „скоро след това.“

Докато Google продължава да разширява своите AI възможности, Gemini 2.5 Flash представлява значителна стъпка напред в правенето на усъвършенстваното разсъждение по-достъпно и икономично както за разработчици, така и за крайни потребители.

Source:

Latest News