Google официално пусна Gemini 2.5 Flash за всички потребители, отбелязвайки значителен напредък както в AI възможностите, така и във функциите за сигурност.
Новата версия, вече налична в приложението Gemini, носи съществени подобрения в няколко направления. Според ръководителя на Google DeepMind Демис Хасабис, Gemini 2.5 Flash е „по-добър във всяко отношение“, като показва по-висока производителност при логически задачи, мултимодалност, програмиране и обработка на дълги контексти. Най-впечатляващото е, че тези постижения са реализирани с 22% по-голяма ефективност, използвайки по-малко токени за генериране на сходни отговори.
Сигурността е основен акцент в това издание. Google е внедрила усъвършенствани защити, които значително повишават устойчивостта на Gemini срещу индиректни атаки чрез подмяна на инструкции по време на работа с инструменти. Този тип атаки възникват, когато злонамерени инструкции са вградени в данни, които AI моделът извлича. Чрез комбинация от подсилване на модела, проверки на входа и изхода и системни защитни механизми, Google превръща Gemini 2.5 в най-сигурното си моделно семейство досега.
Разработчиците ще получат достъп до обновената версия в Google AI Studio, а бизнес клиентите — чрез Vertex AI в началото на юни, като малко след това ще бъде пуснат и Gemini 2.5 Pro. Изданието включва нови функции, насочени към разработчици, като „обобщения на мисловния процес“, които структурират логиката на модела в ясен формат с подзаглавия и ключови детайли, улеснявайки разбирането и отстраняването на грешки.
Gemini 2.5 Pro ще бъде подобрен с Deep Think — експериментален режим за разсъждение, специално създаден за много сложни математически и програмистки задачи. Тази функция позволява на модела да разглежда множество хипотези преди да отговори, което води до впечатляващи резултати на трудни тестове като USAMO 2025 по математика и LiveCodeBench за състезателно програмиране.
Семейството Gemini 2.5 въвежда и нови аудио възможности, включително вградено преобразуване на текст в реч с поддръжка на множество говорители на 24 езика. Потребителите могат да персонализират тона, акцента и стила на говорене на AI, като моделът може да разпознава емоции в гласа на потребителя и да реагира адекватно.
С тези подобрения Google продължава да позиционира Gemini като водеща AI платформа както за крайни потребители, така и за бизнес клиенти, съчетавайки напреднали възможности с по-високо ниво на сигурност.