menu
close

Google усилила защиту Gemini 2.5 от угроз безопасности ИИ

Google значительно повысила уровень защиты в моделях Gemini 2.5 Pro и Flash, сделав их самыми безопасными ИИ-моделями компании на сегодняшний день. Улучшения направлены в первую очередь на противодействие атакам косвенной инъекции подсказок при использовании инструментов — растущей киберугрозе, когда вредоносные инструкции встраиваются в данные, получаемые ИИ-системами. Эти меры безопасности внедряются на фоне интеграции возможностей управления компьютером из проекта Mariner в Gemini API и Vertex AI, которые уже тестируют такие компании, как Automation Anywhere и UiPath.
Google усилила защиту Gemini 2.5 от угроз безопасности ИИ

Google реализовала масштабные обновления системы безопасности в семействе ИИ-моделей Gemini 2.5, сделав их самыми защищёнными моделями компании в ответ на эволюционирующие угрозы в сфере ИИ.

В центре этих улучшений — новый подход к безопасности, который существенно повышает защиту Gemini от атак косвенной инъекции подсказок при использовании инструментов. Такие атаки происходят, когда вредоносные инструкции внедряются в данные, которые получает ИИ-модель, что может привести к выполнению вредоносных команд или утечке конфиденциальной информации.

Улучшения в сфере безопасности появляются на фоне подготовки Google к интеграции возможностей управления компьютером из проекта Mariner в Gemini API и Vertex AI. Проект Mariner позволяет ИИ-агентам управлять веб-браузерами и выполнять определённые задачи автоматически, включая навигацию по сайтам и взаимодействие с веб-элементами. Несколько компаний, среди которых Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company и Cartwheel, уже тестируют эти возможности, а более широкий доступ для разработчиков ожидается этим летом.

Стратегия Google по обеспечению безопасности Gemini 2.5 включает несколько уровней защиты, в том числе автоматизированное проведение атак (ART), которое непрерывно выявляет уязвимости. По данным исследований Google DeepMind, такой подход значительно снизил успешность адаптивных атак по сравнению с предыдущими версиями моделей. Компания дообучила Gemini на наборах данных с реалистичными сценариями атак, чтобы научить модель игнорировать вредоносные встроенные инструкции и при этом выполнять легитимные запросы пользователей.

Помимо усиления безопасности, модели Gemini 2.5 получают дополнительные функции, включая сводки рассуждений в Gemini API и Vertex AI, которые структурируют процесс мышления модели для повышения прозрачности и удобства отладки. Модели также поддерживают нативный аудиовывод для более естественного общения.

Модель Gemini 2.5 Flash уже доступна всем пользователям в приложении Gemini, а для разработчиков в Google AI Studio и для корпоративных клиентов в Vertex AI она появится в начале июня. Вскоре после этого станет доступна и Gemini 2.5 Pro, расширяя возможности усиленной защиты для широкой аудитории.

Source:

Latest News