Google впровадила значні оновлення безпеки у сімействі ШІ-моделей Gemini 2.5, зробивши їх найзахищенішими моделями компанії у відповідь на нові загрози безпеці штучного інтелекту.
Ключовим елементом цих покращень став новий підхід до захисту, який суттєво підвищує стійкість Gemini до атак непрямої інʼєкції підказок під час використання інструментів. Такі атаки виникають, коли шкідливі інструкції вбудовуються у дані, які отримує модель ШІ, що може призвести до виконання нею небезпечних команд або витоку конфіденційної інформації.
Покращення безпеки зʼявилися напередодні інтеграції можливостей Project Mariner з використання компʼютера у Gemini API та Vertex AI. Project Mariner дозволяє агентам ШІ керувати веббраузерами та автоматично виконувати певні завдання, зокрема навігацію сайтами та взаємодію з елементами сторінок. Декілька компаній, серед яких Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company та Cartwheel, вже тестують ці можливості, а ширший доступ для розробників очікується цього літа.
Стратегія Google щодо безпеки Gemini 2.5 передбачає багаторівневий захист, зокрема автоматизований червоний тімінг (ART), який постійно перевіряє моделі на вразливості. За даними досліджень Google DeepMind, цей підхід суттєво знизив ефективність адаптивних атак порівняно з попередніми версіями моделей. Компанія додатково навчила Gemini на наборах даних із реалістичними сценаріями атак, щоб модель ігнорувала шкідливі вбудовані інструкції, виконуючи лише легітимні запити користувачів.
Окрім підвищення безпеки, моделі Gemini 2.5 отримують додаткові функції, зокрема підсумки міркувань у Gemini API та Vertex AI, які структурують хід роздумів моделі для кращої прозорості та відлагодження. Моделі також підтримують нативний аудіовихід для більш природної взаємодії у розмовах.
Модель Gemini 2.5 Flash вже доступна для всіх у застосунку Gemini, а загальна доступність у Google AI Studio для розробників і Vertex AI для підприємств очікується на початку червня. Незабаром після цього стане доступною і Gemini 2.5 Pro, розширюючи можливості захисту для ширшої аудиторії.