Google посилює захист Gemini 2.5 від загроз безпеці ШІ

Google суттєво вдосконалила захисні механізми у своїх моделях Gemini 2.5 Pro та Flash, зробивши їх найбезпечнішими ШІ-моделями компанії на сьогодні. Оновлення спрямовані на протидію атакам непрямої інʼєкції підказок під час використання інструментів — це зростаюча кіберзагроза, коли шкідливі інструкції вбудовуються у дані, які отримує ШІ. Вдосконалення зʼявилися на тлі інтеграції можливостей Project Mariner з використання компʼютера у Gemini API та Vertex AI, які вже тестують такі компанії, як Automation Anywhere та UiPath.

Google впровадила значні оновлення безпеки у сімействі ШІ-моделей Gemini 2.5, зробивши їх найзахищенішими моделями компанії у відповідь на нові загрози безпеці штучного інтелекту.

Ключовим елементом цих покращень став новий підхід до захисту, який суттєво підвищує стійкість Gemini до атак непрямої інʼєкції підказок під час використання інструментів. Такі атаки виникають, коли шкідливі інструкції вбудовуються у дані, які отримує модель ШІ, що може призвести до виконання нею небезпечних команд або витоку конфіденційної інформації.

Покращення безпеки зʼявилися напередодні інтеграції можливостей Project Mariner з використання компʼютера у Gemini API та Vertex AI. Project Mariner дозволяє агентам ШІ керувати веббраузерами та автоматично виконувати певні завдання, зокрема навігацію сайтами та взаємодію з елементами сторінок. Декілька компаній, серед яких Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company та Cartwheel, вже тестують ці можливості, а ширший доступ для розробників очікується цього літа.

Стратегія Google щодо безпеки Gemini 2.5 передбачає багаторівневий захист, зокрема автоматизований червоний тімінг (ART), який постійно перевіряє моделі на вразливості. За даними досліджень Google DeepMind, цей підхід суттєво знизив ефективність адаптивних атак порівняно з попередніми версіями моделей. Компанія додатково навчила Gemini на наборах даних із реалістичними сценаріями атак, щоб модель ігнорувала шкідливі вбудовані інструкції, виконуючи лише легітимні запити користувачів.

Окрім підвищення безпеки, моделі Gemini 2.5 отримують додаткові функції, зокрема підсумки міркувань у Gemini API та Vertex AI, які структурують хід роздумів моделі для кращої прозорості та відлагодження. Моделі також підтримують нативний аудіовихід для більш природної взаємодії у розмовах.

Модель Gemini 2.5 Flash вже доступна для всіх у застосунку Gemini, а загальна доступність у Google AI Studio для розробників і Vertex AI для підприємств очікується на початку червня. Незабаром після цього стане доступною і Gemini 2.5 Pro, розширюючи можливості захисту для ширшої аудиторії.

Source:

Google посилює захист Gemini 2.5 від загроз безпеці ШІ

Latest News

Стартап екс-CTO OpenAI залучив рекордні $2 млрд на посівному раунді

Meta робить ставку у $14,3 млрд на Вана зі Scale AI для лідерства в гонці надінтелекту

Інструмент SynthID Detector від Google бореться з кризою дезінформації, створеної ШІ

Збій у Google Cloud IAM паралізував глобальні інтернет-сервіси

Швидкість світла для ШІ: Європейські команди долають обмеження обчислень за допомогою скляних волокон

Прорив у сфері ШІ переписує рецепт цементу заради клімату

AI-система DAGGER прогнозує потужну геомагнітну бурю

Apple розглядає придбання Perplexity AI у стратегічній угоді на $14 мільярдів

Harvey AI залучає $300 млн та досягає оцінки $5 млрд — історичний рубіж для юридичних AI-технологій

Цукерберг формує елітну команду зі штучного інтелекту після невдач Meta з моделями

Google посилює захист Gemini 2.5 від загроз безпеці ШІ

Related Articles

Збій у Google Cloud IAM паралізував глобальні інтернет-сервіси

Квантові чипи підвищують продуктивність ШІ та зменшують енергоспоживання

Google презентувала SynthID Detector для боротьби з дезінформацією, створеною ШІ

Android XR від Google впроваджує Gemini AI у розумні окуляри

MIT впроваджує навчальні платформи з ШІ, орієнтовані на соціальні взаємодії

Latest News

Стартап екс-CTO OpenAI залучив рекордні $2 млрд на посівному раунді

Meta робить ставку у $14,3 млрд на Вана зі Scale AI для лідерства в гонці надінтелекту

Інструмент SynthID Detector від Google бореться з кризою дезінформації, створеної ШІ

Збій у Google Cloud IAM паралізував глобальні інтернет-сервіси

Швидкість світла для ШІ: Європейські команди долають обмеження обчислень за допомогою скляних волокон

Прорив у сфері ШІ переписує рецепт цементу заради клімату

AI-система DAGGER прогнозує потужну геомагнітну бурю

Apple розглядає придбання Perplexity AI у стратегічній угоді на $14 мільярдів

Harvey AI залучає $300 млн та досягає оцінки $5 млрд — історичний рубіж для юридичних AI-технологій

Цукерберг формує елітну команду зі штучного інтелекту після невдач Meta з моделями