Google provedl zásadní bezpečnostní vylepšení své rodiny AI modelů Gemini 2.5, čímž je posunul na pozici nejbezpečnějších modelů společnosti v reakci na vyvíjející se bezpečnostní hrozby v oblasti umělé inteligence.
Jádrem těchto vylepšení je nový bezpečnostní přístup, který výrazně zvyšuje ochranu Gemini před nepřímými útoky typu prompt injection během používání nástrojů. Tyto útoky nastávají, když jsou škodlivé instrukce vloženy do dat, která AI model získává, což může vést k provedení nebezpečných příkazů nebo úniku citlivých informací.
Bezpečnostní vylepšení přicházejí v době, kdy se Google chystá integrovat schopnosti projektu Mariner pro ovládání počítače do Gemini API a Vertex AI. Projekt Mariner umožňuje AI agentům ovládat webové prohlížeče a automaticky provádět specifické úkoly, včetně navigace na webových stránkách a interakce s webovými prvky. Několik společností, včetně Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company a Cartwheel, tyto schopnosti již testuje a širší přístup pro vývojáře se očekává během léta.
Bezpečnostní strategie Googlu pro Gemini 2.5 zahrnuje vícevrstvou obranu, včetně automatizovaného red teamingu (ART), který neustále hledá zranitelnosti. Podle výzkumu Google DeepMind tento přístup výrazně snížil úspěšnost adaptivních útoků ve srovnání s předchozími verzemi modelu. Společnost navíc model Gemini doladila na datech obsahujících realistické scénáře útoků, čímž model naučila ignorovat škodlivé vložené instrukce a zároveň plnit legitimní požadavky uživatelů.
Kromě bezpečnostních vylepšení získávají modely Gemini 2.5 další funkce, například shrnutí myšlenkových pochodů v Gemini API a Vertex AI, která organizují proces uvažování modelu do strukturované podoby pro lepší transparentnost a ladění. Modely také podporují nativní zvukový výstup pro přirozenější konverzační zážitek.
Model Gemini 2.5 Flash je nyní dostupný všem v aplikaci Gemini, přičemž obecná dostupnost v Google AI Studio pro vývojáře a ve Vertex AI pro firmy je plánována na začátek června. Gemini 2.5 Pro bude následovat krátce poté a přinese své vylepšené bezpečnostní funkce širšímu publiku.