Google wdrożył znaczące ulepszenia w zakresie bezpieczeństwa w rodzinie modeli AI Gemini 2.5, ustanawiając je najbezpieczniejszymi modelami firmy w odpowiedzi na ewoluujące zagrożenia dla bezpieczeństwa sztucznej inteligencji.
Kluczowym elementem tych usprawnień jest nowe podejście do bezpieczeństwa, które znacząco zwiększa ochronę Gemini przed atakami pośredniego wstrzykiwania promptów podczas korzystania z narzędzi. Ataki te polegają na umieszczaniu złośliwych instrukcji w danych pobieranych przez model AI, co może prowadzić do wykonania szkodliwych poleceń lub wycieku poufnych informacji.
Ulepszenia w zakresie bezpieczeństwa pojawiają się w momencie, gdy Google przygotowuje się do integracji funkcji obsługi komputera z Project Mariner w Gemini API i Vertex AI. Project Mariner umożliwia agentom AI kontrolowanie przeglądarek internetowych i automatyczne wykonywanie określonych zadań, takich jak nawigacja po stronach czy interakcja z elementami witryn. Kilka firm, w tym Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company i Cartwheel, już testuje te możliwości, a szerszy dostęp dla deweloperów spodziewany jest latem tego roku.
Strategia bezpieczeństwa Google dla Gemini 2.5 obejmuje wiele warstw ochronnych, w tym zautomatyzowane testy red teaming (ART), które nieustannie sprawdzają podatności. Według badań Google DeepMind, takie podejście znacząco obniżyło skuteczność adaptacyjnych ataków w porównaniu do wcześniejszych wersji modeli. Firma dostroiła Gemini na zbiorach danych zawierających realistyczne scenariusze ataków, ucząc model ignorowania złośliwych instrukcji przy jednoczesnym wykonywaniu prawidłowych poleceń użytkownika.
Poza ulepszeniami w zakresie bezpieczeństwa, modele Gemini 2.5 otrzymują dodatkowe funkcje, takie jak podsumowania toku rozumowania w Gemini API i Vertex AI, które porządkują proces myślowy modelu w ustrukturyzowany sposób, zwiększając przejrzystość i ułatwiając debugowanie. Modele obsługują również natywną odpowiedź głosową, zapewniając bardziej naturalne doświadczenia konwersacyjne.
Model Gemini 2.5 Flash jest już dostępny dla wszystkich w aplikacji Gemini, a ogólna dostępność w Google AI Studio dla deweloperów oraz w Vertex AI dla firm planowana jest na początek czerwca. Wkrótce potem pojawi się Gemini 2.5 Pro, oferując rozszerzone funkcje bezpieczeństwa szerszemu gronu użytkowników.