Η Google έχει εφαρμόσει σημαντικές αναβαθμίσεις ασφαλείας στην οικογένεια μοντέλων τεχνητής νοημοσύνης Gemini 2.5, καθιερώνοντάς τα ως τα πιο ασφαλή μοντέλα της εταιρείας μέχρι σήμερα, ως απάντηση στις εξελισσόμενες απειλές ασφάλειας AI.
Στην καρδιά αυτών των βελτιώσεων βρίσκεται μια νέα προσέγγιση ασφαλείας που αυξάνει σημαντικά την προστασία του Gemini απέναντι σε έμμεσες επιθέσεις έγχυσης προτροπών κατά τη χρήση εργαλείων. Αυτές οι επιθέσεις συμβαίνουν όταν κακόβουλες οδηγίες ενσωματώνονται σε δεδομένα που ανακτά ένα μοντέλο AI, με αποτέλεσμα το μοντέλο να μπορεί να εκτελέσει επιβλαβείς εντολές ή να διαρρεύσει ευαίσθητες πληροφορίες.
Οι βελτιώσεις στην ασφάλεια έρχονται καθώς η Google ετοιμάζεται να ενσωματώσει τις δυνατότητες χρήσης υπολογιστή του Project Mariner στο Gemini API και το Vertex AI. Το Project Mariner επιτρέπει σε πράκτορες AI να ελέγχουν προγράμματα περιήγησης και να εκτελούν αυτόματα συγκεκριμένες εργασίες, όπως πλοήγηση σε ιστότοπους και αλληλεπίδραση με στοιχεία ιστοσελίδων. Αρκετές εταιρείες, μεταξύ των οποίων οι Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company και Cartwheel, δοκιμάζουν ήδη αυτές τις δυνατότητες, ενώ ευρύτερη πρόσβαση για προγραμματιστές αναμένεται μέσα στο καλοκαίρι.
Η στρατηγική ασφάλειας της Google για το Gemini 2.5 περιλαμβάνει πολλαπλά επίπεδα άμυνας, όπως το αυτοματοποιημένο red teaming (ART) που ελέγχει διαρκώς για ευπάθειες. Σύμφωνα με έρευνα της Google DeepMind, αυτή η προσέγγιση έχει μειώσει σημαντικά το ποσοστό επιτυχίας των προσαρμοστικών επιθέσεων σε σύγκριση με προηγούμενες εκδόσεις μοντέλων. Η εταιρεία εκπαίδευσε το Gemini σε σύνολα δεδομένων που περιλαμβάνουν ρεαλιστικά σενάρια επιθέσεων, διδάσκοντας στο μοντέλο να αγνοεί κακόβουλες ενσωματωμένες οδηγίες ενώ ακολουθεί νόμιμα αιτήματα χρηστών.
Πέρα από τις βελτιώσεις στην ασφάλεια, τα μοντέλα Gemini 2.5 αποκτούν επιπλέον δυνατότητες, όπως περιλήψεις σκέψης στο Gemini API και το Vertex AI, οι οποίες οργανώνουν τη διαδικασία συλλογισμού του μοντέλου σε δομημένη μορφή για μεγαλύτερη διαφάνεια και ευκολότερο εντοπισμό σφαλμάτων. Τα μοντέλα υποστηρίζουν επίσης εγγενή ηχητική έξοδο για πιο φυσικές συνομιλιακές εμπειρίες.
Το μοντέλο Gemini 2.5 Flash είναι πλέον διαθέσιμο σε όλους μέσω της εφαρμογής Gemini, ενώ η γενική διαθεσιμότητα στο Google AI Studio για προγραμματιστές και στο Vertex AI για επιχειρήσεις αναμένεται στις αρχές Ιουνίου. Το Gemini 2.5 Pro θα ακολουθήσει σύντομα, φέρνοντας τα ενισχυμένα χαρακτηριστικά ασφαλείας του σε ευρύτερο κοινό.