Η Google ανακοίνωσε μια σημαντική επέκταση του συστήματος τεχνητής νοημοσύνης Project Mariner, φέρνοντας τις δυνατότητες ελέγχου υπολογιστών στους προγραμματιστές μέσω των πλατφορμών Gemini API και Vertex AI.
Το Project Mariner, που παρουσιάστηκε για πρώτη φορά στα τέλη του 2024, αποτελεί τη φιλόδοξη προσπάθεια της Google να μεταμορφώσει τον τρόπο με τον οποίο οι χρήστες αλληλεπιδρούν με τις ψηφιακές διεπαφές μέσω πρακτόρων τεχνητής νοημοσύνης. Το σύστημα μπορεί να κατανοεί και να αναλύει πληροφορίες που εμφανίζονται στην οθόνη του υπολογιστή, όπως κείμενο, εικόνες, κώδικα και διαδικτυακές φόρμες, και στη συνέχεια να πλοηγείται αυτόνομα σε ιστοσελίδες και να ολοκληρώνει σύνθετες εργασίες.
Η πιο πρόσφατη έκδοση του Project Mariner έχει ενισχυθεί σημαντικά ώστε να λειτουργεί σε εικονικές μηχανές στο cloud, παρόμοια με τους πράκτορες των OpenAI και Amazon. Αυτή η προσέγγιση που βασίζεται στο cloud επιτρέπει στους χρήστες να ασχολούνται με άλλα έργα, ενώ το Project Mariner ολοκληρώνει εργασίες στο παρασκήνιο, διαχειριζόμενο έως και δέκα διαφορετικές λειτουργίες ταυτόχρονα — μια σημαντική βελτίωση σε σχέση με τον προκάτοχό του που λειτουργούσε μόνο στον browser.
Αρκετές εταιρείες ήδη εξερευνούν τις δυνατότητες του Project Mariner, όπως οι Automation Anywhere και UiPath, ειδικοί στον αυτοματισμό, καθώς και οι Browserbase, Autotab, The Interaction Company και Cartwheel. Αυτοί οι πρώτοι χρήστες αξιοποιούν την τεχνολογία για την αυτοματοποίηση σύνθετων διαδικτυακών ροών εργασίας που προηγουμένως απαιτούσαν εκτεταμένη ανθρώπινη παρέμβαση.
Η Google έχει επίσης εφαρμόσει προηγμένα μέτρα ασφαλείας για την προστασία από απειλές όπως οι έμμεσες ενέσεις εντολών (indirect prompt injections), όπου κακόβουλες οδηγίες μπορεί να ενσωματωθούν σε δεδομένα που ανακτώνται από τα μοντέλα τεχνητής νοημοσύνης. Σύμφωνα με τη Google, αυτές οι βελτιώσεις ασφάλειας έχουν αυξήσει σημαντικά το ποσοστό προστασίας του Gemini κατά τη χρήση εργαλείων, καθιστώντας τη σειρά μοντέλων Gemini 2.5 την πιο ασφαλή μέχρι σήμερα για την εταιρεία.
Η ευρύτερη πρόσβαση των προγραμματιστών στις δυνατότητες του Project Mariner έχει προγραμματιστεί για το καλοκαίρι, με την προοπτική να φέρει επανάσταση στον τρόπο που οι προγραμματιστές δημιουργούν εφαρμογές τεχνητής νοημοσύνης που μπορούν να ελέγχουν και να αλληλεπιδρούν με διεπαφές υπολογιστών. Η τεχνολογία ενσωματώνεται επίσης στη λειτουργία AI Mode της Αναζήτησης Google, όπου αρχικά θα αναλαμβάνει εργασίες όπως η αγορά εισιτηρίων για εκδηλώσεις, η κράτηση σε εστιατόρια και ο προγραμματισμός τοπικών ραντεβού.