Η Google ανακοίνωσε μια σειρά από βελτιώσεις προσβασιμότητας με τεχνητή νοημοσύνη για το Android και το Chrome την Πέμπτη, 15 Μαΐου 2025, ενισχύοντας σημαντικά την ψηφιακή εμπειρία για χρήστες με προβλήματα όρασης.
Η πιο αξιοσημείωτη αναβάθμιση αφορά το TalkBack, τον αναγνώστη οθόνης του Android, ο οποίος πλέον αξιοποιεί το Gemini AI για να προσφέρει διαδραστική υποστήριξη. Ενώ το TalkBack παρείχε ήδη περιγραφές εικόνων μέσω AI όταν δεν υπήρχε alt text, οι χρήστες μπορούν πλέον να κάνουν συγκεκριμένες ερωτήσεις για εικόνες και να λαμβάνουν αναλυτικές απαντήσεις. Για παράδειγμα, αν κάποιος λάβει μια φωτογραφία κιθάρας, μπορεί να ρωτήσει για τη μάρκα, το χρώμα ή άλλες λεπτομέρειες. Αυτή η λειτουργία επεκτείνεται και σε ολόκληρες οθόνες, επιτρέποντας στους χρήστες να ρωτούν για υλικά προϊόντων ή διαθέσιμες εκπτώσεις κατά τη διάρκεια αγορών.
Η Google βελτίωσε επίσης τη λειτουργία Expressive Captions, η οποία πλέον αποτυπώνει όχι μόνο το τι λέγεται, αλλά και τον τρόπο που λέγεται. Η νέα λειτουργία διάρκειας αναγνωρίζει παρατεταμένες λέξεις όπως «υπεροοοοοοοχο» ή «οοοοοοχι» για να αποδίδει καλύτερα το συναίσθημα και την έμφαση. Επιπλέον, προστέθηκαν ετικέτες ήχου για ενέργειες όπως το σφύριγμα ή το καθάρισμα του λαιμού, εμπλουτίζοντας περαιτέρω την εμπειρία υποτιτλισμού. Η αναβάθμιση αυτή διατίθεται στα αγγλικά στις ΗΠΑ, το Ηνωμένο Βασίλειο, τον Καναδά και την Αυστραλία για συσκευές με Android 15 και άνω.
Για τους χρήστες του Chrome, η Google εισήγαγε τεχνολογία Οπτικής Αναγνώρισης Χαρακτήρων (OCR) που επεξεργάζεται αυτόματα σαρωμένα PDF. Αυτή η εξέλιξη επιτρέπει στους αναγνώστες οθόνης να αλληλεπιδρούν με έγγραφα που προηγουμένως ήταν μη προσβάσιμα, δίνοντας τη δυνατότητα στους χρήστες να επισημαίνουν, να αντιγράφουν και να αναζητούν κείμενο όπως σε οποιαδήποτε τυπική ιστοσελίδα. Επιπλέον, το Chrome για Android διαθέτει πλέον τη λειτουργία Page Zoom, που αυξάνει το μέγεθος του κειμένου χωρίς να διαταράσσει τη διάταξη της ιστοσελίδας.
Αυτές οι εξελίξεις αναδεικνύουν πώς η τεχνητή νοημοσύνη μπορεί να αξιοποιηθεί για τη δημιουργία πιο συμπεριληπτικής τεχνολογίας. Με την απευθείας ενσωμάτωση των δυνατοτήτων του Gemini στα εργαλεία προσβασιμότητας, η Google αντιμετωπίζει σημαντικά εμπόδια που αντιμετωπίζουν οι χρήστες με προβλήματα όρασης, οι οποίοι, σύμφωνα με έρευνα της εταιρείας, συναντούν κατά μέσο όρο 90 μη επισημασμένες εικόνες καθημερινά. Η εταιρεία συνεχίζει να επεκτείνει τις πρωτοβουλίες προσβασιμότητας, συμπεριλαμβανομένου του ανοίγματος των πόρων του Project Euphonia για να βοηθήσει τους προγραμματιστές να δημιουργήσουν εργαλεία αναγνώρισης ομιλίας για ποικίλα πρότυπα ομιλίας.