Google ogłosił w czwartek, 15 maja 2025 roku, pakiet ulepszeń dostępności opartych na sztucznej inteligencji dla Androida i Chrome, znacząco poprawiając cyfrowe doświadczenia użytkowników z niepełnosprawnością wzroku.
Najważniejsza aktualizacja dotyczy TalkBack, czytnika ekranu dla Androida, który teraz wykorzystuje Gemini AI do interaktywnej pomocy. Dotychczas TalkBack oferował opisy obrazów generowane przez AI, gdy brakowało tekstu alternatywnego, ale teraz użytkownicy mogą zadawać konkretne pytania dotyczące obrazów i otrzymywać szczegółowe odpowiedzi. Na przykład, jeśli ktoś otrzyma zdjęcie gitary, może zapytać o jej markę, kolor lub inne szczegóły. Funkcjonalność ta obejmuje nie tylko pojedyncze obrazy, ale także całe ekrany – użytkownicy mogą pytać o materiały produktów lub dostępne zniżki podczas zakupów.
Google ulepszył również funkcję Expressive Captions, która teraz wychwytuje nie tylko to, co ludzie mówią, ale także sposób, w jaki to mówią. Nowa funkcja rozpoznawania długości słów identyfikuje wydłużone wyrazy, takie jak „amaaaazing” czy „nooooo”, aby lepiej oddać emocje i akcenty. Dodatkowe etykiety dźwiękowe, np. dla gwizdania czy chrząkania, jeszcze bardziej wzbogacają napisy. Ta aktualizacja jest wdrażana w języku angielskim w USA, Wielkiej Brytanii, Kanadzie i Australii na urządzeniach z Androidem 15 i nowszymi.
Dla użytkowników Chrome Google wprowadził technologię OCR (optyczne rozpoznawanie znaków), która automatycznie przetwarza zeskanowane pliki PDF. Dzięki temu czytniki ekranu mogą współpracować z wcześniej niedostępnymi dokumentami, umożliwiając zaznaczanie, kopiowanie i wyszukiwanie tekstu tak, jak na zwykłej stronie internetowej. Ponadto Chrome na Androida oferuje teraz funkcję Page Zoom, która powiększa tekst bez zakłócania układu strony.
Te innowacje pokazują, jak sztuczna inteligencja może być wykorzystywana do tworzenia bardziej inkluzywnej technologii. Dzięki bezpośredniej integracji możliwości Gemini z narzędziami dostępności Google eliminuje istotne bariery, z jakimi mierzą się osoby z niepełnosprawnością wzroku – według badań firmy codziennie napotykają one średnio 90 nieopisanych obrazów. Google kontynuuje rozwijanie swoich inicjatyw dostępności, m.in. udostępniając zasoby Project Euphonia, które pomagają deweloperom budować narzędzia do rozpoznawania mowy dla różnych wzorców mowy.