На 15 май 2025 г. Google обяви набор от подобрения в достъпността, задвижвани от изкуствен интелект, за Android и Chrome, които значително подобряват дигиталното изживяване на потребители с нарушено зрение.
Най-значимата актуализация е за TalkBack — екранният четец на Android, който вече използва Gemini AI за интерактивна помощ. Докато досега TalkBack предоставяше AI-генерирани описания на изображения при липса на alt текст, сега потребителите могат да задават конкретни въпроси за изображенията и да получават подробни отговори. Например, ако някой получи снимка на китара, може да попита за марката, цвета или други детайли. Тази функционалност се разпростира и върху цели екрани, което позволява на потребителите да питат за материали на продукти или налични отстъпки по време на онлайн пазаруване.
Google също така подобри функцията Expressive Captions, която вече улавя не само какво се казва, но и как се казва. Новата функция за продължителност разпознава удължени думи като „амаааазинг“ или „неееее“, за да предаде по-добре емоция и акцент. Допълнителни звукови етикети за действия като подсвиркване или покашляне още повече обогатяват изживяването с надписи. Тази актуализация се разпространява на английски език в САЩ, Великобритания, Канада и Австралия за устройства с Android 15 и по-нови версии.
За потребителите на Chrome Google въвежда технология за оптично разпознаване на знаци (OCR), която автоматично обработва сканирани PDF файлове. Това позволява на екранните четци да работят с документи, които преди са били недостъпни, като потребителите могат да маркират, копират и търсят текст, както биха го направили на стандартна уеб страница. Освен това Chrome за Android вече предлага функция Page Zoom, която увеличава размера на текста, без да нарушава оформлението на страницата.
Тези нововъведения показват как изкуственият интелект може да бъде използван за създаване на по-инклузивни технологии. Чрез директната интеграция на възможностите на Gemini в инструментите за достъпност Google адресира сериозни бариери, пред които са изправени хората с нарушено зрение, които според проучвания на компанията срещат средно по 90 неозначени изображения дневно. Компанията продължава да разширява инициативите си за достъпност, включително чрез отваряне на ресурсите на Project Euphonia, за да помогне на разработчиците да създават инструменти за разпознаване на реч за разнообразни говорни модели.