Společnost Google ve čtvrtek 15. května 2025 oznámila sadu vylepšení přístupnosti založených na umělé inteligenci pro Android a Chrome, která výrazně zlepšují digitální zážitek uživatelům se zrakovým postižením.
Nejvýraznější aktualizace přichází do služby TalkBack, čtečky obrazovky pro Android, která nyní využívá Gemini AI k poskytování interaktivní asistence. Zatímco TalkBack dříve nabízel AI-generované popisy obrázků v případě, že nebyl k dispozici alternativní text, uživatelé se nyní mohou na obrázky konkrétně doptávat a získávat podrobné odpovědi. Pokud například někdo obdrží fotografii kytary, může se zeptat na její značku, barvu či další detaily. Tato funkce se neomezuje pouze na jednotlivé obrázky, ale rozšiřuje se na celé obrazovky – uživatelé se tak mohou při online nakupování doptávat například na materiály produktů nebo dostupné slevy.
Google také vylepšil funkci Expressive Captions, která nyní zachycuje nejen to, co lidé říkají, ale i jak to říkají. Nová funkce rozpoznávání délky slov identifikuje protahovaná slova jako „úúúžasné“ nebo „neee“, aby lépe vyjádřila emoce a důraz. Další zvukové popisky, například pro pískání nebo odkašlání, dále obohacují zážitek z titulků. Tato aktualizace je v angličtině postupně zaváděna v USA, Velké Británii, Kanadě a Austrálii pro zařízení s Androidem 15 a novějším.
Pro uživatele Chromu Google představil technologii optického rozpoznávání znaků (OCR), která automaticky zpracovává naskenované PDF dokumenty. Díky tomu mohou čtečky obrazovky pracovat s dříve nepřístupnými soubory, což uživatelům umožňuje zvýrazňovat, kopírovat a vyhledávat text stejně jako na běžných webových stránkách. Chrome pro Android navíc nově nabízí funkci Page Zoom, která zvětšuje velikost textu bez narušení rozvržení stránky.
Tyto novinky ukazují, jak lze umělou inteligenci využít k vytváření inkluzivnějších technologií. Integrací schopností Gemini přímo do nástrojů přístupnosti Google reaguje na zásadní překážky, kterým čelí zrakově postižení uživatelé – podle výzkumu Googlu se denně setkávají v průměru s 90 neoznačenými obrázky. Společnost dále rozšiřuje své aktivity v oblasti přístupnosti, například otevřením zdrojů projektu Euphonia, které pomáhají vývojářům vytvářet nástroje pro rozpoznávání řeči pro rozmanité řečové vzory.