Google je u četvrtak, 15. svibnja 2025., najavio niz poboljšanja pristupačnosti temeljenih na umjetnoj inteligenciji za Android i Chrome, značajno unaprijedivši digitalno iskustvo korisnika s oštećenjem vida.
Najvažnija novost odnosi se na TalkBack, čitač ekrana za Android, koji sada koristi Gemini AI za interaktivnu asistenciju. Dok je TalkBack ranije nudio AI-generirane opise slika kada alt tekst nije bio dostupan, korisnici sada mogu postavljati konkretna pitanja o slikama i dobivati detaljne odgovore. Primjerice, ako netko primi fotografiju gitare, može pitati o njezinom brendu, boji ili drugim detaljima. Ova funkcionalnost proširuje se i na cijele ekrane, omogućujući korisnicima da pitaju o materijalima proizvoda ili dostupnim popustima tijekom online kupovine.
Google je također unaprijedio značajku Expressive Captions, koja sada prepoznaje ne samo što ljudi govore, već i kako to govore. Nova opcija za trajanje prepoznaje izdužene riječi poput "amaaaazing" ili "nooooo" kako bi se bolje prenijele emocije i naglasak. Dodatne oznake zvukova za radnje poput zviždanja ili pročišćavanja grla dodatno obogaćuju iskustvo titlova. Ovo ažuriranje uvodi se na engleskom jeziku u SAD-u, Ujedinjenom Kraljevstvu, Kanadi i Australiji za uređaje s Androidom 15 i novijim.
Za korisnike Chromea, Google je predstavio tehnologiju optičkog prepoznavanja znakova (OCR) koja automatski obrađuje skenirane PDF-ove. Ovo poboljšanje omogućuje čitačima ekrana interakciju s dokumentima koji su prethodno bili nepristupačni, pa korisnici mogu označavati, kopirati i pretraživati tekst kao na bilo kojoj standardnoj web-stranici. Dodatno, Chrome za Android sada ima značajku Page Zoom, koja povećava veličinu teksta bez narušavanja izgleda stranice.
Ovi razvojni koraci pokazuju kako se umjetna inteligencija može iskoristiti za stvaranje inkluzivnije tehnologije. Integracijom mogućnosti Gemini AI-ja izravno u alate za pristupačnost, Google rješava značajne prepreke s kojima se suočavaju korisnici s oštećenjem vida, koji prema Googleovim istraživanjima dnevno nailaze na prosječno 90 nespecificiranih slika. Tvrtka nastavlja širiti svoje inicijative za pristupačnost, uključujući otvaranje resursa projekta Euphonia kako bi pomogla developerima u izradi alata za prepoznavanje govora za različite govorne obrasce.