Google anunció el jueves 15 de mayo de 2025 una serie de mejoras de accesibilidad impulsadas por inteligencia artificial para Android y Chrome, mejorando significativamente la experiencia digital de las personas con discapacidad visual.
La actualización más destacada llega a TalkBack, el lector de pantalla de Android, que ahora utiliza Gemini AI para ofrecer asistencia interactiva. Mientras que antes TalkBack generaba descripciones de imágenes mediante IA cuando no había texto alternativo disponible, ahora los usuarios pueden hacer preguntas específicas sobre las imágenes y recibir respuestas detalladas. Por ejemplo, si alguien recibe una foto de una guitarra, puede preguntar sobre la marca, el color u otros detalles. Esta funcionalidad se extiende más allá de imágenes individuales a pantallas completas, permitiendo a los usuarios consultar sobre materiales de productos o descuentos disponibles al comprar en línea.
Google también ha mejorado su función de Subtítulos Expresivos, que ahora captura no solo lo que las personas dicen, sino cómo lo dicen. La nueva función de duración reconoce palabras alargadas como "amaaaazing" o "nooooo" para transmitir mejor la emoción y el énfasis. Etiquetas de sonido adicionales para acciones como silbar o aclararse la garganta enriquecen aún más la experiencia de subtitulado. Esta actualización se está implementando en inglés en Estados Unidos, Reino Unido, Canadá y Australia para dispositivos con Android 15 o superior.
Para los usuarios de Chrome, Google ha introducido tecnología de Reconocimiento Óptico de Caracteres (OCR) que procesa automáticamente archivos PDF escaneados. Este avance permite que los lectores de pantalla interactúen con documentos que antes eran inaccesibles, permitiendo a los usuarios resaltar, copiar y buscar texto como lo harían en cualquier página web estándar. Además, Chrome para Android ahora incluye la función de Zoom de Página, que aumenta el tamaño del texto sin alterar el diseño de la página web.
Estos desarrollos demuestran cómo la IA puede aprovecharse para crear tecnología más inclusiva. Al integrar las capacidades de Gemini directamente en las herramientas de accesibilidad, Google está abordando barreras significativas que enfrentan las personas con discapacidad visual, quienes, según investigaciones de Google, se encuentran con un promedio de 90 imágenes sin etiquetar diariamente. La compañía continúa ampliando sus iniciativas de accesibilidad, incluyendo la apertura de los recursos de Project Euphonia para ayudar a desarrolladores a crear herramientas de reconocimiento de voz para diversos patrones de habla.