Le jeudi 15 mai 2025, Google a annoncé une série d’améliorations en accessibilité alimentées par l’IA pour Android et Chrome, améliorant considérablement l’expérience numérique des personnes ayant une déficience visuelle.
La mise à jour la plus marquante concerne TalkBack, le lecteur d’écran d’Android, qui utilise désormais l’IA Gemini pour offrir une assistance interactive. Alors que TalkBack proposait déjà des descriptions d’images générées par l’IA lorsque le texte alternatif n’était pas disponible, les utilisateurs peuvent maintenant poser des questions précises sur les images et recevoir des réponses détaillées. Par exemple, si une personne reçoit une photo d’une guitare, elle peut demander la marque, la couleur ou d’autres détails. Cette fonctionnalité s’étend au-delà des images individuelles à l’ensemble de l’écran, permettant aux utilisateurs de s’informer sur les matériaux d’un produit ou les rabais disponibles lors de leurs achats.
Google a également bonifié sa fonction de sous-titres expressifs, qui saisit désormais non seulement ce que les gens disent, mais aussi la façon dont ils le disent. La nouvelle fonction de durée reconnaît les mots allongés comme « amaaazing » ou « nooooo » afin de mieux transmettre l’émotion et l’emphase. Des étiquettes sonores supplémentaires pour des actions comme siffler ou se racler la gorge enrichissent encore davantage l’expérience de sous-titrage. Cette mise à jour est en cours de déploiement en anglais aux États-Unis, au Royaume-Uni, au Canada et en Australie pour les appareils fonctionnant sous Android 15 et plus.
Pour les utilisateurs de Chrome, Google a introduit une technologie de reconnaissance optique de caractères (ROC) qui traite automatiquement les fichiers PDF numérisés. Cette avancée permet aux lecteurs d’écran d’interagir avec des documents auparavant inaccessibles, donnant la possibilité de surligner, copier et rechercher du texte comme sur n’importe quelle page web standard. De plus, Chrome pour Android propose maintenant un zoom de page, qui augmente la taille du texte sans perturber la mise en page du site.
Ces développements démontrent comment l’IA peut être mise à profit pour créer une technologie plus inclusive. En intégrant directement les capacités de Gemini dans les outils d’accessibilité, Google s’attaque à des obstacles majeurs rencontrés par les personnes malvoyantes, qui croisent en moyenne 90 images non étiquetées par jour selon les recherches de Google. L’entreprise continue d’élargir ses initiatives en accessibilité, notamment en ouvrant les ressources du projet Euphonia pour aider les développeurs à créer des outils de reconnaissance vocale adaptés à la diversité des façons de parler.