Google підвищує доступність Android завдяки інтеграції Gemini AI

Google впровадила значні покращення доступності на основі штучного інтелекту для Android і Chrome, серед яких найпомітнішою стала інтеграція Gemini у TalkBack. Оновлення дозволяє користувачам із порушеннями зору не лише отримувати AI-генеровані описи зображень, а й ставити додаткові запитання про зображення та вміст екрана. Це нововведення, доступне на пристроях з Android 15 у вибраних англомовних країнах, є важливим кроком до створення більш інклюзивних технологій.

Google 15 травня 2025 року оголосила про впровадження низки покращень доступності на базі штучного інтелекту для Android і Chrome, значно покращивши цифровий досвід для користувачів із порушеннями зору.

Найбільш помітне оновлення отримав TalkBack — екранний диктор Android, який тепер використовує Gemini AI для надання інтерактивної допомоги. Якщо раніше TalkBack пропонував AI-генеровані описи зображень за відсутності альтернативного тексту, то тепер користувачі можуть ставити конкретні запитання щодо зображень і отримувати детальні відповіді. Наприклад, отримавши фото гітари, можна дізнатися її бренд, колір чи інші характеристики. Ця функція поширюється не лише на окремі зображення, а й на цілі екрани — користувачі можуть запитувати про матеріали товарів чи наявні знижки під час онлайн-шопінгу.

Google також удосконалила функцію Expressive Captions, яка тепер розпізнає не лише зміст сказаного, а й спосіб вимови. Нова функція тривалості враховує подовжені слова на кшталт "аааааах" чи "нууууу", щоб точніше передавати емоції та акценти. Додаткові звукові мітки для дій, як-от свист чи відкашлювання, ще більше збагачують досвід субтитрування. Оновлення вже впроваджується англійською мовою у США, Великій Британії, Канаді та Австралії для пристроїв з Android 15 і новіших версій.

Для користувачів Chrome Google представила технологію оптичного розпізнавання символів (OCR), яка автоматично обробляє відскановані PDF-файли. Завдяки цьому екранні диктори можуть працювати з раніше недоступними документами, дозволяючи виділяти, копіювати та шукати текст так само, як на звичайних веб-сторінках. Крім того, у Chrome для Android з’явилася функція Page Zoom, яка збільшує розмір тексту без порушення структури сторінки.

Ці нововведення демонструють, як штучний інтелект може сприяти створенню більш інклюзивних технологій. Інтегруючи можливості Gemini безпосередньо у засоби доступності, Google долає суттєві бар’єри для користувачів із порушеннями зору, які, за даними досліджень компанії, щодня стикаються в середньому з 90 неописаними зображеннями. Компанія продовжує розширювати свої ініціативи у сфері доступності, зокрема відкриваючи ресурси Project Euphonia для допомоги розробникам у створенні інструментів розпізнавання мовлення для різних мовних моделей.

Source:

Google підвищує доступність Android завдяки інтеграції Gemini AI

Latest News

Doubao AI від ByteDance тепер пропонує допомогу у режимі реального часу через відеозв’язок

OnePlus відмовляється від повзунка сповіщень на користь кнопки Plus Key з підтримкою ШІ

Німецькі технологічні гіганти об'єдналися для створення AI-гігафабрики за підтримки ЄС

Прокурори США розслідували Builder.ai перед крахом AI-стартапу вартістю $1,5 млрд

Норвезький фонд на $1,8 трлн робить використання ШІ обов’язковим для співробітників

OpenTools.ai презентує AI News Hub для ІТ-фахівців

Google розширює можливості керування комп’ютером за допомогою ШІ для розробників через Gemini

Google вдосконалює моделі Gemini прозорими підсумками мислення

Google підвищує доступність Android завдяки інтеграції Gemini AI

Related Articles

Doubao AI від ByteDance тепер пропонує допомогу у режимі реального часу через відеозв’язок

OnePlus відмовляється від повзунка сповіщень на користь кнопки Plus Key з підтримкою ШІ

Німецькі технологічні гіганти об'єдналися для створення AI-гігафабрики за підтримки ЄС

Latest News

Doubao AI від ByteDance тепер пропонує допомогу у режимі реального часу через відеозв’язок

OnePlus відмовляється від повзунка сповіщень на користь кнопки Plus Key з підтримкою ШІ

Німецькі технологічні гіганти об'єдналися для створення AI-гігафабрики за підтримки ЄС

Прокурори США розслідували Builder.ai перед крахом AI-стартапу вартістю $1,5 млрд

Норвезький фонд на $1,8 трлн робить використання ШІ обов’язковим для співробітників

OpenTools.ai презентує AI News Hub для ІТ-фахівців

Google розширює можливості керування комп’ютером за допомогою ШІ для розробників через Gemini

Google вдосконалює моделі Gemini прозорими підсумками мислення