ByteDance, материнська компанія TikTok, суттєво оновила свій чат-бот Doubao, додавши революційну функцію інтерактивних відеодзвінків у реальному часі, про що було оголошено 24 травня 2025 року через офіційний акаунт застосунку у WeChat.
Нова функція перетворює Doubao зі звичайного чат-бота на сучасного цифрового асистента, здатного надавати візуальні підказки у реальному часі. Користувачі можуть легко активувати цю можливість, увімкнувши камеру смартфона під час голосового дзвінка з AI. Після активації Doubao може виконувати різноманітні ролі: бути обізнаним гідом під час відвідування музеїв, експертом із садівництва при огляді рослин, кулінарним радником під час покупок у магазині чи аналітичним помічником при перегляді графіків, діаграм та відео.
За словами ByteDance, це оновлення базується на їхній передовій моделі AI для візуального мислення, яка ефективно інтегрує візуальні та мовні дані для підтримки створення контенту та глибокого аналізу різних тем. Технологія також включає можливості онлайн-пошуку для отримання актуальної інформації з інтернету.
Цей розвиток є черговим досягненням ByteDance у сфері генеративного AI, підкреслюючи зростаючу експертизу компанії у створенні мультимодальних систем, що поєднують різні типи вхідних даних. Раніше у травні Doubao представив функцію перетворення фотографій у піксель-арт, а у лютому ByteDance презентувала модель OmniHuman-1, яка привернула увагу здатністю трансформувати фото та аудіо у реалістичні відео.
Станом на початок 2025 року Doubao має близько 75 мільйонів активних користувачів на місяць, що робить його одним із найпопулярніших AI-застосунків для споживачів у Китаї. Швидка еволюція платформи відображає значні інвестиції ByteDance у технології штучного інтелекту — за повідомленнями, компанія планує витратити понад 20 мільярдів доларів на капітальні інвестиції у 2025 році, значна частина яких спрямована на розвиток AI.
На тлі зростаючої конкуренції у сфері штучного інтелекту постійні інновації ByteDance із Doubao свідчать про прагнення компанії зберігати лідерство у динамічній галузі мультимодальних AI-застосунків, які обіцяють зробити цифрових асистентів ще кориснішими у реальних, повсякденних ситуаціях.