menu
close

바이트댄스의 두바오 AI, 실시간 영상 지원 기능 도입

바이트댄스가 인기 챗봇 두바오 AI에 혁신적인 실시간 영상 통화 기능을 추가해 다재다능한 디지털 어시스턴트로 탈바꿈시켰다. 사용자는 음성 통화 중 스마트폰 카메라를 켜는 것만으로 이 기능을 활성화할 수 있으며, 다양한 활동에 즉각적인 시각적 지원을 받을 수 있다. 이번 발전은 시각과 언어 처리를 자연스럽게 통합하는 바이트댄스의 멀티모달 AI 기술력을 보여준다.
바이트댄스의 두바오 AI, 실시간 영상 지원 기능 도입

틱톡의 모회사 바이트댄스가 2025년 5월 24일 두바오 챗봇에 획기적인 실시간 인터랙티브 영상 통화 기능을 공식 위챗 계정을 통해 발표하며 대대적인 업그레이드를 단행했다.

새로운 기능은 두바오를 기존 챗봇에서 실시간 시각적 안내가 가능한 정교한 디지털 어시스턴트로 변모시킨다. 사용자는 AI와의 음성 통화 중 스마트폰 카메라를 켜는 것만으로 손쉽게 이 기능을 사용할 수 있다. 활성화 시 두바오는 박물관 방문 시 박식한 도슨트, 식물 관찰 시 원예 전문가, 장보기 중 요리 조언가, 차트·그래프·영상 분석 시 분석 보조자 등 다양한 역할을 수행할 수 있다.

바이트댄스에 따르면, 이번 기능은 시각 및 언어 입력을 효과적으로 통합해 콘텐츠 제작과 다양한 주제의 심층 분석을 지원하는 자사의 첨단 시각 추론 AI 모델을 기반으로 한다. 또한, 최신 정보를 인터넷에서 실시간으로 검색하는 온라인 검색 기능도 탑재됐다.

이번 개발은 생성형 AI 분야에서 바이트댄스가 이룬 최신 성과로, 다양한 입력을 결합하는 멀티모달 시스템 개발 역량이 한층 강화됐음을 보여준다. 앞서 5월 초 두바오는 사진을 픽셀 아트로 변환하는 기능을 선보였으며, 2월에는 사진과 음성을 사실적인 영상으로 변환하는 능력으로 주목받은 OmniHuman-1 모델을 공개한 바 있다.

2025년 초 기준 월간 활성 이용자 약 7,500만 명을 기록한 두바오는 중국에서 가장 인기 있는 소비자용 AI 애플리케이션 중 하나로 자리매김했다. 플랫폼의 빠른 진화는 바이트댄스가 AI 기술에 막대한 투자를 지속하고 있음을 방증하며, 2025년 자본 지출만 200억 달러 이상이 AI 개발에 집중된 것으로 전해진다.

AI 분야 경쟁이 치열해지는 가운데, 두바오의 지속적인 혁신은 바이트댄스가 실시간·현실 세계에서 더욱 유용한 디지털 어시스턴트 구현을 목표로 멀티모달 AI 애플리케이션 분야 선도 입지를 굳히려는 의지를 보여준다.

Source:

Latest News