중국의 기술 대기업 샤오미가 자동차 및 스마트홈과의 상호작용 방식을 혁신할 차세대 음성 모델 'MiDashengLM-7B'를 공개하며 인공지능 분야에서 큰 도약을 이뤘다.
2025년 8월 4일 공개된 이 신형 모델은 이미 샤오미 차량과 스마트홈 생태계에 적용된 자사의 음성 기술을 기반으로 개발됐다. 이번 AI 시스템의 가장 큰 특징은 알리바바 그룹의 오픈소스 모델 'Qwen2.5-Omni-7B'와의 통합으로, 음성 인식과 환경음 처리에서 전례 없는 성능을 제공하는 강력한 하이브리드 모델이라는 점이다.
기존 음성 비서가 음성 인식에만 집중했던 것과 달리, MiDashengLM-7B는 '범용 오디오 캡션' 방식을 도입해 다양한 오디오 소스로부터 동시에 맥락을 파악할 수 있다. 이를 통해 단순한 음성 명령뿐 아니라 유리 깨지는 소리, 박수, 배경 음악 등 환경음까지 해석할 수 있다.
샤오미에 따르면, 이 모델은 22개의 공개 평가 데이터셋에서 기록적인 성능을 보였으며, 주요 경쟁 모델 대비 4배 빠른 응답 속도와 20배 더 효율적인 GPU 메모리 사용량을 자랑한다. 이러한 연산 효율성 덕분에 샤오미는 연산 능력이 제한된 기기에서도 완전한 오프라인 구동이 가능하도록 하여, 개인정보 보호와 신뢰성을 모두 강화할 계획이다.
자동차 분야에서는 추가 센서 없이도 소리 기반 경고 등 고급 보안 기능을 제공할 수 있으며, 스마트홈에서는 샤오미의 XiaoAI 스피커 등 기기와의 직관적인 상호작용이 가능해진다. 예를 들어, 복잡한 스크립트 작성이나 정보 검색 등 다양한 작업을 음성만으로 수행할 수 있다.
특히 샤오미는 MiDashengLM-7B를 Apache 2.0 라이선스로 완전 오픈소스화해 상업적·연구 목적으로 누구나 사용할 수 있도록 했다. 이는 구글 어시스턴트, 애플 시리 등 경쟁사의 폐쇄적 생태계에 도전하는 행보로, 음성 AI 기술 혁신을 가속화할 것으로 기대된다.
이번 발표는 샤오미가 스마트폰을 넘어 전기차와 스마트홈 등으로 사업 영역을 확장하는 전략의 일환으로, AI가 샤오미 제품 생태계 전반을 연결하는 핵심 역할을 하게 될 전망이다.