Китайский технологический гигант Xiaomi совершил значительный прорыв в области искусственного интеллекта, представив голосовую модель нового поколения MiDashengLM-7B, призванную изменить взаимодействие с автомобилями и умными домами.
Новая модель, представленная 4 августа 2025 года, основана на фирменных технологиях голосового управления Xiaomi, которые уже используются в автомобилях и экосистеме умного дома компании. Ключевая особенность системы — интеграция с открытой моделью Qwen2.5-Omni-7B от Alibaba Group, что позволило создать мощный гибрид с беспрецедентной производительностью в распознавании речи и обработке звуков окружающей среды.
В отличие от традиционных голосовых ассистентов, ориентированных исключительно на распознавание речи, MiDashengLM-7B использует инновационный подход «универсального аудиозаголовка», который позволяет системе одновременно понимать контекст из различных аудиосигналов. Благодаря этому система способна интерпретировать не только голосовые команды, но и такие звуки, как разбитое стекло, хлопки или музыка на фоне.
Показатели производительности впечатляют: по заявлениям Xiaomi, модель продемонстрировала рекордные результаты на 22 общедоступных тестовых наборах данных. MiDashengLM-7B реагирует в четыре раза быстрее ведущих конкурентов и в 20 раз эффективнее использует память GPU. Такая вычислительная эффективность критически важна для планов Xiaomi по обеспечению полноценной офлайн-работы на устройствах с ограниченными ресурсами, что повышает уровень приватности и надежности.
В автомобильных приложениях технология позволит реализовать продвинутые функции безопасности, такие как оповещения на основе звуков, без необходимости в дополнительных датчиках. В умных домах она обеспечит более интуитивное взаимодействие с устройствами, например, колонками XiaoAI, позволяя им выполнять сложные задачи — от составления сценариев до поиска информации по запросу.
Важным шагом для отрасли стало полное открытие исходного кода MiDashengLM-7B по лицензии Apache 2.0 — модель доступна как для коммерческого, так и для исследовательского использования. Такой подход бросает вызов закрытым экосистемам конкурентов, таких как Google Assistant и Siri от Apple, и может ускорить инновации в области голосовых AI-технологий.
Релиз модели стал частью более широкой стратегии Xiaomi по диверсификации бизнеса за пределы смартфонов — в сторону электромобилей и умных устройств, где искусственный интеллект становится связующим звеном растущей продуктовой экосистемы компании.