menu
close

Xiaomi dévoile un modèle vocal IA de nouvelle génération pour maisons intelligentes et voitures

Xiaomi a lancé MiDashengLM-7B, un modèle vocal IA open source avancé conçu pour révolutionner l’expérience automobile et domotique. Ce modèle offre des temps de réponse nettement plus rapides, des capacités hors ligne et un contrôle vocal contextuel sophistiqué capable de comprendre la parole ainsi que les sons environnementaux. Développé à partir de la plateforme vocale existante de Xiaomi et intégré au Qwen2.5-Omni-7B d’Alibaba, il équipera les prochains véhicules électriques Xiaomi et appareils Mi Home, tout en offrant aux développeurs un accès complet sous licence Apache 2.0.
Xiaomi dévoile un modèle vocal IA de nouvelle génération pour maisons intelligentes et voitures

Le géant chinois de la technologie Xiaomi franchit une étape majeure en intelligence artificielle avec le lancement de son modèle vocal de nouvelle génération, MiDashengLM-7B, destiné à transformer les interactions avec les voitures et les maisons intelligentes.

Dévoilé le 4 août 2025, ce nouveau modèle s’appuie sur la technologie vocale de base de Xiaomi déjà présente dans ses véhicules et son écosystème domotique. Ce qui distingue ce système IA, c’est l’intégration du modèle open source Qwen2.5-Omni-7B du groupe Alibaba, créant ainsi un hybride puissant offrant des performances inédites en reconnaissance vocale et en traitement des sons ambiants.

Contrairement aux assistants vocaux traditionnels qui se concentrent uniquement sur la reconnaissance de la parole, MiDashengLM-7B adopte une approche novatrice de « description audio générale » lui permettant de comprendre le contexte à partir de plusieurs sources audio simultanément. Le système peut ainsi interpréter non seulement les commandes vocales, mais aussi des sons environnementaux comme du verre brisé, des applaudissements ou de la musique en arrière-plan.

Les performances sont impressionnantes : Xiaomi affirme avoir obtenu des résultats records sur 22 jeux de données d’évaluation publics. Le modèle répond quatre fois plus rapidement que les principaux concurrents et utilise la mémoire GPU vingt fois plus efficacement. Cette efficacité computationnelle est cruciale pour permettre à Xiaomi d’offrir un déploiement entièrement hors ligne sur des appareils à puissance limitée, améliorant ainsi la confidentialité et la fiabilité.

Pour l’automobile, la technologie permettra des fonctions de sécurité avancées, comme des alertes basées sur le son, sans nécessiter de capteurs additionnels. Dans les maisons intelligentes, elle favorisera des interactions plus intuitives avec des appareils comme les haut-parleurs XiaoAI, capables d’effectuer des tâches complexes allant de la rédaction de scripts à la recherche d’informations à la demande.

Dans une démarche notable pour l’industrie, Xiaomi a entièrement ouvert le code source de MiDashengLM-7B sous licence Apache 2.0, le rendant accessible tant pour les usages commerciaux que pour la recherche. Cette approche remet en question les écosystèmes fermés de concurrents comme Google Assistant et Siri d’Apple, et pourrait accélérer l’innovation dans la technologie vocale IA.

Cette annonce s’inscrit dans la stratégie plus large de Xiaomi visant à se diversifier au-delà des téléphones intelligents, notamment dans les véhicules électriques et la domotique, l’IA servant de lien central à travers son écosystème de produits en expansion.

Source:

Latest News