El gigante tecnológico chino Xiaomi ha dado un salto significativo en inteligencia artificial con el lanzamiento de su modelo de voz de próxima generación, MiDashengLM-7B, diseñado para transformar la interacción con coches y hogares inteligentes.
El nuevo modelo, presentado el 4 de agosto de 2025, se basa en la tecnología de voz fundamental de Xiaomi ya implementada en sus vehículos y ecosistema de hogar inteligente. Lo que diferencia a este sistema de IA es su integración con el modelo de código abierto Qwen2.5-Omni-7B del Grupo Alibaba, creando así un potente híbrido que ofrece un rendimiento sin precedentes en reconocimiento de voz y procesamiento de sonidos ambientales.
A diferencia de los asistentes de voz tradicionales, centrados únicamente en el reconocimiento del habla, MiDashengLM-7B emplea un novedoso enfoque de "descripción general de audio" que le permite comprender el contexto a partir de múltiples fuentes de audio de manera simultánea. Esto permite al sistema interpretar no solo comandos hablados, sino también sonidos ambientales como cristales rotos, aplausos o música de fondo.
Las métricas de rendimiento son impresionantes: Xiaomi afirma haber alcanzado resultados récord en 22 conjuntos de datos públicos de evaluación. El modelo responde cuatro veces más rápido que los principales competidores y utiliza la memoria GPU veinte veces de manera más eficiente. Esta eficiencia computacional es clave para los planes de Xiaomi de permitir un despliegue completamente offline en dispositivos con recursos limitados, mejorando tanto la privacidad como la fiabilidad.
En aplicaciones automovilísticas, la tecnología permitirá funciones avanzadas de seguridad, como alertas basadas en sonidos sin necesidad de sensores adicionales. En hogares inteligentes, potenciará interacciones más intuitivas con dispositivos como los altavoces XiaoAI, permitiéndoles realizar tareas complejas, desde redactar guiones hasta buscar información bajo demanda.
En un movimiento destacado para la industria, Xiaomi ha liberado completamente el código de MiDashengLM-7B bajo licencia Apache 2.0, poniéndolo a disposición tanto para aplicaciones comerciales como de investigación. Este enfoque desafía los ecosistemas cerrados de competidores como Google Assistant y Siri de Apple, y podría acelerar la innovación en tecnología de voz con IA.
El lanzamiento se enmarca en la estrategia más amplia de Xiaomi para diversificarse más allá de los smartphones hacia los vehículos eléctricos y la tecnología para el hogar inteligente, con la IA como nexo de unión en su creciente ecosistema de productos.