El gigante tecnológico chino Xiaomi ha dado un salto significativo en inteligencia artificial con el lanzamiento de su modelo de voz de próxima generación, MiDashengLM-7B, diseñado para transformar la interacción con autos y hogares inteligentes.
El nuevo modelo, presentado el 4 de agosto de 2025, se basa en la tecnología de voz fundamental de Xiaomi ya implementada en sus vehículos y ecosistema de hogar inteligente. Lo que distingue a este sistema de IA es su integración con el modelo de código abierto Qwen2.5-Omni-7B del Grupo Alibaba, creando un híbrido potente que ofrece un rendimiento sin precedentes en reconocimiento de voz y procesamiento de sonidos ambientales.
A diferencia de los asistentes de voz tradicionales que se centran únicamente en el reconocimiento del habla, MiDashengLM-7B emplea un novedoso enfoque de "descripción general de audio" que le permite comprender el contexto a partir de múltiples fuentes de audio simultáneamente. Esto permite que el sistema interprete no solo comandos hablados, sino también sonidos ambientales como cristales rotos, aplausos o música de fondo.
Las métricas de rendimiento son impresionantes, ya que Xiaomi afirma haber logrado resultados récord en 22 conjuntos de datos de evaluación públicos. El modelo responde cuatro veces más rápido que los principales competidores y utiliza la memoria GPU 20 veces de manera más eficiente. Esta eficiencia computacional es crucial para los planes de Xiaomi de habilitar un despliegue completamente offline en dispositivos con capacidad de procesamiento limitada, mejorando tanto la privacidad como la confiabilidad.
Para aplicaciones automotrices, la tecnología permitirá funciones avanzadas de seguridad, como alertas basadas en sonidos sin necesidad de sensores adicionales. En hogares inteligentes, impulsará interacciones más intuitivas con dispositivos como los altavoces XiaoAI, permitiendo realizar tareas complejas, desde redactar guiones hasta buscar información bajo demanda.
En un movimiento destacado para la industria, Xiaomi ha liberado completamente MiDashengLM-7B bajo la licencia Apache 2.0, haciéndolo disponible tanto para aplicaciones comerciales como de investigación. Este enfoque desafía los ecosistemas cerrados de competidores como Google Assistant y Siri de Apple, lo que podría acelerar la innovación en tecnología de voz IA.
El lanzamiento forma parte de la estrategia más amplia de Xiaomi para diversificarse más allá de los smartphones hacia vehículos eléctricos y tecnología para el hogar inteligente, con la IA como el elemento integrador en su creciente ecosistema de productos.