Il colosso tecnologico cinese Xiaomi ha compiuto un importante passo avanti nell’intelligenza artificiale con il lancio del suo modello vocale di nuova generazione, MiDashengLM-7B, pensato per trasformare l’interazione con auto e case intelligenti.
Il nuovo modello, presentato il 4 agosto 2025, si basa sulla tecnologia vocale sviluppata da Xiaomi e già implementata nei suoi veicoli e nell’ecosistema smart home. Ciò che distingue questo sistema AI è l’integrazione del modello open-source Qwen2.5-Omni-7B di Alibaba Group, che dà vita a un potente ibrido capace di offrire prestazioni senza precedenti nel riconoscimento vocale e nell’elaborazione dei suoni ambientali.
A differenza degli assistenti vocali tradizionali, che si concentrano esclusivamente sul riconoscimento della voce, MiDashengLM-7B adotta un innovativo approccio di "general audio caption" che gli consente di comprendere il contesto attingendo contemporaneamente a molteplici fonti audio. In questo modo il sistema è in grado di interpretare non solo i comandi vocali, ma anche suoni ambientali come vetri rotti, applausi o musica di sottofondo.
Le prestazioni sono notevoli: Xiaomi dichiara risultati da record su 22 dataset pubblici di valutazione. Il modello risponde quattro volte più velocemente rispetto ai principali concorrenti e utilizza la memoria GPU con un’efficienza venti volte superiore. Questa efficienza computazionale è fondamentale per i piani di Xiaomi di consentire un funzionamento completamente offline anche su dispositivi con risorse limitate, migliorando così privacy e affidabilità.
Per le applicazioni automotive, la tecnologia permetterà funzionalità di sicurezza avanzate come avvisi basati su suoni senza la necessità di sensori aggiuntivi. Nel settore smart home, alimenterà interazioni più intuitive con dispositivi come gli speaker XiaoAI, consentendo loro di svolgere compiti complessi, dalla redazione di script alla ricerca di informazioni su richiesta.
In una mossa significativa per il settore, Xiaomi ha reso MiDashengLM-7B completamente open-source sotto licenza Apache 2.0, rendendolo disponibile sia per applicazioni commerciali che di ricerca. Questo approccio sfida gli ecosistemi chiusi di concorrenti come Google Assistant e Siri di Apple, potenzialmente accelerando l’innovazione nella tecnologia AI vocale.
Il rilascio si inserisce nella più ampia strategia di Xiaomi di diversificare oltre il mercato degli smartphone, puntando su veicoli elettrici e tecnologie per la smart home, con l’AI a fare da filo conduttore nell’ecosistema in espansione dell’azienda.