menu
close

Xiaomi lansează un nou model vocal AI de generație următoare pentru case inteligente și automobile

Xiaomi a prezentat MiDashengLM-7B, un model vocal AI open-source avansat, conceput pentru a revoluționa experiențele din domeniul auto și al caselor inteligente. Modelul oferă timpi de răspuns semnificativ mai rapizi, funcționare offline și control vocal sofisticat, conștient de context, capabil să înțeleagă atât vorbirea, cât și sunetele de mediu. Bazat pe platforma vocală existentă a Xiaomi și integrat cu Qwen2.5-Omni-7B de la Alibaba, acesta va echipa viitoarele vehicule electrice Xiaomi și dispozitivele Mi Home, oferind dezvoltatorilor acces complet sub licența Apache 2.0.
Xiaomi lansează un nou model vocal AI de generație următoare pentru case inteligente și automobile

Gigantul tehnologic chinez Xiaomi a făcut un salt semnificativ în domeniul inteligenței artificiale prin lansarea modelului vocal de generație următoare MiDashengLM-7B, proiectat pentru a transforma interacțiunile cu automobilele și casele inteligente.

Noul model, prezentat pe 4 august 2025, se bazează pe tehnologia vocală fundamentală a Xiaomi, deja implementată în vehiculele și ecosistemul său de casă inteligentă. Ceea ce diferențiază acest sistem AI este integrarea modelului open-source Qwen2.5-Omni-7B al grupului Alibaba, creând astfel un hibrid puternic ce oferă performanțe fără precedent în recunoașterea vocală și procesarea sunetelor de mediu.

Spre deosebire de asistenții vocali tradiționali, care se concentrează exclusiv pe recunoașterea vorbirii, MiDashengLM-7B utilizează o abordare inovatoare de tip „general audio caption”, care îi permite să înțeleagă contextul din mai multe surse audio simultan. Astfel, sistemul poate interpreta nu doar comenzile vocale, ci și sunete de mediu precum spargerea sticlei, aplauze sau muzică de fundal.

Performanțele sunt impresionante, Xiaomi susținând rezultate record pe 22 de seturi de date publice de evaluare. Modelul răspunde de patru ori mai rapid decât principalii competitori și utilizează memoria GPU de 20 de ori mai eficient. Această eficiență computațională este esențială pentru planurile Xiaomi de a permite implementarea complet offline pe dispozitive cu putere de procesare limitată, sporind astfel atât confidențialitatea, cât și fiabilitatea.

Pentru aplicațiile auto, tehnologia va permite funcții avansate de securitate, precum alerte bazate pe sunet, fără a necesita senzori suplimentari. În casele inteligente, va alimenta interacțiuni mai intuitive cu dispozitive precum boxele XiaoAI, permițându-le să execute sarcini complexe, de la redactarea de scripturi până la căutarea de informații la cerere.

Într-o mișcare notabilă pentru industrie, Xiaomi a open-sourcet complet MiDashengLM-7B sub licența Apache 2.0, făcându-l disponibil atât pentru aplicații comerciale, cât și pentru cercetare. Această abordare contrazice ecosistemele închise ale competitorilor precum Google Assistant și Apple Siri, având potențialul de a accelera inovația în tehnologia AI vocală.

Lansarea face parte din strategia mai largă a Xiaomi de a se diversifica dincolo de smartphone-uri, către vehicule electrice și tehnologie pentru case inteligente, cu AI ca element de legătură între produsele aflate în continuă expansiune.

Source:

Latest News