Ang higanteng teknolohiyang Tsino na Xiaomi ay gumawa ng malaking hakbang sa larangan ng artificial intelligence sa pamamagitan ng paglabas ng kanilang next-generation voice model, ang MiDashengLM-7B, na layuning baguhin ang paraan ng pakikisalamuha sa mga sasakyan at smart homes.
Ang bagong modelong ito, na ipinakilala noong Agosto 4, 2025, ay nakabatay sa pundasyong voice technology ng Xiaomi na ginagamit na sa kanilang mga sasakyan at smart home ecosystem. Ang nagpapaiba sa sistemang ito ay ang integrasyon ng open-source Qwen2.5-Omni-7B model ng Alibaba Group, na bumuo ng isang makapangyarihang hybrid para sa walang kapantay na performance sa voice recognition at pagproseso ng tunog sa paligid.
Hindi tulad ng mga tradisyonal na voice assistant na nakatuon lamang sa speech recognition, gumagamit ang MiDashengLM-7B ng kakaibang "general audio caption" na pamamaraan na nagbibigay-daan dito upang maunawaan ang konteksto mula sa iba't ibang audio source nang sabay-sabay. Dahil dito, kaya nitong bigyang-kahulugan hindi lamang ang mga sinasalitang utos kundi pati na rin ang mga tunog sa paligid tulad ng nabasag na salamin, palakpakan, o musikang tumutugtog sa background.
Kahanga-hanga ang performance metrics nito, kung saan ipinagmamalaki ng Xiaomi ang record-setting na resulta sa 22 pampublikong evaluation datasets. Apat na beses na mas mabilis ang pagtugon ng modelong ito kumpara sa mga nangungunang kakumpitensya at dalawampung beses na mas episyente sa paggamit ng GPU memory. Napakahalaga ng computational efficiency na ito para sa plano ng Xiaomi na magpatakbo ng offline deployment sa mga device na may limitadong processing power, na nagpapahusay sa privacy at reliability.
Para sa automotive applications, magpapagana ang teknolohiyang ito ng mga advanced na security feature tulad ng sound-based alerts nang hindi na kailangan ng karagdagang sensors. Sa smart homes naman, magbibigay ito ng mas intuitive na interaksyon sa mga device tulad ng XiaoAI speakers, na magpapahintulot sa mga ito na magsagawa ng mas komplikadong gawain mula sa paggawa ng scripts hanggang sa paghahanap ng impormasyon on demand.
Sa isang makabuluhang hakbang para sa industriya, ganap na in-open source ng Xiaomi ang MiDashengLM-7B sa ilalim ng Apache 2.0 license, na ginagawang available ito para sa parehong commercial at research applications. Hinahamon ng hakbang na ito ang mga closed ecosystem ng mga kakumpitensya tulad ng Google Assistant at Apple Siri, na posibleng magpabilis ng inobasyon sa voice AI technology.
Ang paglabas ng MiDashengLM-7B ay bahagi ng mas malawak na estratehiya ng Xiaomi na lumawak lampas sa smartphones patungo sa electric vehicles at smart home technology, kung saan nagsisilbing nag-uugnay na teknolohiya ang AI sa lumalawak nitong ecosystem ng mga produkto.