menu
close

Xiaomi prezentuje nową generację modelu głosowego AI dla inteligentnych domów i samochodów

Xiaomi wprowadziło MiDashengLM-7B – zaawansowany, otwartoźródłowy model głosowy AI, który ma zrewolucjonizować doświadczenia w motoryzacji i inteligentnych domach. Model oferuje znacznie szybsze reakcje, pracę offline oraz zaawansowaną, kontekstową obsługę głosu, rozumiejąc zarówno mowę, jak i dźwięki otoczenia. Zbudowany na bazie istniejącej platformy głosowej Xiaomi i zintegrowany z Qwen2.5-Omni-7B od Alibaba, będzie napędzał nadchodzące samochody elektryczne Xiaomi oraz urządzenia Mi Home, a deweloperzy otrzymają pełny dostęp na licencji Apache 2.0.
Xiaomi prezentuje nową generację modelu głosowego AI dla inteligentnych domów i samochodów

Chiński gigant technologiczny Xiaomi wykonał znaczący krok naprzód w dziedzinie sztucznej inteligencji, prezentując nowej generacji model głosowy MiDashengLM-7B, zaprojektowany z myślą o rewolucji w interakcji z samochodami i inteligentnymi domami.

Nowy model, zaprezentowany 4 sierpnia 2025 roku, bazuje na fundamentach technologii głosowej Xiaomi, która już dziś jest wykorzystywana w pojazdach i ekosystemie smart home tej marki. Tym, co wyróżnia ten system AI, jest integracja otwartoźródłowego modelu Qwen2.5-Omni-7B od Alibaba Group, co pozwoliło stworzyć potężną hybrydę oferującą niespotykaną dotąd wydajność w rozpoznawaniu mowy i przetwarzaniu dźwięków otoczenia.

W przeciwieństwie do tradycyjnych asystentów głosowych skupiających się wyłącznie na rozpoznawaniu mowy, MiDashengLM-7B wykorzystuje nowatorskie podejście „ogólnego opisu dźwięku” (general audio caption), umożliwiając zrozumienie kontekstu na podstawie wielu źródeł dźwięku jednocześnie. Dzięki temu system potrafi interpretować nie tylko polecenia głosowe, ale także dźwięki otoczenia, takie jak tłuczone szkło, oklaski czy muzyka w tle.

Osiągi modelu są imponujące – Xiaomi deklaruje rekordowe wyniki w 22 publicznych zestawach testowych. Model odpowiada czterokrotnie szybciej niż czołowi konkurenci i wykorzystuje pamięć GPU dwudziestokrotnie efektywniej. Ta wydajność obliczeniowa jest kluczowa dla planów Xiaomi, które zakładają pełną obsługę offline na urządzeniach o ograniczonej mocy obliczeniowej, co zwiększa zarówno prywatność, jak i niezawodność.

W zastosowaniach motoryzacyjnych technologia umożliwi zaawansowane funkcje bezpieczeństwa, takie jak alarmy dźwiękowe, bez konieczności stosowania dodatkowych czujników. W inteligentnych domach model pozwoli na bardziej intuicyjną obsługę urządzeń, takich jak głośniki XiaoAI, umożliwiając im wykonywanie złożonych zadań – od tworzenia skryptów po wyszukiwanie informacji na żądanie.

Ważnym krokiem dla branży jest pełne otwarcie kodu MiDashengLM-7B na licencji Apache 2.0, co czyni go dostępnym zarówno do zastosowań komercyjnych, jak i badawczych. Takie podejście stanowi wyzwanie dla zamkniętych ekosystemów konkurencji, takich jak Google Assistant czy Siri od Apple, i może znacząco przyspieszyć innowacje w dziedzinie technologii głosowych AI.

Premiera modelu wpisuje się w szerszą strategię Xiaomi, która zakłada dywersyfikację działalności poza smartfony – w kierunku samochodów elektrycznych i technologii inteligentnych domów, gdzie sztuczna inteligencja ma być spoiwem łączącym cały, rozrastający się ekosystem produktów firmy.

Source:

Latest News