Der chinesische Technologiekonzern Xiaomi hat mit der Veröffentlichung seines neuen Sprachmodells MiDashengLM-7B einen bedeutenden Schritt im Bereich der künstlichen Intelligenz gemacht. Das Modell wurde entwickelt, um die Interaktion mit Autos und Smart Homes grundlegend zu verändern.
Das am 4. August 2025 vorgestellte Modell baut auf Xiaomis bereits in Fahrzeugen und im Smart-Home-Ökosystem eingesetzter Sprachtechnologie auf. Herausragend ist die Integration des Open-Source-Modells Qwen2.5-Omni-7B von der Alibaba Group, wodurch eine leistungsstarke Hybridlösung entsteht, die neue Maßstäbe bei Spracherkennung und Verarbeitung von Umgebungsgeräuschen setzt.
Im Gegensatz zu herkömmlichen Sprachassistenten, die sich ausschließlich auf Spracherkennung konzentrieren, verfolgt MiDashengLM-7B einen neuartigen Ansatz des „General Audio Captioning“. Dadurch kann das System Kontext aus mehreren Audioquellen gleichzeitig erfassen. So werden nicht nur gesprochene Befehle, sondern auch Umgebungsgeräusche wie zerbrechendes Glas, Klatschen oder Musik im Hintergrund erkannt und interpretiert.
Die Leistungsdaten sind beeindruckend: Xiaomi meldet Rekordergebnisse in 22 öffentlichen Evaluierungsdatensätzen. Das Modell reagiert viermal schneller als führende Wettbewerber und nutzt den GPU-Speicher zwanzigmal effizienter. Diese Recheneffizienz ist entscheidend für Xiaomis Pläne, eine vollständige Offline-Nutzung auf Geräten mit begrenzter Rechenleistung zu ermöglichen – was sowohl Datenschutz als auch Zuverlässigkeit erhöht.
Im Automobilbereich ermöglicht die Technologie fortschrittliche Sicherheitsfunktionen wie auf Geräuschen basierende Warnmeldungen, ohne dass zusätzliche Sensoren erforderlich sind. Im Smart Home sorgt sie für intuitivere Interaktionen mit Geräten wie XiaoAI-Lautsprechern, die dadurch komplexe Aufgaben wie das Erstellen von Skripten oder das Abrufen von Informationen auf Zuruf erledigen können.
Bemerkenswert ist Xiaomis Entscheidung, MiDashengLM-7B vollständig als Open Source unter der Apache-2.0-Lizenz zu veröffentlichen und damit sowohl kommerzielle als auch wissenschaftliche Anwendungen zu ermöglichen. Dieser Schritt stellt eine Herausforderung für die geschlossenen Ökosysteme von Wettbewerbern wie Google Assistant und Apples Siri dar und könnte die Innovation im Bereich Sprach-KI deutlich beschleunigen.
Die Veröffentlichung ist Teil von Xiaomis übergeordneter Strategie, sich über das Smartphone-Geschäft hinaus zu diversifizieren – insbesondere in den Bereichen Elektrofahrzeuge und Smart-Home-Technologie. Künstliche Intelligenz bildet dabei das verbindende Element im wachsenden Produkt-Ökosystem des Unternehmens.