Ο κινεζικός τεχνολογικός κολοσσός Xiaomi έκανε ένα σημαντικό άλμα στην τεχνητή νοημοσύνη με την κυκλοφορία του επόμενης γενιάς φωνητικού μοντέλου του, MiDashengLM-7B, που έχει σχεδιαστεί για να μεταμορφώσει τις αλληλεπιδράσεις με αυτοκίνητα και έξυπνα σπίτια.
Το νέο μοντέλο, που παρουσιάστηκε στις 4 Αυγούστου 2025, βασίζεται στην θεμελιώδη φωνητική τεχνολογία της Xiaomi που ήδη χρησιμοποιείται στα οχήματα και το οικοσύστημα έξυπνου σπιτιού της. Αυτό που το ξεχωρίζει είναι η ενσωμάτωση του ανοιχτού κώδικα μοντέλου Qwen2.5-Omni-7B της Alibaba Group, δημιουργώντας ένα ισχυρό υβρίδιο που προσφέρει πρωτοφανή απόδοση στην αναγνώριση φωνής και την επεξεργασία ήχων περιβάλλοντος.
Σε αντίθεση με τους παραδοσιακούς φωνητικούς βοηθούς που εστιάζουν αποκλειστικά στην αναγνώριση ομιλίας, το MiDashengLM-7B υιοθετεί μια νέα προσέγγιση "γενικής λεζάντας ήχου", που του επιτρέπει να κατανοεί το πλαίσιο από πολλαπλές πηγές ήχου ταυτόχρονα. Έτσι, το σύστημα μπορεί να ερμηνεύει όχι μόνο φωνητικές εντολές αλλά και ήχους περιβάλλοντος, όπως σπάσιμο γυαλιού, παλαμάκια ή μουσική στο παρασκήνιο.
Τα επιδόσεις του μοντέλου είναι εντυπωσιακές, με τη Xiaomi να αναφέρει ρεκόρ σε 22 δημόσια σύνολα αξιολόγησης. Το μοντέλο ανταποκρίνεται τέσσερις φορές ταχύτερα από τους κορυφαίους ανταγωνιστές και χρησιμοποιεί τη μνήμη GPU 20 φορές πιο αποδοτικά. Αυτή η υπολογιστική αποδοτικότητα είναι κρίσιμη για τα σχέδια της Xiaomi να επιτρέψει πλήρη λειτουργία εκτός σύνδεσης σε συσκευές με περιορισμένη επεξεργαστική ισχύ, ενισχύοντας τόσο το απόρρητο όσο και την αξιοπιστία.
Για εφαρμογές στην αυτοκινητοβιομηχανία, η τεχνολογία θα επιτρέψει προηγμένες λειτουργίες ασφαλείας, όπως ειδοποιήσεις βάσει ήχου χωρίς την ανάγκη πρόσθετων αισθητήρων. Στα έξυπνα σπίτια, θα προσφέρει πιο διαισθητική αλληλεπίδραση με συσκευές όπως τα ηχεία XiaoAI, επιτρέποντάς τους να εκτελούν σύνθετες εργασίες, από τη σύνταξη σεναρίων έως την αναζήτηση πληροφοριών κατά παραγγελία.
Σε μια αξιοσημείωτη κίνηση για τον κλάδο, η Xiaomi έχει ανοίξει πλήρως τον κώδικα του MiDashengLM-7B υπό την άδεια Apache 2.0, καθιστώντας το διαθέσιμο τόσο για εμπορική όσο και για ερευνητική χρήση. Αυτή η προσέγγιση αμφισβητεί τα κλειστά οικοσυστήματα ανταγωνιστών όπως το Google Assistant και η Siri της Apple, ενδεχομένως επιταχύνοντας την καινοτομία στη φωνητική τεχνητή νοημοσύνη.
Η κυκλοφορία αυτή εντάσσεται στη στρατηγική της Xiaomi να διαφοροποιηθεί πέρα από τα smartphones, επεκτεινόμενη στα ηλεκτρικά οχήματα και την τεχνολογία έξυπνου σπιτιού, με την τεχνητή νοημοσύνη να λειτουργεί ως ο συνδετικός κρίκος σε όλο το διευρυνόμενο οικοσύστημά της.