O gigante tecnológico chinês Xiaomi deu um salto significativo na inteligência artificial com o lançamento do seu modelo de voz de próxima geração, MiDashengLM-7B, concebido para transformar as interações com automóveis e casas inteligentes.
O novo modelo, apresentado a 4 de agosto de 2025, baseia-se na tecnologia de voz fundamental da Xiaomi já implementada nos seus veículos e no ecossistema doméstico inteligente. O que distingue este sistema de IA é a integração do modelo open-source Qwen2.5-Omni-7B do Alibaba Group, criando um híbrido poderoso que oferece um desempenho sem precedentes no reconhecimento de voz e processamento de sons ambientais.
Ao contrário dos assistentes de voz tradicionais, que se concentram apenas no reconhecimento da fala, o MiDashengLM-7B utiliza uma abordagem inovadora de "legenda geral de áudio", permitindo-lhe compreender o contexto a partir de múltiplas fontes sonoras em simultâneo. Isto possibilita ao sistema interpretar não só comandos falados, mas também sons ambientais como vidro a partir, palmas ou música de fundo.
Os indicadores de desempenho são impressionantes, com a Xiaomi a afirmar resultados recorde em 22 conjuntos de dados públicos de avaliação. O modelo responde quatro vezes mais rápido do que os principais concorrentes e utiliza a memória GPU de forma 20 vezes mais eficiente. Esta eficiência computacional é crucial para os planos da Xiaomi de permitir uma implementação totalmente offline em dispositivos com capacidade de processamento limitada, reforçando tanto a privacidade como a fiabilidade.
Para aplicações automóveis, a tecnologia permitirá funcionalidades de segurança avançadas, como alertas baseados em som, sem necessidade de sensores adicionais. Em casas inteligentes, irá potenciar interações mais intuitivas com dispositivos como as colunas XiaoAI, permitindo-lhes realizar tarefas complexas, desde redigir guiões até encontrar informações sob pedido.
Num movimento relevante para o setor, a Xiaomi disponibilizou totalmente o MiDashengLM-7B como open-source sob a licença Apache 2.0, tornando-o acessível para aplicações comerciais e de investigação. Esta abordagem desafia os ecossistemas fechados de concorrentes como o Google Assistant e a Siri da Apple, podendo acelerar a inovação na tecnologia de IA de voz.
O lançamento insere-se na estratégia mais ampla da Xiaomi de diversificar para além dos smartphones, apostando em veículos elétricos e tecnologia doméstica inteligente, com a IA a servir de elo de ligação em todo o seu ecossistema de produtos em expansão.