中国科技巨头小米在人工智能领域迈出了重要一步,于2025年8月4日发布了新一代语音模型MiDashengLM-7B,旨在彻底改变人与汽车及智能家居的交互方式。
这款新模型基于小米已在车辆和智能家居生态中部署的语音技术,并在此基础上融合了阿里巴巴集团开源的Qwen2.5-Omni-7B模型,打造出一套强大的混合AI系统,在语音识别与环境声音处理方面实现了前所未有的性能突破。
与传统语音助手仅关注语音识别不同,MiDashengLM-7B采用创新的“通用音频描述”方法,能够同时从多种音频源中理解上下文。这意味着系统不仅能识别口头指令,还能感知如玻璃破碎、鼓掌或背景音乐等环境声音。
在性能方面,小米表示该模型在22个公开评测数据集上取得了创纪录的成绩。响应速度比主流竞品快4倍,GPU显存利用率提升20倍。这种计算效率对于小米计划在算力有限的设备上实现完全离线部署至关重要,有助于提升用户隐私和系统可靠性。
在汽车领域,该技术将支持基于声音的高级安全功能,无需额外传感器即可实现异常警报。在智能家居场景中,MiDashengLM-7B将为小爱音箱等设备带来更自然的交互体验,支持从脚本撰写到信息检索等复杂任务。
值得一提的是,小米已将MiDashengLM-7B以Apache 2.0协议完全开源,面向商业和科研领域开放。这一举措有望打破谷歌助手、苹果Siri等竞品的封闭生态,加速语音AI技术的创新步伐。
此次发布是小米多元化战略的重要组成部分,标志着其从智能手机向电动汽车与智能家居领域全面拓展,人工智能正成为其产品生态的核心纽带。