Meta Platforms正式发布了LLaMA 4,这是迄今为止其最为先进的AI模型家族,标志着语音驱动人工智能技术迈出了重要一步。
LLaMA 4于2025年4月推出,包含两大主力模型:Scout和Maverick,第三款更强大的模型Behemoth仍在开发中。这些模型采用混合专家架构,能够处理并融合文本、图像、音频和视频等多种数据类型,同时支持多语言。
LLaMA 4的最大亮点在于其先进的语音能力。Meta首席产品官Chris Cox将其称为“全能模型”,能够原生理解和生成语音,而不仅仅是将语音转为文本。该系统支持自然流畅的对话,用户甚至可以在AI说话过程中打断它,实现类似人与人之间的互动。这项全双工语音技术让AI能够直接生成语音,而不仅仅是朗读文本。
LLaMA 4在商业领域的应用前景广阔。Meta将其瞄准于客户服务场景,LLaMA 4可用于处理客户对话、提供支持并完成交易。公司已在测试基于该技术的企业级AI代理。此外,基于LLaMA 4构建的面向消费者的Meta AI助手,全球月活跃用户已达6亿,尽管由于监管原因尚未在欧盟上线。
Meta在AI领域的投入巨大,CEO马克·扎克伯格宣布2025年将投入高达650亿美元以增强AI产品。这一举措正值Meta与OpenAI、微软、谷歌等科技巨头在AI商业化竞赛中激烈角逐。
LLaMA 4的发布展现了Meta对AI交互未来的愿景。随着语言模型变得更加对话化,公司预计用户将从打字转向与AI助手语音交流。Meta已在美国、加拿大、澳大利亚和新西兰推出专为语音对话设计的独立Meta AI应用,并计划在全球范围内推广。