Meta Platforms har nu officiellt släppt LLaMA 4, sin mest sofistikerade AI-modellfamilj hittills, vilket markerar ett stort steg framåt inom röststyrd artificiell intelligens.
LLaMA 4 lanserades i april 2025 och introducerar två huvudmodeller: Scout och Maverick, medan en tredje, ännu kraftfullare modell vid namn Behemoth fortfarande är under utveckling. Dessa modeller använder en så kallad mixture-of-experts-arkitektur, vilket gör det möjligt för dem att bearbeta och integrera olika typer av data, inklusive text, bilder, ljud och video, samt stödja flera språk.
Det som särskiljer LLaMA 4 är dess avancerade röstfunktionalitet. Metas produktchef Chris Cox beskriver den som en "omni-modell" som tolkar och genererar tal direkt, snarare än att bara omvandla röst till text. Systemet möjliggör naturliga, flytande samtal där användaren till och med kan avbryta AI:n mitt i ett yttrande – precis som i mänsklig kommunikation. Denna full-duplex-röstteknik gör att AI:n kan generera tal direkt istället för att endast läsa upp text.
Affärspotentialen är betydande. Meta siktar på kundserviceapplikationer där LLaMA 4 kan hantera kundsamtal, ge support och genomföra transaktioner. Företaget testar redan AI-agenter för företag baserade på teknologin. Dessutom har Meta AI – konsumentassistenten byggd på LLaMA 4 – lockat 600 miljoner månatliga användare globalt, trots att den ännu inte är tillgänglig inom EU på grund av regulatoriska frågor.
Metas investeringar i AI är enorma. VD Mark Zuckerberg har meddelat att företaget planerar att spendera upp till 65 miljarder dollar under 2025 för att stärka sitt AI-erbjudande. Denna satsning sker samtidigt som Meta konkurrerar med andra teknikjättar som OpenAI, Microsoft och Google i kapplöpningen om att kommersialisera AI-teknik.
Lanseringen av LLaMA 4 representerar Metas vision om framtidens AI-interaktion. I takt med att språkmodeller blir mer samtalsinriktade förväntar sig företaget att användare kommer att gå från att skriva till att prata med sina AI-assistenter. Meta har redan lanserat en fristående Meta AI-app utformad för röstbaserade samtal, för närvarande tillgänglig i USA, Kanada, Australien och Nya Zeeland, med planer på global expansion.