Moonshot AI, kineski startup koji podržava Alibaba, a osnovao ga je diplomant Sveučilišta Tsinghua Yang Zhilin 2023. godine, predstavio je Kimi K2 – revolucionarni open-source veliki jezični model koji izravno izaziva industrijske lidere poput OpenAI-a i Anthropica.
Kimi K2 koristi sofisticiranu Mixture-of-Experts (MoE) arhitekturu s ukupno bilijunom parametara, od kojih se tijekom izvođenja aktivira samo 32 milijarde. Ovakav dizajn omogućuje iznimne performanse uz visoku računalnu učinkovitost. Model je prethodno treniran na 15,5 bilijuna tokena koristeći inovativni MuonClip optimizator tvrtke Moonshot, za koji tvrde da je postigao "nultu nestabilnost treniranja" na velikoj skali – što predstavlja značajan inženjerski iskorak.
Na referentnim testiranjima, Kimi K2 pokazao je izvanredne mogućnosti, posebno u programiranju i matematičkom zaključivanju. Na LiveCodeBench testu postigao je točnost od 53,7%, nadmašivši DeepSeek-V3 (46,9%) i GPT-4.1 (44,7%). Još impresivnije, na MATH-500 ostvario je rezultat od 97,4% u odnosu na GPT-4.1 koji je postigao 92,4%. Na SWE-bench Verified, zahtjevnom testu softverskog inženjeringa, Kimi K2 dosegao je 65,8% točnosti, nadmašivši većinu open-source alternativa.
Za razliku od tradicionalnih chatbotova, Kimi K2 je posebno dizajniran za "agentičku inteligenciju" – sposobnost autonomnog korištenja alata, pisanja i izvršavanja koda te rješavanja složenih višekoraknih zadataka uz minimalan ljudski nadzor. Ovakav fokus na izvršavanje, a ne samo na zaključivanje, čini ga praktičnim rješenjem za poslovne procese i automatizaciju.
Moonshot AI nudi dvije verzije: Kimi-K2-Base za istraživače i developere koji žele potpunu kontrolu nad finim podešavanjem, te Kimi-K2-Instruct za opće chat i agentičke AI primjene. Model je dostupan putem Moonshotove platforme po znatno nižim cijenama od konkurencije – samo 0,15 USD po milijunu ulaznih tokena i 2,50 USD po milijunu izlaznih tokena, u usporedbi s mnogo višim cijenama OpenAI-a i Anthropica.
Objava Kimi K2 predstavlja strateški potez Moonshota za povrat tržišne pozicije nakon što se suočio s pojačanom konkurencijom rivala poput DeepSeeka. Otvaranjem ovog moćnog modela, tvrtka želi proširiti svoju zajednicu developera i globalni utjecaj, istovremeno izazivajući poslovne modele etabliranih AI kompanija. Ovakav pristup uklapa se u širi trend među kineskim AI tvrtkama koje prihvaćaju open-source razvoj, za razliku od mnogih američkih tehnoloških divova koji zadržavaju vlasničku kontrolu nad svojim najnaprednijim modelima.