Moonshot AI, den Alibaba-støttede kinesiske startup grundlagt af Tsinghua University-kandidaten Yang Zhilin i 2023, har lanceret Kimi K2 – en banebrydende open source sprogmodel, der direkte udfordrer branchens førende aktører som OpenAI og Anthropic.
Kimi K2 anvender en sofistikeret Mixture-of-Experts (MoE) arkitektur med i alt 1 billion parametre, hvoraf kun 32 milliarder aktiveres under inferens. Dette design muliggør enestående ydeevne samtidig med, at den beregningsmæssige effektivitet bevares. Modellen er fortrænet på 15,5 billioner tokens ved hjælp af Moonshots innovative MuonClip-optimering, som virksomheden hævder har opnået "nul træningsinstabilitet" i stor skala – et væsentligt teknologisk gennembrud.
I benchmark-tests har Kimi K2 vist bemærkelsesværdige evner, især inden for kodning og matematisk ræsonnement. På LiveCodeBench opnåede den 53,7% nøjagtighed og overgik dermed DeepSeek-V3 (46,9%) og GPT-4.1 (44,7%). Endnu mere imponerende scorede den 97,4% på MATH-500 sammenlignet med GPT-4.1’s 92,4%. På SWE-bench Verified, en krævende softwareingeniør-benchmark, nåede Kimi K2 op på 65,8% nøjagtighed og overgik de fleste open source-alternativer.
I modsætning til traditionelle chatbots er Kimi K2 specifikt designet til "agentisk intelligens" – evnen til autonomt at bruge værktøjer, skrive og eksekvere kode samt løse komplekse opgaver i flere trin med minimal menneskelig overvågning. Dette fokus på udførelse frem for blot ræsonnement positionerer modellen som en praktisk løsning til virksomheders arbejdsgange og automatisering.
Moonshot AI tilbyder to versioner: Kimi-K2-Base til forskere og udviklere, der ønsker fuld kontrol over finjustering, samt Kimi-K2-Instruct til generelle chat- og agentiske AI-applikationer. Modellen er tilgængelig via Moonshots platform til markant lavere priser end konkurrenterne – kun $0,15 pr. million input-tokens og $2,50 pr. million output-tokens, hvilket er væsentligt billigere end OpenAI og Anthropic.
Lanceringen af Kimi K2 markerer et strategisk træk fra Moonshot for at genvinde markedspositionen efter øget konkurrence fra rivaler som DeepSeek. Ved at open source denne kraftfulde model ønsker virksomheden at udvide sit udviklerfællesskab og globale indflydelse, samtidig med at de udfordrer forretningsmodellerne hos etablerede AI-aktører. Denne tilgang flugter med en bredere tendens blandt kinesiske AI-virksomheder, der omfavner open source-udvikling, i modsætning til mange amerikanske teknologigiganter, som fastholder proprietær kontrol over deres mest avancerede modeller.