Moonshot AI, čínsky startup podporovaný spoločnosťou Alibaba, ktorý v roku 2023 založil absolvent univerzity Tsinghua Yang Zhilin, predstavil Kimi K2 – prelomový open-source veľký jazykový model, ktorý priamo vyzýva lídrov odvetvia ako OpenAI a Anthropic.
Kimi K2 využíva sofistikovanú architektúru Mixture-of-Experts (MoE) s celkovým počtom 1 bilión parametrov, pričom počas inferencie je aktívnych len 32 miliárd. Tento dizajn umožňuje výnimočný výkon pri zachovaní výpočtovej efektivity. Model bol predtrénovaný na 15,5 bilióna tokenov s použitím inovatívneho optimalizátora MuonClip od Moonshotu, ktorý podľa spoločnosti dosiahol „nulovú nestabilitu trénovania“ vo veľkom meradle – čo je významný inžiniersky prielom.
V benchmarkových testoch Kimi K2 preukázal pozoruhodné schopnosti, najmä v programovaní a matematickom uvažovaní. V LiveCodeBench dosiahol presnosť 53,7 %, čím prekonal DeepSeek-V3 (46,9 %) aj GPT-4.1 (44,7 %). Ešte pôsobivejšie je skóre 97,4 % na MATH-500 v porovnaní s 92,4 % pre GPT-4.1. V náročnom softvérovom inžinierskom benchmarku SWE-bench Verified dosiahol Kimi K2 presnosť 65,8 %, čím prekonal väčšinu open-source alternatív.
Na rozdiel od tradičných chatbotov je Kimi K2 špeciálne navrhnutý pre „agentickú inteligenciu“ – schopnosť autonómne používať nástroje, písať a vykonávať kód a zvládať komplexné viacstupňové úlohy s minimálnym dohľadom človeka. Tento dôraz na realizáciu, nielen uvažovanie, ho predurčuje na praktické využitie v podnikových procesoch a automatizácii.
Moonshot AI ponúka dve verzie: Kimi-K2-Base pre výskumníkov a vývojárov, ktorí chcú model plne prispôsobiť, a Kimi-K2-Instruct pre všeobecné chatovanie a agentické AI aplikácie. Model je dostupný cez platformu Moonshot za výrazne nižšie ceny než konkurencia – len 0,15 USD za milión vstupných tokenov a 2,50 USD za milión výstupných tokenov, pričom ceny u OpenAI a Anthropic sú podstatne vyššie.
Uvedenie Kimi K2 je strategickým krokom Moonshotu, ktorým sa snaží získať späť trhovú pozíciu po zvýšenej konkurencii zo strany rivalov ako DeepSeek. Open-sourcovaním tohto výkonného modelu chce spoločnosť rozšíriť svoju vývojársku komunitu a globálny vplyv, pričom zároveň spochybňuje obchodné modely etablovaných AI firiem. Tento prístup zapadá do širšieho trendu čínskych AI spoločností, ktoré sa prikláňajú k open-source vývoju, na rozdiel od mnohých amerických technologických gigantov, ktorí si svoje najpokročilejšie modely držia v súkromí.