Moonshot AI, китайски стартъп, подкрепен от Alibaba и основан от възпитаника на университета Цинхуа Ян Джилин през 2023 г., представи Kimi K2 – революционен отворен голям езиков модел, който директно оспорва лидерството на индустриални гиганти като OpenAI и Anthropic.
Kimi K2 използва усъвършенствана архитектура Mixture-of-Experts (MoE) с общо 1 трилион параметри, от които само 32 милиарда се активират при инференция. Този дизайн осигурява изключителна производителност при висока изчислителна ефективност. Моделът е предварително обучен върху 15,5 трилиона токена с иновативния оптимизатор MuonClip на Moonshot, за който компанията твърди, че е постигнал „нула нестабилност при обучението“ в голям мащаб – значителен инженерен пробив.
В бенчмарк тестове Kimi K2 демонстрира забележителни способности, особено в програмирането и математическото мислене. На LiveCodeBench постига 53,7% точност, изпреварвайки DeepSeek-V3 (46,9%) и GPT-4.1 (44,7%). Още по-впечатляващо, на MATH-500 достига 97,4% спрямо 92,4% за GPT-4.1. На SWE-bench Verified – предизвикателен бенчмарк за софтуерно инженерство – Kimi K2 достига 65,8% точност, надминавайки повечето отворени алтернативи.
За разлика от традиционните чатботове, Kimi K2 е специално проектиран за „агентски интелект“ – способността автономно да използва инструменти, да пише и изпълнява код и да изпълнява сложни многоетапни задачи с минимален човешки надзор. Този фокус върху изпълнението, а не само върху разсъжденията, го позиционира като практично решение за корпоративни работни процеси и автоматизация.
Moonshot AI предлага две версии: Kimi-K2-Base за изследователи и разработчици, които търсят пълен контрол за фина настройка, и Kimi-K2-Instruct за общи чат и агентски AI приложения. Моделът е достъпен чрез платформата на Moonshot на значително по-ниски цени от конкурентите – само $0,15 на милион входни токени и $2,50 на милион изходни токени, в сравнение с много по-високите тарифи на OpenAI и Anthropic.
Пускането на Kimi K2 е стратегически ход на Moonshot за възстановяване на пазарни позиции след засилената конкуренция от съперници като DeepSeek. Чрез отворения код на този мощен модел компанията цели да разшири общността си от разработчици и глобалното си влияние, като оспори бизнес моделите на утвърдените AI компании. Този подход съвпада с по-широка тенденция сред китайските AI компании да възприемат отвореното развитие, за разлика от много американски технологични гиганти, които запазват проприетарен контрол върху най-напредналите си модели.