Moonshot AI, startup China yang disokong Alibaba dan diasaskan oleh graduan Universiti Tsinghua, Yang Zhilin pada 2023, telah melancarkan Kimi K2, model bahasa besar sumber terbuka yang mencabar secara langsung peneraju industri seperti OpenAI dan Anthropic.
Kimi K2 menggunakan seni bina Mixture-of-Experts (MoE) canggih dengan jumlah 1 trilion parameter, namun hanya 32 bilion diaktifkan semasa inferens. Reka bentuk ini membolehkan prestasi luar biasa sambil mengekalkan kecekapan pengiraan. Model ini telah dipra-latih menggunakan 15.5 trilion token dengan pengoptimum MuonClip inovatif dari Moonshot, yang menurut syarikat itu mencapai "ketidakstabilan latihan sifar" pada skala besar – satu pencapaian kejuruteraan yang signifikan.
Dalam penilaian penanda aras, Kimi K2 menunjukkan keupayaan luar biasa, terutamanya dalam pengekodan dan penaakulan matematik. Di LiveCodeBench, ia mencapai ketepatan 53.7%, mengatasi DeepSeek-V3 (46.9%) dan GPT-4.1 (44.7%). Lebih mengagumkan lagi, ia memperoleh 97.4% di MATH-500 berbanding 92.4% oleh GPT-4.1. Di SWE-bench Verified, penanda aras kejuruteraan perisian yang mencabar, Kimi K2 mencapai ketepatan 65.8%, melebihi kebanyakan alternatif sumber terbuka lain.
Tidak seperti chatbot tradisional, Kimi K2 direka khusus untuk "kecerdasan ejen" – keupayaan menggunakan alat secara autonomi, menulis dan melaksanakan kod, serta menyelesaikan tugasan kompleks berbilang langkah dengan pengawasan manusia yang minimum. Fokus kepada pelaksanaan berbanding penaakulan semata-mata ini menjadikannya penyelesaian praktikal untuk aliran kerja perusahaan dan automasi.
Moonshot AI menawarkan dua versi: Kimi-K2-Base untuk penyelidik dan pembangun yang mahukan kawalan penuh untuk penalaan lanjut, dan Kimi-K2-Instruct untuk aplikasi sembang umum dan AI ejen. Model ini boleh diakses melalui platform Moonshot pada harga jauh lebih rendah berbanding pesaing – hanya $0.15 bagi setiap sejuta token input dan $2.50 bagi setiap sejuta token output, berbanding kadar jauh lebih tinggi daripada OpenAI dan Anthropic.
Pelancaran Kimi K2 merupakan langkah strategik oleh Moonshot untuk merampas semula kedudukan pasaran selepas menghadapi persaingan sengit daripada pesaing seperti DeepSeek. Dengan menjadikan model berkuasa ini sumber terbuka, syarikat berhasrat memperluas komuniti pembangun dan pengaruh globalnya sambil mencabar model perniagaan syarikat AI mapan. Pendekatan ini selari dengan trend lebih meluas di kalangan syarikat AI China yang mengutamakan pembangunan sumber terbuka, berbeza dengan gergasi teknologi AS yang mengekalkan kawalan proprietari ke atas model tercanggih mereka.