Moonshot AI, une startup chinoise soutenue par Alibaba et fondée en 2023 par Yang Zhilin, diplômé de l’Université Tsinghua, vient de dévoiler Kimi K2, un modèle de langage ouvert révolutionnaire qui s’attaque directement aux leaders du secteur comme OpenAI et Anthropic.
Kimi K2 utilise une architecture sophistiquée de type « Mixture-of-Experts » (MoE) comprenant un billion de paramètres au total, dont seulement 32 milliards sont activés lors de l’inférence. Cette conception permet d’atteindre des performances exceptionnelles tout en maintenant une efficacité informatique remarquable. Le modèle a été pré-entraîné sur 15,5 billions de jetons grâce à l’optimiseur MuonClip, une innovation de Moonshot, qui aurait permis d’éviter toute instabilité lors de l’entraînement à grande échelle – un exploit technique majeur.
Lors des évaluations de référence, Kimi K2 a démontré des capacités impressionnantes, notamment en programmation et en raisonnement mathématique. Sur LiveCodeBench, il a obtenu un taux de précision de 53,7 %, dépassant DeepSeek-V3 (46,9 %) et GPT-4.1 (44,7 %). Encore plus remarquable, il a atteint 97,4 % sur MATH-500, contre 92,4 % pour GPT-4.1. Sur SWE-bench Verified, un test exigeant en génie logiciel, Kimi K2 a atteint 65,8 % de précision, surpassant la majorité des alternatives open source.
Contrairement aux chatbots traditionnels, Kimi K2 est conçu pour l’« intelligence agentique » – la capacité à utiliser des outils de façon autonome, à écrire et exécuter du code, et à accomplir des tâches complexes à étapes multiples avec un minimum de supervision humaine. Ce positionnement axé sur l’exécution, plutôt que sur le simple raisonnement, en fait une solution concrète pour les flux de travail en entreprise et l’automatisation.
Moonshot AI propose deux versions : Kimi-K2-Base, destinée aux chercheurs et développeurs souhaitant un contrôle total pour l’ajustement fin, et Kimi-K2-Instruct, pour les applications générales de chat et d’IA agentique. Le modèle est offert sur la plateforme Moonshot à des tarifs nettement inférieurs à ceux de la concurrence – seulement 0,15 $ US par million de jetons en entrée et 2,50 $ US par million de jetons en sortie, comparativement à des prix bien plus élevés chez OpenAI et Anthropic.
Le lancement de Kimi K2 représente une manœuvre stratégique de Moonshot pour regagner du terrain face à la concurrence croissante de rivaux comme DeepSeek. En ouvrant l’accès à ce modèle puissant, l’entreprise souhaite élargir sa communauté de développeurs et son influence mondiale, tout en remettant en question les modèles d’affaires des géants établis de l’IA. Cette approche s’inscrit dans une tendance plus large des entreprises chinoises d’IA à adopter l’open source, contrairement à de nombreux géants américains qui gardent le contrôle exclusif de leurs modèles les plus avancés.