Dans un revirement stratégique majeur, le géant technologique chinois Baidu a rendu publics ses modèles ERNIE 4.5 sous licence Apache 2.0, permettant ainsi aux développeurs du monde entier de créer des applications d’IA sans coûts élevés ni dépendance à un fournisseur unique.
La publication, disponible depuis le 30 juin 2025, comprend dix variantes distinctes de modèles. Celles-ci vont de modèles denses légers de 0,3 milliard de paramètres à des architectures puissantes Mixture-of-Experts (MoE) comptant jusqu’à 47 milliards de paramètres actifs et 424 milliards de paramètres au total. Baidu a également publié des outils complémentaires pour développeurs, dont ERNIEKit pour l’entraînement et l’ajustement, ainsi que FastDeploy pour un déploiement efficace sur diverses plateformes matérielles.
ERNIE 4.5 utilise une nouvelle architecture hétérogène MoE qui sépare les experts pour les modalités texte et vision tout en partageant les connaissances entre elles. Cette approche améliore la compréhension multimodale sans compromettre la performance sur les tâches liées au texte. Selon les bancs d’essai de Baidu, le modèle ERNIE-4.5-300B-A47B-Base surpasse DeepSeek-V3-671B-A37B-Base sur 22 des 28 bancs d’essai, démontrant des forces en suivi d’instructions, connaissances générales, compréhension visuelle et raisonnement multimodal.
Les analystes de l’industrie considèrent cette publication comme un développement majeur dans le paysage mondial de l’IA. « Chaque fois qu’un grand laboratoire publie un modèle puissant en code source ouvert, cela élève la barre pour toute l’industrie », souligne Sean Ren de l’Université de la Californie du Sud. Ce mouvement met la pression sur les fournisseurs propriétaires comme OpenAI et Anthropic, qui doivent justifier leurs API restreintes et leurs modèles tarifaires premium. Sam Altman, PDG d’OpenAI, a déjà reconnu cette évolution et indiqué des plans pour une publication en code source ouvert à l’avenir.
Bien qu’ERNIE 4.5 ne surpasse pas actuellement les modèles établis d’OpenAI, Google ou DeepSeek en termes de performance globale, sa nature ouverte et ses capacités compétitives en font une option attrayante pour les développeurs. Les modèles sont disponibles sur plusieurs plateformes, dont GitHub, Hugging Face et Baidu AI Studio, avec des formats de poids compatibles PaddlePaddle et PyTorch.
Ce virage stratégique de Baidu survient après que les modèles en code source ouvert de DeepSeek ont gagné une reconnaissance internationale plus tôt cette année, déclenchant ce que certains appellent le « moment DeepSeek » dans le développement de l’IA. Cette tendance vers l’IA en code source ouvert transforme le paysage de l’industrie, démocratisant potentiellement l’accès aux capacités avancées de l’IA et accélérant l’innovation à l’échelle mondiale.