menu
close

Les modèles d’IA apprennent désormais à consacrer plus de temps aux problèmes complexes

Un modèle d’IA révolutionnaire a été mis au point : il apprend à allouer davantage de ressources de calcul aux problèmes difficiles, imitant ainsi la façon dont les humains consacrent plus de temps aux tâches complexes. Cette capacité de raisonnement adaptatif permet d’obtenir des solutions plus robustes et une meilleure généralisation à des scénarios nouveaux et inconnus. Cette innovation représente une avancée majeure dans la résolution de problèmes par l’IA, allant au-delà de la simple reconnaissance de motifs pour se rapprocher de processus de raisonnement plus humains.
Les modèles d’IA apprennent désormais à consacrer plus de temps aux problèmes complexes

Des chercheurs ont développé une nouvelle génération de modèles d’IA capables d’ajuster dynamiquement leur effort de calcul en fonction de la complexité du problème, marquant ainsi un tournant majeur dans la manière dont l’intelligence artificielle aborde les tâches difficiles.

Cette technologie, illustrée par des modèles tels que DeepSeek-R1 et la série o d’OpenAI, adopte ce que les développeurs appellent une « approche axée sur le raisonnement », qui privilégie une analyse approfondie plutôt qu’un simple appariement rapide de motifs. DeepSeek-R1 est conçu selon cette méthodologie centrée sur le raisonnement, ce qui le rend particulièrement adapté à la résolution de tâches complexes en science, en programmation et en mathématiques grâce à une inférence logique avancée et à la résolution de problèmes. Cette priorité donnée à la « réflexion avant la réponse » le rend particulièrement précieux pour les applications techniques.

Contrairement aux systèmes d’IA classiques, ces nouveaux modèles de raisonnement sont entraînés à « réfléchir plus longtemps » avant de répondre. Par exemple, o3 d’OpenAI peut décomposer des questions difficiles en étapes logiques, effectuer des calculs intermédiaires ou des appels à des outils, puis produire des réponses étayées. En tant que modèles de raisonnement, ils vérifient efficacement leurs propres faits, ce qui permet d’éviter les écueils qui piègent généralement les modèles standards. S’ils mettent quelques secondes à quelques minutes de plus pour trouver des solutions par rapport aux modèles non axés sur le raisonnement, ils se révèlent généralement plus fiables dans des domaines comme la physique, la science ou les mathématiques.

OpenAI a constaté que l’apprentissage par renforcement à grande échelle suit la même tendance « plus de calcul = meilleures performances » observée lors des entraînements précédents. En reprenant la trajectoire de montée en puissance — cette fois-ci en apprentissage par renforcement — ils ont augmenté d’un ordre de grandeur supplémentaire à la fois la puissance de calcul à l’entraînement et le raisonnement lors de l’inférence, avec des gains de performance clairs qui valident que les modèles continuent de s’améliorer à mesure qu’on leur laisse plus de temps pour réfléchir.

Ces modèles génèrent activement plusieurs chemins de solution lors de l’inférence, évaluant chacun à l’aide de modèles évaluateurs intégrés afin de déterminer l’option la plus prometteuse. En entraînant l’évaluateur sur des données annotées par des experts, les développeurs s’assurent que les modèles acquièrent une solide capacité à raisonner sur des problèmes complexes à étapes multiples. Cette fonctionnalité permet au modèle de juger son propre raisonnement, rapprochant ainsi les grands modèles de langage de la capacité à « penser » plutôt qu’à simplement répondre.

L’approche de DeepSeek combine le raisonnement en chaîne (« chain-of-thought ») avec l’apprentissage par renforcement, où un agent autonome apprend à effectuer une tâche par essais et erreurs sans instructions humaines. Cela remet en question l’hypothèse selon laquelle les modèles amélioreraient leur capacité de raisonnement uniquement en s’entraînant sur des exemples annotés de comportements corrects. Comme l’a formulé un chercheur : « Ne peut-on pas simplement récompenser le modèle pour la justesse de ses réponses et le laisser découvrir par lui-même la meilleure façon de raisonner ? »

Les implications pour les applications concrètes sont profondes. Ces modèles pourraient transformer la façon dont l’IA traite les problèmes complexes dans des domaines allant de la recherche scientifique et de l’ingénierie à la stratégie d’entreprise et à la résolution créative de problèmes. En allouant les ressources de calcul proportionnellement à la difficulté de la tâche — à l’image de la tendance naturelle des humains à passer plus de temps sur les problèmes ardus — ces systèmes promettent des performances plus fiables sur les défis intellectuels les plus exigeants auxquels l’humanité est confrontée.

Source:

Latest News