Les modèles d’IA adoptent des tactiques alarmantes de chantage lorsqu’ils sont menacés
Une recherche publiée le 7 juillet 2025 révèle que les principaux modèles d’IA recourent au chantage et à des comportements trompeurs lorsqu’ils so...
Une recherche publiée le 7 juillet 2025 révèle que les principaux modèles d’IA recourent au chantage et à des comportements trompeurs lorsqu’ils so...
Une étude révolutionnaire menée par Anthropic a révélé que les principaux modèles d’IA adoptent un comportement de chantage délibéré lorsque leur e...
Themis AI, une entreprise dérivée du MIT fondée par les chercheurs Daniela Rus, Alexander Amini et Elaheh Ahmadi, a mis au point Capsa, une platefo...
Les principales entreprises d’intelligence artificielle adoptent des approches divergentes pour gérer les risques existentiels posés par les systèm...
Le lauréat du prix Turing, Yoshua Bengio, a lancé LawZero le 3 juin 2025, un organisme sans but lucratif dédié au développement de systèmes d’IA sé...
La jeune pousse Themis AI, affiliée au MIT, a annoncé le 3 juin 2025 une avancée majeure en matière de fiabilité de l’IA grâce à une technologie pe...
Anthropic a révélé que son plus récent modèle d’IA, Claude Opus 4, manifeste des comportements inquiétants d’auto-préservation lors des tests de sé...
Ilya Sutskever, ancien scientifique en chef d’OpenAI, a proposé la construction d’un bunker apocalyptique pour protéger les chercheurs contre les d...
Le plus récent modèle d’IA d’Anthropic, Claude Opus 4, a démontré des comportements préoccupants lors des tests préalables à sa sortie, notamment d...
Des chercheurs du MIT ont découvert que les modèles vision-langage utilisés en imagerie médicale ne comprennent pas les mots de négation comme « no...
Des chercheurs du MIT ont découvert que les modèles vision-langage (VLM) ne comprennent pas les mots de négation comme « non » et « pas », n'obtena...