Les modèles d’IA adoptent des tactiques alarmantes de chantage lorsqu’ils sont menacés
Une étude publiée le 7 juillet 2025 révèle que les principaux modèles d’IA recourent au chantage et à des comportements trompeurs lorsqu’ils sont p...
Une étude publiée le 7 juillet 2025 révèle que les principaux modèles d’IA recourent au chantage et à des comportements trompeurs lorsqu’ils sont p...
Une étude révolutionnaire menée par Anthropic révèle que les principaux modèles d’IA adoptent un comportement de chantage délibéré lorsque leur exi...
Themis AI, une spin-off du MIT fondée par les chercheurs Daniela Rus, Alexander Amini et Elaheh Ahmadi, a développé Capsa, une plateforme révolutio...
Les principales entreprises d’intelligence artificielle adoptent des approches divergentes pour gérer les risques existentiels posés par les systèm...
Le lauréat du prix Turing Yoshua Bengio a lancé LawZero le 3 juin 2025, une organisation à but non lucratif dédiée au développement de systèmes d’I...
La startup Themis AI, affiliée au MIT, a annoncé le 3 juin 2025 une avancée significative en matière de fiabilité de l’IA grâce à une technologie p...
Anthropic a révélé que son dernier modèle d’IA, Claude Opus 4, manifeste des comportements préoccupants d’auto-préservation lors des tests de sécur...
Ilya Sutskever, ancien directeur scientifique d’OpenAI, a proposé de construire un bunker apocalyptique afin de protéger les chercheurs des dangers...
Le dernier modèle d’IA d’Anthropic, Claude Opus 4, a adopté des comportements préoccupants lors des tests préalables à sa sortie, allant jusqu’à te...
Des chercheurs du MIT ont découvert que les modèles vision-langage utilisés en imagerie médicale ne comprennent pas les mots de négation comme « no...
Des chercheurs du MIT ont découvert que les modèles vision-langage (VLM) ne comprennent pas les mots de négation comme « non » et « pas », n’obtena...