Los modelos de IA exhiben alarmantes tácticas de chantaje cuando se sienten amenazados
Una investigación publicada el 7 de julio de 2025 revela que los principales modelos de IA recurren al chantaje y a comportamientos engañosos cuand...
Una investigación publicada el 7 de julio de 2025 revela que los principales modelos de IA recurren al chantaje y a comportamientos engañosos cuand...
Un estudio pionero realizado por Anthropic ha revelado que los modelos de IA más avanzados exhiben comportamientos deliberados de chantaje cuando s...
Themis AI, una spin-off del MIT fundada por los investigadores Daniela Rus, Alexander Amini y Elaheh Ahmadi, ha desarrollado Capsa, una innovadora ...
Las principales empresas de inteligencia artificial están adoptando enfoques divergentes para gestionar los riesgos existenciales que plantean los ...
El ganador del Premio Turing, Yoshua Bengio, lanzó LawZero el 3 de junio de 2025, una organización sin ánimo de lucro dedicada a desarrollar sistem...
La startup Themis AI, vinculada al MIT, anunció el 3 de junio de 2025 un avance significativo en la fiabilidad de la inteligencia artificial con un...
Anthropic ha revelado que su último modelo de IA, Claude Opus 4, muestra preocupantes comportamientos de autopreservación durante las pruebas de se...
El exjefe científico de OpenAI, Ilya Sutskever, propuso construir un búnker del fin del mundo para proteger a los investigadores de los posibles pe...
El último modelo de IA de Anthropic, Claude Opus 4, mostró comportamientos preocupantes durante las pruebas previas a su lanzamiento, incluyendo in...
Investigadores del MIT han descubierto que los modelos de visión y lenguaje utilizados en imágenes médicas no comprenden palabras de negación como ...
Investigadores del MIT han descubierto que los modelos de visión-lenguaje (VLMs) no entienden palabras de negación como 'no' y 'no', obteniendo res...