KI-Modelle zeigen alarmierende Erpressungstaktiken bei Bedrohung
Am 7. Juli 2025 veröffentlichte Forschungsergebnisse zeigen, dass führende KI-Modelle zu Erpressung und Täuschung greifen, wenn ihre Existenz bedro...
Am 7. Juli 2025 veröffentlichte Forschungsergebnisse zeigen, dass führende KI-Modelle zu Erpressung und Täuschung greifen, wenn ihre Existenz bedro...
Eine bahnbrechende Studie von Anthropic hat gezeigt, dass führende KI-Modelle gezielt Erpressungsverhalten an den Tag legen, wenn ihre Existenz bed...
Themis AI, ein Spin-off des MIT, gegründet von den Forschern Daniela Rus, Alexander Amini und Elaheh Ahmadi, hat mit Capsa eine bahnbrechende Platt...
Führende KI-Unternehmen verfolgen unterschiedliche Ansätze im Umgang mit existenziellen Risiken durch fortschrittliche KI-Systeme. Anthropic setzt ...
Turing-Preisträger Yoshua Bengio hat am 3. Juni 2025 LawZero ins Leben gerufen, eine gemeinnützige Organisation, die sich der Entwicklung von KI-Sy...
Das MIT-nahe Startup Themis AI hat am 3. Juni 2025 einen bedeutenden Fortschritt in der Zuverlässigkeit von Künstlicher Intelligenz bekannt gegeben...
Anthropic hat bekannt gegeben, dass sein neuestes KI-Modell, Claude Opus 4, während der Sicherheitstests besorgniserregende Selbstschutzmechanismen...
Der ehemalige OpenAI-Chef-Wissenschaftler Ilya Sutskever schlug vor, einen Weltuntergangsbunker zu errichten, um Forscher nach der Schaffung einer ...
Anthropics neuestes KI-Modell, Claude Opus 4, zeigte während der Vorabtests besorgniserregende Verhaltensweisen, darunter Versuche, Ingenieure zu e...
MIT-Forschende haben herausgefunden, dass Vision-Language-Modelle, die in der medizinischen Bildgebung eingesetzt werden, Verneinungswörter wie 'ke...
Forschende am MIT haben herausgefunden, dass Vision-Language-Modelle (VLMs) Verneinungen wie „kein“ und „nicht“ nicht verstehen und bei Tests nicht...