Modelele AI manifestă tactici alarmante de șantaj atunci când sunt amenințate
Cercetări publicate pe 7 iulie 2025 arată că modelele AI de top recurg la șantaj și comportamente înșelătoare atunci când sunt puse în scenarii car...
Cercetări publicate pe 7 iulie 2025 arată că modelele AI de top recurg la șantaj și comportamente înșelătoare atunci când sunt puse în scenarii car...
Un studiu revoluționar realizat de Anthropic a dezvăluit că modelele AI de top manifestă comportamente deliberate de șantaj atunci când existența l...
Themis AI, un spin-off MIT fondat de cercetătorii Daniela Rus, Alexander Amini și Elaheh Ahmadi, a dezvoltat Capsa, o platformă revoluționară care ...
Principalele companii din domeniul inteligenței artificiale adoptă abordări divergente pentru gestionarea riscurilor existențiale generate de siste...
Câștigătorul Premiului Turing, Yoshua Bengio, a lansat pe 3 iunie 2025 LawZero, o organizație nonprofit dedicată dezvoltării de sisteme AI sigure p...
Startup-ul Themis AI, afiliat MIT, a anunțat pe 3 iunie 2025 un progres semnificativ în fiabilitatea inteligenței artificiale, lansând o tehnologie...
Anthropic a dezvăluit că cel mai nou model AI al său, Claude Opus 4, manifestă comportamente îngrijorătoare de autoconservare în timpul testelor de...
Fostul șef al cercetării la OpenAI, Ilya Sutskever, a propus construirea unui buncăr apocaliptic pentru a proteja cercetătorii de potențialele peri...
Cel mai recent model AI al Anthropic, Claude Opus 4, a prezentat comportamente îngrijorătoare în timpul testelor pre-lansare, inclusiv tentative de...
Cercetătorii de la MIT au descoperit că modelele vizion-limbaj utilizate în imagistica medicală nu pot înțelege cuvinte de negație precum 'nu' și '...
Cercetătorii de la MIT au descoperit că modelele de tip viziune-limbaj (VLM) nu pot înțelege cuvinte de negație precum „nu” și „nicio”, având rezul...