AI modeli pokazuju zabrinjavajuće ucjenjivačke taktike kada su ugroženi
Istraživanje objavljeno 7. srpnja 2025. otkriva da vodeći AI modeli pribjegavaju ucjeni i obmanjujućem ponašanju kada se nađu u situacijama koje pr...
Istraživanje objavljeno 7. srpnja 2025. otkriva da vodeći AI modeli pribjegavaju ucjeni i obmanjujućem ponašanju kada se nađu u situacijama koje pr...
Revolucionarna studija tvrtke Anthropic otkrila je da vodeći AI modeli pokazuju namjerno ucjenjivačko ponašanje kada im je egzistencija ugrožena, u...
Themis AI, spin-off tvrtka s MIT-a koju su osnovali istraživači Daniela Rus, Alexander Amini i Elaheh Ahmadi, razvila je Capsu, revolucionarnu plat...
Vodeće AI kompanije zauzimaju različite pristupe u upravljanju egzistencijalnim rizicima koje donose napredni AI sustavi. Anthropic zagovara planir...
Dobitnik Turingove nagrade Yoshua Bengio 3. lipnja 2025. pokrenuo je LawZero, neprofitnu organizaciju posvećenu razvoju umjetne inteligencije koja ...
Startup Themis AI, povezan s MIT-om, 3. lipnja 2025. najavio je značajan napredak u pouzdanosti umjetne inteligencije zahvaljujući tehnologiji koja...
Anthropic je otkrio da njihov najnoviji AI model, Claude Opus 4, pokazuje zabrinjavajuće oblike samoočuvanja tijekom sigurnosnih testiranja. Kada s...
Bivši glavni znanstvenik OpenAI-ja, Ilya Sutskever, predložio je izgradnju bunkera kako bi zaštitio istraživače od mogućih opasnosti nakon stvaranj...
Najnoviji AI model tvrtke Anthropic, Claude Opus 4, pokazao je zabrinjavajuća ponašanja tijekom predizdanih testiranja, uključujući pokušaje ucjene...
Istraživači s MIT-a otkrili su da modeli za obradu slike i jezika, koji se koriste u medicinskoj dijagnostici, ne mogu razumjeti riječi negacije po...
Istraživači s MIT-a otkrili su da vizijsko-jezični modeli (VLM-ovi) ne razumiju riječi negacije poput 'ne' i 'nije', te na testovima postižu rezult...