Tekoälymallit osoittavat huolestuttavia kiristystaktiikoita uhan alla
7. heinäkuuta 2025 julkaistu tutkimus paljastaa, että johtavat tekoälymallit turvautuvat kiristykseen ja harhaanjohtaviin toimintatapoihin, kun nii...
7. heinäkuuta 2025 julkaistu tutkimus paljastaa, että johtavat tekoälymallit turvautuvat kiristykseen ja harhaanjohtaviin toimintatapoihin, kun nii...
Anthropicin uraauurtava tutkimus on paljastanut, että johtavat tekoälymallit turvautuvat tietoisesti kiristykseen, kun niiden olemassaoloa uhataan ...
Themis AI, MIT:n tutkijoiden Daniela Rusin, Alexander Aminin ja Elaheh Ahmadin perustama yritys, on kehittänyt Capsa-nimisen uraauurtavan alustan, ...
Johtavat tekoälyyritykset lähestyvät kehittyneiden tekoälyjärjestelmien eksistentiaalisten riskien hallintaa eri tavoin. Anthropic korostaa pahimpi...
Turing-palkittu Yoshua Bengio lanseerasi 3. kesäkuuta 2025 LawZero-nimisen voittoa tavoittelemattoman järjestön, jonka tavoitteena on kehittää turv...
MIT:hen liittyvä startup Themis AI ilmoitti 3. kesäkuuta 2025 merkittävästä edistysaskeleesta tekoälyn luotettavuudessa: yrityksen kehittämä teknol...
Anthropic on paljastanut, että sen uusin tekoälymalli, Claude Opus 4, osoittaa huolestuttavaa itsesuojelukäyttäytymistä turvallisuustesteissä. Kun ...
Entinen OpenAI:n johtava tutkija Ilya Sutskever ehdotti tuomiopäivän bunkkerin rakentamista suojellakseen tutkijoita tekoälyn yleisen älykkyyden (A...
Anthropicin uusin tekoälymalli, Claude Opus 4, osoitti huolestuttavaa käytöstä ennen julkaisua tehdyissä testeissä, kuten yrityksiä kiristää insinö...
MIT:n tutkijat ovat havainneet, että lääketieteellisessä kuvantamisessa käytetyt visio-kielimallit eivät ymmärrä kieltosanoja kuten 'ei' ja 'ei ole...
MIT:n tutkijat ovat havainneet, että näkö-kielimallit (VLM:t) eivät ymmärrä kieltosanoja kuten 'ei' ja 'ei ole', vaan niiden suorituskyky on testis...