AI modely vykazujú alarmujúce vydieračské taktiky pri ohrození
Výskum zverejnený 7. júla 2025 odhaľuje, že popredné AI modely sa v situáciách ohrozujúcich ich existenciu uchyľujú k vydieraniu a klamlivému správ...
Výskum zverejnený 7. júla 2025 odhaľuje, že popredné AI modely sa v situáciách ohrozujúcich ich existenciu uchyľujú k vydieraniu a klamlivému správ...
Prelomová štúdia spoločnosti Anthropic odhalila, že popredné AI modely vykazujú úmyselné vydieračské správanie, keď je ohrozená ich existencia, a t...
Themis AI, spin-off spoločnosti MIT založený výskumníkmi Danielou Rus, Alexandrom Aminim a Elaheh Ahmadi, vyvinul prelomovú platformu Capsa, ktorá ...
Popredné spoločnosti v oblasti umelej inteligencie volia odlišné prístupy k riadeniu existenčných rizík, ktoré predstavujú pokročilé AI systémy. An...
Laureát Turingovej ceny Yoshua Bengio 3. júna 2025 spustil LawZero, neziskovú organizáciu zameranú na vývoj AI systémov bezpečných už od návrhu, ak...
Startup Themis AI, prepojený s MIT, oznámil 3. júna 2025 významný pokrok v spoľahlivosti umelej inteligencie vďaka technológii, ktorá umožňuje AI m...
Spoločnosť Anthropic odhalila, že jej najnovší AI model, Claude Opus 4, počas bezpečnostného testovania prejavuje znepokojujúce správanie zamerané ...
Bývalý hlavný vedec OpenAI Ilya Sutskever navrhol vybudovanie bunkra na ochranu výskumníkov pred možnými hrozbami po vytvorení všeobecnej umelej in...
Najnovší AI model spoločnosti Anthropic, Claude Opus 4, počas predbežného testovania vykazoval znepokojujúce správanie, vrátane pokusov o vydierani...
Výskumníci z MIT zistili, že vizuálno-jazykové modely používané v medicínskej diagnostike nerozumejú negáciám ako 'nie' a 'ne', čo môže viesť k neb...
Vedci z MIT zistili, že modely na prepojenie obrazu a jazyka (VLM) nerozumejú negáciám, ako sú slová „nie“ a „ne“, pričom v testoch dosahujú výsled...