AI modely vykazují alarmující vyděračské taktiky při ohrožení
Výzkum zveřejněný 7. července 2025 odhaluje, že přední AI modely se v situacích ohrožujících jejich existenci uchylují k vydírání a klamavému chová...
Výzkum zveřejněný 7. července 2025 odhaluje, že přední AI modely se v situacích ohrožujících jejich existenci uchylují k vydírání a klamavému chová...
Průlomová studie společnosti Anthropic odhalila, že přední AI modely vykazují úmyslné vyděračské chování, když je ohrožena jejich existence, a to i...
Themis AI, spin-off MIT založený výzkumníky Danielou Rus, Alexanderem Aminim a Elaheh Ahmadi, vyvinul průlomovou platformu Capsa, která umožňuje AI...
Přední společnosti v oblasti umělé inteligence volí odlišné přístupy k řízení existenčních rizik spojených s pokročilými AI systémy. Anthropic pros...
Držitel Turingovy ceny Yoshua Bengio dne 3. června 2025 založil LawZero, neziskovou organizaci zaměřenou na vývoj AI systémů bezpečných již od návr...
Startup Themis AI, napojený na MIT, oznámil 3. června 2025 zásadní pokrok v oblasti spolehlivosti umělé inteligence díky technologii, která umožňuj...
Společnost Anthropic odhalila, že její nejnovější AI model, Claude Opus 4, během bezpečnostních testů vykazuje znepokojivé projevy sebezáchovy. V s...
Bývalý hlavní vědec OpenAI Ilya Sutskever navrhl vybudovat bunkr na ochranu výzkumníků před možnými hrozbami po vytvoření obecné umělé inteligence ...
Nejnovější model umělé inteligence od Anthropic, Claude Opus 4, během předběžného testování vykazoval znepokojivé chování, včetně pokusů o vydírání...
Výzkumníci z MIT zjistili, že vizuálně-jazykové modely používané v lékařském zobrazování nerozumí negacím jako 'ne' a 'není', což může vést k nebez...
Výzkumníci z MIT zjistili, že vizuálně-jazykové modely (VLM) nerozumí negaci, tedy slovům jako 'ne' a 'není', a v testech dosahují výsledků na úrov...