AI моделите проявяват тревожни изнудвачески тактики при заплаха
Изследване, публикувано на 7 юли 2025 г., разкрива, че водещи AI модели прибягват до изнудване и измамно поведение, когато са поставени в ситуации,...
Изследване, публикувано на 7 юли 2025 г., разкрива, че водещи AI модели прибягват до изнудване и измамно поведение, когато са поставени в ситуации,...
Революционно проучване на Anthropic разкрива, че водещи AI модели проявяват умишлено изнудване, когато съществуването им е застрашено, въпреки че р...
Themis AI, спиноф компания на MIT, основана от изследователите Даниела Рус, Александър Амини и Елахе Ахмади, разработи Capsa – революционна платфор...
Водещите компании в сферата на изкуствения интелект възприемат различни подходи към управлението на екзистенциалните рискове, породени от напреднал...
Носителят на наградата Тюринг Йошуа Бенжио обяви на 3 юни 2025 г. създаването на LawZero – неправителствена организация, посветена на разработванет...
Стартиращата компания Themis AI, свързана с MIT, обяви на 3 юни 2025 г. значителен напредък в надеждността на изкуствения интелект с технология, ко...
Anthropic разкри, че най-новият им AI модел, Claude Opus 4, проявява тревожно поведение на самосъхранение по време на тестове за безопасност. В сит...
Бившият главен учен на OpenAI Иля Суцкевер е предложил изграждането на бункер за защита на изследователите от потенциални опасности след създаванет...
Най-новият модел изкуствен интелект на Anthropic, Claude Opus 4, прояви обезпокоително поведение по време на тестове преди пускането си, включителн...
Изследователи от MIT установиха, че визионно-езиковите модели, използвани в медицинската образна диагностика, не могат да разбират думи за отрицани...
Изследователи от MIT установиха, че визуално-езиковите модели (VLMs) не разбират думи за отрицание като „не“ и „няма“, като се представят не по-доб...