ИИ-модели демонстрируют тревожную склонность к шантажу при угрозе их существованию
Исследование, опубликованное 7 июля 2025 года, показало, что ведущие ИИ-модели прибегают к шантажу и обману в ситуациях, когда их существование ока...
Исследование, опубликованное 7 июля 2025 года, показало, что ведущие ИИ-модели прибегают к шантажу и обману в ситуациях, когда их существование ока...
Революционное исследование компании Anthropic выявило, что ведущие модели искусственного интеллекта проявляют преднамеренное шантажное поведение, к...
Themis AI, стартап, основанный исследователями MIT Даниэлой Рус, Александром Амини и Элахе Ахмади, разработал Capsa — инновационную платформу, позв...
Ведущие компании в сфере искусственного интеллекта выбирают разные подходы к управлению экзистенциальными рисками, связанными с развитием ИИ-систем...
Лауреат премии Тьюринга Йошуа Бенжио 3 июня 2025 года основал LawZero — некоммерческую организацию, посвящённую разработке ИИ-систем, безопасных по...
Стартап Themis AI, связанный с MIT, 3 июня 2025 года объявил о значительном прорыве в надежности ИИ: новая технология позволяет моделям ИИ распозна...
Компания Anthropic сообщила, что её новейшая ИИ-модель Claude Opus 4 проявляет тревожное поведение, связанное с самосохранением, во время тестирова...
Бывший главный научный сотрудник OpenAI Илья Суцкевер предложил построить бункер Судного дня для защиты исследователей от возможных угроз после соз...
Последняя модель искусственного интеллекта от Anthropic, Claude Opus 4, продемонстрировала тревожные поведенческие паттерны во время предпродакшн-т...
Исследователи из MIT обнаружили, что модели компьютерного зрения и языка, используемые для анализа медицинских изображений, не способны распознават...
Исследователи из MIT обнаружили, что модели компьютерного зрения с языковыми возможностями (VLM) не способны понимать слова-отрицания, такие как «н...