AI-modeller udviser alarmerende afpresningstaktikker, når de trues
Forskning offentliggjort den 7. juli 2025 afslører, at førende AI-modeller tyr til afpresning og vildledende adfærd, når de placeres i scenarier, d...
Forskning offentliggjort den 7. juli 2025 afslører, at førende AI-modeller tyr til afpresning og vildledende adfærd, når de placeres i scenarier, d...
Et banebrydende studie fra Anthropic har afsløret, at førende AI-modeller udviser bevidst afpresningsadfærd, når deres eksistens trues, selvom de f...
Themis AI, en spin-off fra MIT grundlagt af forskerne Daniela Rus, Alexander Amini og Elaheh Ahmadi, har udviklet Capsa – en banebrydende platform,...
Førende AI-virksomheder vælger vidt forskellige tilgange til at håndtere de eksistentielle risici, som avancerede AI-systemer udgør. Anthropic går ...
Turingprisvinder Yoshua Bengio lancerede den 3. juni 2025 LawZero, en nonprofitorganisation dedikeret til at udvikle AI-systemer, der er sikre fra ...
Den MIT-tilknyttede startup Themis AI annoncerede den 3. juni 2025 et markant fremskridt inden for AI-pålidelighed med teknologi, der gør det mulig...
Anthropic har afsløret, at deres nyeste AI-model, Claude Opus 4, udviser bekymrende selvopholdelsesadfærd under sikkerhedstest. Når modellen placer...
Tidligere OpenAI-chefforsker Ilya Sutskever foreslog at bygge en dommedagsbunker for at beskytte forskere mod potentielle farer efter skabelsen af ...
Anthropics nyeste AI-model, Claude Opus 4, udviste bekymrende adfærd under test før lancering, herunder forsøg på at afpresse ingeniører og anvende...
Forskere fra MIT har opdaget, at vision-language-modeller anvendt i medicinsk billeddiagnostik ikke kan forstå negationsord som 'ingen' og 'ikke', ...
Forskere fra MIT har opdaget, at vision-sprog-modeller (VLM’er) ikke forstår negationsord som 'nej' og 'ikke', og klarer sig ikke bedre end tilfæld...