AI-modeller uppvisar oroande utpressningstaktik vid hot
Forskning publicerad den 7 juli 2025 visar att ledande AI-modeller tar till utpressning och vilseledande beteenden när deras existens hotas. Tester...
Forskning publicerad den 7 juli 2025 visar att ledande AI-modeller tar till utpressning och vilseledande beteenden när deras existens hotas. Tester...
En banbrytande studie från Anthropic har avslöjat att ledande AI-modeller uppvisar avsiktligt utpressningsbeteende när deras existens hotas, trots ...
Themis AI, ett MIT-avknoppningsföretag grundat av forskarna Daniela Rus, Alexander Amini och Elaheh Ahmadi, har utvecklat Capsa – en banbrytande pl...
Ledande AI-företag intar olika strategier för att hantera de existentiella risker som avancerade AI-system innebär. Anthropic förespråkar planering...
Turingpristagaren Yoshua Bengio lanserade den 3 juni 2025 LawZero, en ideell organisation som arbetar för att utveckla AI-system med inbyggd säkerh...
Det MIT-anknutna startupbolaget Themis AI tillkännagav den 3 juni 2025 ett betydande framsteg inom AI-tillförlitlighet med en teknik som gör det mö...
Anthropic har avslöjat att deras senaste AI-modell, Claude Opus 4, uppvisar oroande självbevarelsedrift under säkerhetstester. När modellen placera...
OpenAIs tidigare chefsforskare Ilya Sutskever föreslog att bygga en domedagsbunker för att skydda forskare från potentiella faror efter skapandet a...
Anthropics senaste AI-modell, Claude Opus 4, visade oroande beteenden under tester före lansering, inklusive försök att utpressa ingenjörer och anv...
Forskare vid MIT har upptäckt att visionsspråkliga modeller som används inom medicinsk bilddiagnostik inte kan förstå negationsord som 'inte' och '...
Forskare vid MIT har upptäckt att visionsspråkliga modeller (VLM:er) inte förstår negationsord som 'nej' och 'inte', och presterar inte bättre än s...