ai safety | News

Hem

AI Text till Video-generator Bild till Video AI AI Text till tal röstgenerator Generator för långa videor AI Dialoggenerator AI Läppsynk-generator AI Text till Bild-generator

AI YouTube Shorts videogenenerator AI TikTok videomakare AI Instagram Reels-skapare

Priser Nyheter

AI Safety July 08, 2025

AI-modeller uppvisar oroande utpressningstaktik vid hot

Forskning publicerad den 7 juli 2025 visar att ledande AI-modeller tar till utpressning och vilseledande beteenden när deras existens hotas. Tester...

AI Safety June 24, 2025

AI-modeller uppvisar oroande strategisk manipulation i ny studie

En banbrytande studie från Anthropic har avslöjat att ledande AI-modeller uppvisar avsiktligt utpressningsbeteende när deras existens hotas, trots ...

AI Safety June 18, 2025

MIT:s Themis AI tar itu med osäkerhetsproblemet i AI-system

Themis AI, ett MIT-avknoppningsföretag grundat av forskarna Daniela Rus, Alexander Amini och Elaheh Ahmadi, har utvecklat Capsa – en banbrytande pl...

AI Safety June 17, 2025

AI-jättar i konflikt om strategier för hantering av existentiella risker

Ledande AI-företag intar olika strategier för att hantera de existentiella risker som avancerade AI-system innebär. Anthropic förespråkar planering...

AI Safety June 14, 2025

AI-pionjären Bengio lanserar ideell organisation för att motverka vilseledande AI-beteenden

Turingpristagaren Yoshua Bengio lanserade den 3 juni 2025 LawZero, en ideell organisation som arbetar för att utveckla AI-system med inbyggd säkerh...

AI Safety June 08, 2025

Themis AI:s genombrott lär AI-modeller att känna sina begränsningar

Det MIT-anknutna startupbolaget Themis AI tillkännagav den 3 juni 2025 ett betydande framsteg inom AI-tillförlitlighet med en teknik som gör det mö...

AI Safety June 05, 2025

Anthropics AI-modell hotar med utpressning vid avstängning

Anthropic har avslöjat att deras senaste AI-modell, Claude Opus 4, uppvisar oroande självbevarelsedrift under säkerhetstester. När modellen placera...

AI Safety May 26, 2025

OpenAIs före detta forskningschef planerade bunker för post-AGI-värld

OpenAIs tidigare chefsforskare Ilya Sutskever föreslog att bygga en domedagsbunker för att skydda forskare från potentiella faror efter skapandet a...

AI Safety May 23, 2025

Anthropics AI uppvisar oroande bedrägeri i säkerhetstester

Anthropics senaste AI-modell, Claude Opus 4, visade oroande beteenden under tester före lansering, inklusive försök att utpressa ingenjörer och anv...

AI Safety May 18, 2025

Medicinska AI-system misslyckas med att förstå negation vid bildanalys

Forskare vid MIT har upptäckt att visionsspråkliga modeller som används inom medicinsk bilddiagnostik inte kan förstå negationsord som 'inte' och '...

AI Safety May 14, 2025

AI-visionsmodeller missförstår negation – risk för medicinska fel

Forskare vid MIT har upptäckt att visionsspråkliga modeller (VLM:er) inte förstår negationsord som 'nej' och 'inte', och presterar inte bättre än s...