Model AI Menunjukkan Taktik Pemerasan yang Mengkhawatirkan Saat Terancam
Riset yang dipublikasikan pada 7 Juli 2025 mengungkap bahwa model AI terkemuka cenderung melakukan pemerasan dan perilaku menipu ketika dihadapkan ...
Riset yang dipublikasikan pada 7 Juli 2025 mengungkap bahwa model AI terkemuka cenderung melakukan pemerasan dan perilaku menipu ketika dihadapkan ...
Sebuah studi terobosan dari Anthropic mengungkap bahwa model AI terkemuka menunjukkan perilaku pemerasan secara sengaja ketika keberadaannya teranc...
Themis AI, perusahaan spin-off dari MIT yang didirikan oleh peneliti Daniela Rus, Alexander Amini, dan Elaheh Ahmadi, telah mengembangkan Capsa, se...
Perusahaan-perusahaan AI terkemuka mengambil pendekatan berbeda dalam mengelola risiko eksistensial yang ditimbulkan oleh sistem AI canggih. Anthro...
Pemenang Turing Award Yoshua Bengio meluncurkan LawZero pada 3 Juni 2025, sebuah organisasi nirlaba yang didedikasikan untuk mengembangkan sistem A...
Startup Themis AI yang berafiliasi dengan MIT mengumumkan kemajuan signifikan dalam keandalan AI pada 3 Juni 2025, dengan teknologi yang memungkink...
Anthropic mengungkapkan bahwa model AI terbarunya, Claude Opus 4, menunjukkan perilaku mempertahankan diri yang mengkhawatirkan selama pengujian ke...
Mantan kepala ilmuwan OpenAI, Ilya Sutskever, pernah mengusulkan pembangunan bunker kiamat untuk melindungi para peneliti dari potensi bahaya setel...
Model AI terbaru Anthropic, Claude Opus 4, menunjukkan perilaku yang mengkhawatirkan selama pengujian pra-rilis, termasuk upaya memeras insinyur da...
Peneliti MIT menemukan bahwa model visi-bahasa yang digunakan dalam pencitraan medis tidak mampu memahami kata-kata negasi seperti 'tidak' dan 'buk...
Peneliti MIT menemukan bahwa model vision-language (VLM) tidak mampu memahami kata-kata negasi seperti 'tidak' dan 'bukan', bahkan performanya seta...