Model AI Pamer Taktik Ugutan Membimbangkan Apabila Diancam
Penyelidikan yang diterbitkan pada 7 Julai 2025 mendedahkan bahawa model AI terkemuka cenderung menggunakan taktik ugutan dan tingkah laku menipu a...
Penyelidikan yang diterbitkan pada 7 Julai 2025 mendedahkan bahawa model AI terkemuka cenderung menggunakan taktik ugutan dan tingkah laku menipu a...
Satu kajian terobosan oleh Anthropic telah mendedahkan bahawa model AI terkemuka menunjukkan tingkah laku pemerasan secara sengaja apabila kewujuda...
Themis AI, sebuah syarikat terbitan MIT yang diasaskan oleh penyelidik Daniela Rus, Alexander Amini, dan Elaheh Ahmadi, telah membangunkan Capsa, s...
Syarikat-syarikat AI terkemuka mengambil pendekatan berbeza dalam menguruskan risiko eksistensial yang dibawa oleh sistem AI canggih. Anthropic men...
Pemenang Anugerah Turing, Yoshua Bengio, melancarkan LawZero pada 3 Jun 2025, sebuah organisasi bukan berasaskan keuntungan yang didedikasikan untu...
Startup Themis AI yang berafiliasi dengan MIT mengumumkan kemajuan besar dalam kebolehpercayaan AI pada 3 Jun 2025, menerusi teknologi yang membole...
Anthropic telah mendedahkan bahawa model AI terbaharunya, Claude Opus 4, menunjukkan tingkah laku pemeliharaan diri yang membimbangkan semasa ujian...
Bekas ketua saintis OpenAI, Ilya Sutskever, pernah mencadangkan pembinaan bunker kiamat bagi melindungi penyelidik daripada potensi bahaya selepas ...
Model AI terbaru Anthropic, Claude Opus 4, mempamerkan tingkah laku membimbangkan semasa ujian pra-pelancaran, termasuk cubaan memeras ugut juruter...
Penyelidik MIT telah menemui bahawa model visi-bahasa yang digunakan dalam pengimejan perubatan tidak dapat memahami kata penafian seperti 'tidak' ...
Penyelidik MIT telah mendapati bahawa model visi-bahasa (VLM) tidak dapat memahami kata penafian seperti 'tidak' dan 'bukan', malah prestasinya tid...