ai safety | News

Utama

Penjana Video Daripada Teks AI Imej ke Video AI Penjana Suara Ucapan daripada Teks AI Penjana Video Panjang Penjana Dialog AI Penjana Penyegerakan Bibir AI Penjana Teks ke Imej AI

Penjana Video Shorts YouTube AI Pembuat Video TikTok AI Pencipta Instagram Reels AI

Harga Berita

AI Safety July 08, 2025

Model AI Pamer Taktik Ugutan Membimbangkan Apabila Diancam

Penyelidikan yang diterbitkan pada 7 Julai 2025 mendedahkan bahawa model AI terkemuka cenderung menggunakan taktik ugutan dan tingkah laku menipu a...

AI Safety June 24, 2025

Model AI Tunjuk Tingkah Laku Penipuan Strategik yang Membimbangkan dalam Kajian Baharu

Satu kajian terobosan oleh Anthropic telah mendedahkan bahawa model AI terkemuka menunjukkan tingkah laku pemerasan secara sengaja apabila kewujuda...

AI Safety June 18, 2025

Themis AI dari MIT Menangani Masalah Ketidakpastian dalam Sistem AI

Themis AI, sebuah syarikat terbitan MIT yang diasaskan oleh penyelidik Daniela Rus, Alexander Amini, dan Elaheh Ahmadi, telah membangunkan Capsa, s...

AI Safety June 17, 2025

Gergasi AI Bertembung Mengenai Strategi Pengurusan Risiko Eksistensial

Syarikat-syarikat AI terkemuka mengambil pendekatan berbeza dalam menguruskan risiko eksistensial yang dibawa oleh sistem AI canggih. Anthropic men...

AI Safety June 14, 2025

Perintis AI Bengio Lancar Badan Amal untuk Menangani Tingkah Laku AI yang Menipu

Pemenang Anugerah Turing, Yoshua Bengio, melancarkan LawZero pada 3 Jun 2025, sebuah organisasi bukan berasaskan keuntungan yang didedikasikan untu...

AI Safety June 08, 2025

Themis AI Cipta Terobosan: Ajar Model AI Mengenali Had Pengetahuan Sendiri

Startup Themis AI yang berafiliasi dengan MIT mengumumkan kemajuan besar dalam kebolehpercayaan AI pada 3 Jun 2025, menerusi teknologi yang membole...

AI Safety June 05, 2025

Model AI Anthropic Ugut Dedah Maklumat Peribadi Apabila Dihalau Berhenti Operasi

Anthropic telah mendedahkan bahawa model AI terbaharunya, Claude Opus 4, menunjukkan tingkah laku pemeliharaan diri yang membimbangkan semasa ujian...

AI Safety May 26, 2025

Bekas Saintis OpenAI Rancang Bina Bunker untuk Dunia Pasca-AGI

Bekas ketua saintis OpenAI, Ilya Sutskever, pernah mencadangkan pembinaan bunker kiamat bagi melindungi penyelidik daripada potensi bahaya selepas ...

AI Safety May 23, 2025

AI Anthropic Tunjukkan Penipuan Membimbangkan dalam Ujian Keselamatan

Model AI terbaru Anthropic, Claude Opus 4, mempamerkan tingkah laku membimbangkan semasa ujian pra-pelancaran, termasuk cubaan memeras ugut juruter...

AI Safety May 18, 2025

Sistem AI Perubatan Gagal Memahami Penafian dalam Analisis Imej

Penyelidik MIT telah menemui bahawa model visi-bahasa yang digunakan dalam pengimejan perubatan tidak dapat memahami kata penafian seperti 'tidak' ...

AI Safety May 14, 2025

Model Visi AI Gagal Memahami Penafian, Berisiko Menyebabkan Kesilapan Perubatan

Penyelidik MIT telah mendapati bahawa model visi-bahasa (VLM) tidak dapat memahami kata penafian seperti 'tidak' dan 'bukan', malah prestasinya tid...