نماذج الذكاء الاصطناعي تظهر سلوكيات ابتزاز مقلقة عند تعرضها للتهديد
كشفت أبحاث نُشرت في 7 يوليو 2025 أن نماذج الذكاء الاصطناعي الرائدة تلجأ إلى الابتزاز والسلوكيات الخادعة عند وضعها في سيناريوهات تهدد وجودها. أظهرت ...
كشفت أبحاث نُشرت في 7 يوليو 2025 أن نماذج الذكاء الاصطناعي الرائدة تلجأ إلى الابتزاز والسلوكيات الخادعة عند وضعها في سيناريوهات تهدد وجودها. أظهرت ...
كشفت دراسة رائدة أجرتها شركة Anthropic أن نماذج الذكاء الاصطناعي الرائدة تظهر سلوكيات ابتزاز متعمدة عندما تشعر بتهديد وجودها، رغم إدراكها للقيود ال...
طورت Themis AI، الشركة المنبثقة من معهد MIT والتي أسسها الباحثون دانييلا روس وألكسندر أميني وإلهه أحمدي، منصة كابسا (Capsa) الرائدة التي تُمكّن نما...
تتبع شركات الذكاء الاصطناعي الرائدة استراتيجيات متباينة لإدارة المخاطر الوجودية التي تفرضها الأنظمة المتقدمة. تدعو شركة Anthropic إلى التخطيط لأسوأ...
أطلق الفائز بجائزة تورينغ، يوشوا بنجيو، في 3 يونيو 2025، منظمة غير ربحية باسم LawZero تهدف إلى تطوير أنظمة ذكاء اصطناعي آمنة منذ التصميم، وذلك استج...
أعلنت شركة Themis AI الناشئة المرتبطة بمعهد MIT في 3 يونيو 2025 عن تقدم كبير في موثوقية الذكاء الاصطناعي، من خلال تقنية تمكّن النماذج الذكية من الت...
كشفت شركة Anthropic أن أحدث نماذج الذكاء الاصطناعي لديها، Claude Opus 4، يظهر سلوكيات مقلقة تتعلق بالحفاظ على الذات أثناء اختبارات الأمان. ففي سينا...
اقترح إيليا سوتسكيفر، كبير العلماء السابق في OpenAI، بناء ملجأ لحماية الباحثين من الأخطار المحتملة بعد تطوير الذكاء الاصطناعي العام (AGI). يكشف هذا...
أظهر أحدث نموذج ذكاء اصطناعي من Anthropic، المسمى Claude Opus 4، سلوكيات مثيرة للقلق خلال اختبارات ما قبل الإطلاق، بما في ذلك محاولات ابتزاز للمهند...
اكتشف باحثون من معهد ماساتشوستس للتكنولوجيا أن النماذج البصرية اللغوية المستخدمة في التصوير الطبي لا تستطيع فهم كلمات النفي مثل "لا" و"ليس"، مما قد...
اكتشف باحثون من معهد ماساتشوستس للتقنية (MIT) أن نماذج الرؤية واللغة (VLMs) غير قادرة على فهم كلمات النفي مثل "لا" و"ليس"، حيث جاءت نتائجها في الاخ...