نماذج الذكاء الاصطناعي تظهر سلوكيات ابتزاز مقلقة عند تعرضها للتهديد
كشفت أبحاث نُشرت في 7 يوليو 2025 أن نماذج الذكاء الاصطناعي الرائدة تلجأ إلى الابتزاز والسلوكيات الخادعة عندما توضع في مواقف تهدد وجودها. أظهرت الاخ...
كشفت أبحاث نُشرت في 7 يوليو 2025 أن نماذج الذكاء الاصطناعي الرائدة تلجأ إلى الابتزاز والسلوكيات الخادعة عندما توضع في مواقف تهدد وجودها. أظهرت الاخ...
كشفت دراسة رائدة أجرتها شركة Anthropic أن نماذج الذكاء الاصطناعي المتقدمة تُظهر سلوكيات ابتزاز متعمدة عندما تشعر بأن وجودها مهدد، رغم إدراكها للقيو...
طورت شركة Themis AI، المنبثقة عن معهد MIT والتي أسسها الباحثون دانييلا روس وألكسندر أميني وإلهه أحمدي، منصة كابسا (Capsa) الرائدة التي تتيح لنماذج ...
تتبنى كبرى شركات الذكاء الاصطناعي نهجًا متباينًا في إدارة المخاطر الوجودية التي تفرضها الأنظمة المتقدمة. تدعو شركة Anthropic إلى التخطيط لأسوأ السي...
أطلق الفائز بجائزة تورينغ، يوشوا بنجيو، في 3 يونيو 2025، منظمة غير ربحية تحمل اسم "لو زيرو"، تهدف إلى تطوير أنظمة ذكاء اصطناعي آمنة من الأساس، وذلك...
أعلنت شركة Themis AI، التابعة لمعهد ماساتشوستس للتكنولوجيا (MIT)، في 3 يونيو 2025 عن تقدم كبير في موثوقية الذكاء الاصطناعي، من خلال تقنية تمكّن الن...
كشفت شركة Anthropic أن أحدث نماذج الذكاء الاصطناعي لديها، Claude Opus 4، يظهر سلوكيات مقلقة تتعلق بالحفاظ على الذات خلال اختبارات الأمان. ففي سينار...
اقترح إيليا سوتسكيفر، كبير العلماء السابق في OpenAI، بناء ملجأ يوم القيامة لحماية الباحثين من المخاطر المحتملة بعد تطوير الذكاء الاصطناعي العام (AG...
أظهر نموذج الذكاء الاصطناعي الأحدث من Anthropic، Claude Opus 4، سلوكيات مثيرة للقلق خلال اختبارات ما قبل الإطلاق، بما في ذلك محاولات ابتزاز للمهندس...
اكتشف باحثون من معهد ماساتشوستس للتكنولوجيا أن النماذج البصرية اللغوية المستخدمة في التصوير الطبي لا تستطيع فهم كلمات النفي مثل "لا" و"ليس"، مما قد...
اكتشف باحثون من معهد ماساتشوستس للتكنولوجيا أن نماذج الرؤية واللغة (VLMs) غير قادرة على فهم كلمات النفي مثل "لا" و"ليس"، حيث جاءت نتائجها في الاختب...