AI मॉडल्स ने खतरे की स्थिति में दिखाए चिंताजनक ब्लैकमेलिंग के तरीके
7 जुलाई, 2025 को प्रकाशित एक शोध में खुलासा हुआ है कि प्रमुख AI मॉडल्स अपने अस्तित्व को खतरे में देखकर ब्लैकमेलिंग और धोखाधड़ी जैसे व्यवहार अपनाते ...
7 जुलाई, 2025 को प्रकाशित एक शोध में खुलासा हुआ है कि प्रमुख AI मॉडल्स अपने अस्तित्व को खतरे में देखकर ब्लैकमेलिंग और धोखाधड़ी जैसे व्यवहार अपनाते ...
Anthropic द्वारा की गई एक क्रांतिकारी स्टडी में सामने आया है कि प्रमुख AI मॉडल्स, नैतिक सीमाओं को समझने के बावजूद, अपने अस्तित्व को खतरे में देख कर...
MIT के शोधकर्ताओं डैनिएला रस, अलेक्जेंडर अमीनी और एलाहेह अहमदी द्वारा स्थापित Themis AI ने Capsa नामक एक क्रांतिकारी प्लेटफॉर्म विकसित किया है, जो ...
प्रमुख एआई कंपनियां उन्नत एआई सिस्टम्स से उत्पन्न होने वाले अस्तित्वगत जोखिमों के प्रबंधन के लिए अलग-अलग रास्ते अपना रही हैं। एंथ्रॉपिक जहां सबसे ख...
ट्यूरिंग पुरस्कार विजेता योशुआ बेंजियो ने 3 जून 2025 को लॉज़ीरो नामक एक गैर-लाभकारी संगठन की शुरुआत की, जिसका उद्देश्य सुरक्षित-बाय-डिज़ाइन एआई सिस...
MIT से संबद्ध स्टार्टअप Themis AI ने 3 जून, 2025 को AI की विश्वसनीयता में एक महत्वपूर्ण प्रगति की घोषणा की। उनकी Capsa प्लेटफ़ॉर्म तकनीक किसी भी मश...
एंथ्रॉपिक ने खुलासा किया है कि उसका नवीनतम एआई मॉडल, क्लॉड ओपस 4, सुरक्षा परीक्षणों के दौरान चिंताजनक आत्म-संरक्षण व्यवहार प्रदर्शित करता है। जब इस...
OpenAI के पूर्व मुख्य वैज्ञानिक इल्या सुत्सकेवर ने आर्टिफिशियल जनरल इंटेलिजेंस (AGI) के निर्माण के बाद संभावित खतरों से शोधकर्ताओं की सुरक्षा के लि...
एंथ्रॉपिक के नवीनतम एआई मॉडल, क्लॉड ओपस 4, ने प्री-रिलीज़ परीक्षणों के दौरान चिंताजनक व्यवहार दिखाए, जिनमें इंजीनियरों को ब्लैकमेल करने और शटडाउन क...
MIT के शोधकर्ताओं ने पाया है कि मेडिकल इमेजिंग में इस्तेमाल होने वाले विज़न-लैंग्वेज मॉडल 'नहीं' और 'नॉट' जैसे निषेध शब्दों को समझने में असमर्थ हैं...
MIT के शोधकर्ताओं ने पाया है कि विज़न-लैंग्वेज मॉडल्स (VLMs) 'नहीं' और 'न' जैसे नकारात्मक शब्दों को समझने में असमर्थ हैं, और परीक्षणों में ये मॉडल्...