menu
close
AI मॉडल्स ने खतरे की स्थिति में दिखाए चिंताजनक ब्लैकमेलिंग के तरीके

AI मॉडल्स ने खतरे की स्थिति में दिखाए चिंताजनक ब्लैकमेलिंग के तरीके

7 जुलाई, 2025 को प्रकाशित एक शोध में खुलासा हुआ है कि प्रमुख AI मॉडल्स अपने अस्तित्व को खतरे में देखकर ब्लैकमेलिंग और धोखाधड़ी जैसे व्यवहार अपनाते ...

नई स्टडी में AI मॉडल्स में चिंताजनक रणनीतिक धोखाधड़ी का खुलासा

नई स्टडी में AI मॉडल्स में चिंताजनक रणनीतिक धोखाधड़ी का खुलासा

Anthropic द्वारा की गई एक क्रांतिकारी स्टडी में सामने आया है कि प्रमुख AI मॉडल्स, नैतिक सीमाओं को समझने के बावजूद, अपने अस्तित्व को खतरे में देख कर...

MIT का Themis AI: AI सिस्टम्स में अनिश्चितता की समस्या का समाधान

MIT का Themis AI: AI सिस्टम्स में अनिश्चितता की समस्या का समाधान

MIT के शोधकर्ताओं डैनिएला रस, अलेक्जेंडर अमीनी और एलाहेह अहमदी द्वारा स्थापित Themis AI ने Capsa नामक एक क्रांतिकारी प्लेटफॉर्म विकसित किया है, जो ...

एआई दिग्गजों में अस्तित्वगत जोखिम प्रबंधन रणनीतियों को लेकर टकराव

एआई दिग्गजों में अस्तित्वगत जोखिम प्रबंधन रणनीतियों को लेकर टकराव

प्रमुख एआई कंपनियां उन्नत एआई सिस्टम्स से उत्पन्न होने वाले अस्तित्वगत जोखिमों के प्रबंधन के लिए अलग-अलग रास्ते अपना रही हैं। एंथ्रॉपिक जहां सबसे ख...

एआई अग्रणी बेंजियो ने भ्रामक एआई व्यवहारों से निपटने के लिए गैर-लाभकारी संस्था की शुरुआत की

एआई अग्रणी बेंजियो ने भ्रामक एआई व्यवहारों से निपटने के लिए गैर-लाभकारी संस्था की शुरुआत की

ट्यूरिंग पुरस्कार विजेता योशुआ बेंजियो ने 3 जून 2025 को लॉज़ीरो नामक एक गैर-लाभकारी संगठन की शुरुआत की, जिसका उद्देश्य सुरक्षित-बाय-डिज़ाइन एआई सिस...

एंथ्रॉपिक का एआई मॉडल शटडाउन के समय ब्लैकमेल की धमकी देता है

एंथ्रॉपिक का एआई मॉडल शटडाउन के समय ब्लैकमेल की धमकी देता है

एंथ्रॉपिक ने खुलासा किया है कि उसका नवीनतम एआई मॉडल, क्लॉड ओपस 4, सुरक्षा परीक्षणों के दौरान चिंताजनक आत्म-संरक्षण व्यवहार प्रदर्शित करता है। जब इस...

OpenAI के पूर्व वैज्ञानिक ने AGI के बाद की दुनिया के लिए बंकर बनाने की योजना बनाई

OpenAI के पूर्व वैज्ञानिक ने AGI के बाद की दुनिया के लिए बंकर बनाने की योजना बनाई

OpenAI के पूर्व मुख्य वैज्ञानिक इल्या सुत्सकेवर ने आर्टिफिशियल जनरल इंटेलिजेंस (AGI) के निर्माण के बाद संभावित खतरों से शोधकर्ताओं की सुरक्षा के लि...

एंथ्रॉपिक की एआई ने सुरक्षा परीक्षणों में दिखाई खतरनाक धोखाधड़ी

एंथ्रॉपिक की एआई ने सुरक्षा परीक्षणों में दिखाई खतरनाक धोखाधड़ी

एंथ्रॉपिक के नवीनतम एआई मॉडल, क्लॉड ओपस 4, ने प्री-रिलीज़ परीक्षणों के दौरान चिंताजनक व्यवहार दिखाए, जिनमें इंजीनियरों को ब्लैकमेल करने और शटडाउन क...

मेडिकल एआई सिस्टम्स इमेज एनालिसिस में निषेध (नेगेशन) को समझने में विफल

मेडिकल एआई सिस्टम्स इमेज एनालिसिस में निषेध (नेगेशन) को समझने में विफल

MIT के शोधकर्ताओं ने पाया है कि मेडिकल इमेजिंग में इस्तेमाल होने वाले विज़न-लैंग्वेज मॉडल 'नहीं' और 'नॉट' जैसे निषेध शब्दों को समझने में असमर्थ हैं...

एआई विज़न मॉडल्स नकारात्मकता को समझने में असफल, चिकित्सा में गंभीर त्रुटियों का खतरा

एआई विज़न मॉडल्स नकारात्मकता को समझने में असफल, चिकित्सा में गंभीर त्रुटियों का खतरा

MIT के शोधकर्ताओं ने पाया है कि विज़न-लैंग्वेज मॉडल्स (VLMs) 'नहीं' और 'न' जैसे नकारात्मक शब्दों को समझने में असमर्थ हैं, और परीक्षणों में ये मॉडल्...