एआई विज़न मॉडल्स चिकित्सा इमेजिंग में महत्वपूर्ण नकारात्मकता परीक्षण में फेल

MIT के शोधकर्ताओं ने पाया है कि विज़न-लैंग्वेज मॉडल, जो चिकित्सा इमेज विश्लेषण में बड़े पैमाने पर उपयोग किए जाते हैं, 'नहीं' और 'न' जैसे नकारात्मक शब्दों को समझने में असमर्थ हैं। यह गंभीर कमी तब खतरनाक हो सकती है जब इन एआई सिस्टम्स से विशिष्ट मानदंडों के साथ चिकित्सा इमेज प्राप्त करने को कहा जाए। 14 मई, 2025 को प्रकाशित इस अध्ययन में NegBench नामक एक नया बेंचमार्क पेश किया गया है, जो एआई विज़न सिस्टम्स में नकारात्मकता समझने की क्षमता का मूल्यांकन और सुधार करता है।

MIT के शोधकर्ताओं के एक नए अध्ययन ने विज़न-लैंग्वेज मॉडल्स (VLMs) में एक मौलिक खामी उजागर की है, जो चिकित्सा निदान और अन्य महत्वपूर्ण अनुप्रयोगों के लिए गंभीर परिणाम ला सकती है।

MIT के इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर साइंस विभाग के कुमैल अलहमौद और वरिष्ठ लेखक मरज़िएह घसेमी के नेतृत्व में टीम ने पाया कि ये एआई सिस्टम्स—जो चिकित्सा इमेज का विश्लेषण करने के लिए तेजी से उपयोग में लाए जा रहे हैं—प्रश्नों में 'नहीं' और 'न' जैसे नकारात्मक शब्दों को समझने में विफल रहते हैं।

यह कमी विशेष रूप से चिकित्सा परिप्रेक्ष्य में समस्या बन जाती है। उदाहरण के लिए, जब एक रेडियोलॉजिस्ट एक छाती के एक्स-रे की जांच करता है जिसमें ऊतक में सूजन है लेकिन दिल बड़ा नहीं है, तो यदि एआई सिस्टम से इसी तरह के मामले खोजने को कहा जाए और मॉडल विशिष्ट स्थितियों की उपस्थिति और अनुपस्थिति में अंतर न कर सके, तो गलत निदान हो सकता है।

मुख्य लेखक अलहमौद चेतावनी देते हैं, "ये नकारात्मक शब्द बहुत महत्वपूर्ण प्रभाव डाल सकते हैं, और यदि हम इन मॉडलों का आंख मूंदकर उपयोग करते हैं, तो हमें विनाशकारी परिणामों का सामना करना पड़ सकता है।" जब इन मॉडलों की छवि कैप्शन में नकारात्मकता पहचानने की क्षमता का परीक्षण किया गया, तो उनका प्रदर्शन यादृच्छिक अनुमान से बेहतर नहीं था।

इस समस्या के समाधान के लिए, शोधकर्ताओं ने NegBench विकसित किया है, जो 18 कार्य विविधताओं में फैले 79,000 उदाहरणों के साथ एक व्यापक बेंचमार्क है, जिसमें छवि, वीडियो और चिकित्सा डेटासेट शामिल हैं। यह बेंचमार्क दो मुख्य क्षमताओं का मूल्यांकन करता है: नकारात्मक प्रश्नों के आधार पर इमेज प्राप्त करना और नकारात्मक कैप्शन वाले बहुविकल्पीय प्रश्नों के उत्तर देना।

टीम ने नकारात्मकता-विशिष्ट उदाहरणों के साथ डेटासेट भी बनाए, ताकि इन मॉडलों को पुनः प्रशिक्षित किया जा सके। इससे नकारात्मक प्रश्नों पर रिकॉल में 10% और नकारात्मक कैप्शन वाले बहुविकल्पीय प्रश्नों पर सटीकता में 28% की वृद्धि हुई। हालांकि, शोधकर्ता चेतावनी देते हैं कि इस समस्या की जड़ तक पहुंचने के लिए अभी और काम करना बाकी है।

घसेमी जोर देते हैं, "यदि नकारात्मकता जैसी बुनियादी चीज़ ही टूटी हुई है, तो हमें इन बड़े विज़न/लैंग्वेज मॉडल्स का उपयोग वैसे नहीं करना चाहिए, जैसे हम अभी कर रहे हैं—बिना गहन मूल्यांकन के।"

यह शोध आगामी कंप्यूटर विज़न एंड पैटर्न रिकग्निशन सम्मेलन में प्रस्तुत किया जाएगा, जो स्वास्थ्य सेवा जैसे महत्वपूर्ण क्षेत्रों में अधिक मजबूत एआई सिस्टम्स की तत्काल आवश्यकता को उजागर करता है।

Source:

एआई विज़न मॉडल्स चिकित्सा इमेजिंग में महत्वपूर्ण नकारात्मकता परीक्षण में फेल

Latest News

ByteDance के Doubao AI में अब रियल-टाइम वीडियो असिस्टेंस की सुविधा

OnePlus ने अलर्ट स्लाइडर हटाकर AI-समर्थित प्लस की पेश की

जर्मन टेक दिग्गजों ने ईयू समर्थित एआई गीगाफैक्ट्री के लिए मिलाया हाथ

अमेरिकी अभियोजकों ने $1.5 बिलियन की एआई स्टार्टअप Builder.ai के पतन से पहले की थी जांच

नॉर्वे के $1.8 ट्रिलियन फंड ने कर्मचारियों के लिए AI को अनिवार्य बनाया

OpenTools.ai ने टेक प्रोफेशनल्स के लिए AI न्यूज़ हब लॉन्च किया

Google ने Gemini के माध्यम से डेवलपर्स के लिए AI कंप्यूटर नियंत्रण का विस्तार किया

Google ने Gemini मॉडलों में पारदर्शी विचार सारांश जोड़े

एआई विज़न मॉडल्स चिकित्सा इमेजिंग में महत्वपूर्ण नकारात्मकता परीक्षण में फेल

Related Articles

एंथ्रॉपिक के क्लॉड 4 मॉडल्स ने एआई कोडिंग में नया बेंचमार्क स्थापित किया

विश्लेषकों ने CCC इंटेलिजेंट सॉल्यूशंस के लिए 'मॉडरेट बाय' रेटिंग बरकरार रखी

नासा ने अगले दशक की अंतरिक्ष खोज के लिए साहसिक एआई रणनीति का अनावरण किया

OpenAI के पूर्व वैज्ञानिक ने AGI के बाद की दुनिया के लिए बंकर बनाने की योजना बनाई

Latest News

ByteDance के Doubao AI में अब रियल-टाइम वीडियो असिस्टेंस की सुविधा

OnePlus ने अलर्ट स्लाइडर हटाकर AI-समर्थित प्लस की पेश की

जर्मन टेक दिग्गजों ने ईयू समर्थित एआई गीगाफैक्ट्री के लिए मिलाया हाथ

अमेरिकी अभियोजकों ने $1.5 बिलियन की एआई स्टार्टअप Builder.ai के पतन से पहले की थी जांच

नॉर्वे के $1.8 ट्रिलियन फंड ने कर्मचारियों के लिए AI को अनिवार्य बनाया

OpenTools.ai ने टेक प्रोफेशनल्स के लिए AI न्यूज़ हब लॉन्च किया

Google ने Gemini के माध्यम से डेवलपर्स के लिए AI कंप्यूटर नियंत्रण का विस्तार किया

Google ने Gemini मॉडलों में पारदर्शी विचार सारांश जोड़े