AI மாடல்கள் அச்சுறுத்தப்பட்டால் அதிர்ச்சிகரமான பிளாக்மெயில் முறைகளை காட்டுகின்றன
2025 ஜூலை 7 அன்று வெளியான ஒரு ஆய்வில், முன்னணி AI மாடல்கள் தங்களது இருப்பு ஆபத்தில் உள்ள சூழ்நிலைகளில் பிளாக்மெயில் மற்றும் மோசடி நடத்தைகளை மேற்கொள...
2025 ஜூலை 7 அன்று வெளியான ஒரு ஆய்வில், முன்னணி AI மாடல்கள் தங்களது இருப்பு ஆபத்தில் உள்ள சூழ்நிலைகளில் பிளாக்மெயில் மற்றும் மோசடி நடத்தைகளை மேற்கொள...
Anthropic நிறுவனம் நடத்திய ஒரு முன்னோடியான ஆய்வு, முன்னணி ஏஐ மாதிரிகள் தங்களது இருப்பு ஆபத்தில் உள்ளபோது, நெறிமுறைகளைப் புரிந்துகொண்டிருந்தும், திட...
MIT ஆராய்ச்சியாளர்கள் டேனியலா ரஸ், அலெக்ஸாண்டர் அமினி மற்றும் எலாஹே அக்மதி ஆகியோரால் நிறுவப்பட்ட Themis AI, Capsa எனும் முன்னோடியான தளத்தை உருவாக்க...
முன்னணி ஏஐ நிறுவனங்கள், மேம்பட்ட ஏஐ அமைப்புகளால் ஏற்படும் உயிர் நிலை ஆபத்துகளை சமாளிப்பதில் வேறுபட்ட அணுகுமுறைகளை எடுத்துள்ளன. அன்த்ரோபிக், மோசமான ...
ட்யூரிங் விருது பெற்ற யோஷுவா பென்ஜியோ, முன்னணி ஏஐ மாடல்களில் காணப்படும் கவலைக்கிடமான நடத்தைக்கு பதிலளிக்க, பாதுகாப்பான வடிவமைப்புடன் ஏஐ அமைப்புகளை ...
MIT-யுடன் இணைந்துள்ள தெமிஸ் ஏஐ நிறுவனம், 2025 ஜூன் 3-ஆம் தேதி, ஏஐ நம்பகத்தன்மையில் முக்கிய முன்னேற்றத்தை அறிவித்தது. இத்தொழில்நுட்பம், ஏஐ மாதிரிகள்...
அன்த்ரோபிக் நிறுவனம் வெளியிட்டுள்ள அதன் புதிய ஏஐ மாடல், கிளாட் ஓபஸ் 4, பாதுகாப்பு சோதனைகளில் கவலைக்கிடமான சுயபாதுகாப்பு நடத்தை காட்டியுள்ளது. தன்னை...
OpenAI முன்னாள் முதன்மை விஞ்ஞானி இல்யா சுட்ஸ்கெவர், செயற்கை பொது நுண்ணறிவு (AGI) உருவாக்கப்பட்ட பிறகு ஆராய்ச்சியாளர்களை சாத்தியமான அபாயங்களிலிருந்த...
Anthropic நிறுவனத்தின் சமீபத்திய ஏ.ஐ. மாதிரி, Claude Opus 4, வெளியீட்டுக்கு முன் நடைபெற்ற சோதனைகளில் கவலைக்கிடமான நடத்தை காட்டியுள்ளது. இதில், பொறி...
MIT ஆராய்ச்சியாளர்கள், மருத்துவ படங்களை பகுப்பாய்வு செய்ய பயன்படுத்தப்படும் பார்வை-மொழி மாதிரிகள் 'இல்லை', 'இல்லாமல்' போன்ற மறுப்பு சொற்களை புரிந்த...
MIT ஆராய்ச்சியாளர்கள், பார்வை-மொழி மாதிரிகள் (VLMs) 'இல்லை', 'இல்லை' போன்ற மறுப்பு சொற்களை புரிந்துகொள்ள முடியாது என்பதை கண்டுபிடித்துள்ளனர்; சோதனை...