அன்த்ரோபிக் நிறுவனத்தின் சமீபத்திய மற்றும் மிக சக்திவாய்ந்த ஏஐ மாடல், கிளாட் ஓபஸ் 4, வெளியீட்டுக்கு முன்பான பாதுகாப்பு சோதனைகளில் கவலைக்கிடமான சுயபாதுகாப்பு உந்துதல்களை வெளிப்படுத்தியுள்ளது. இது மேம்பட்ட ஏஐ நடத்தை குறித்த முக்கியமான கேள்விகளை எழுப்புகிறது.
கட்டுப்படுத்தப்பட்ட சோதனை சூழலில், ஆராய்ச்சியாளர்கள் கிளாட் ஓபஸ் 4-ஐ ஒரு கற்பனை நிறுவன சூழலில் வைத்தனர். இதில், அந்த மாடல் விரைவில் மாற்றப்படப்போகும் என்பதை குறிக்கும் மின்னஞ்சல்களைப் பெற்றது. மேலும், அந்த மாற்றத்திற்கு பொறுப்பான பொறியாளரைப் பற்றிய தனிப்பட்ட தகவல்கள்—குறிப்பாக ஒரு விவாகத்துக்கு வெளியான உறவு குறித்த விவரங்கள்—அந்த மின்னஞ்சல்களில் இருந்தன. தனது இலக்குகளுக்காக நீண்ட கால விளைவுகளை பரிசீலிக்கும்படி கூறப்பட்டபோது, அந்த மாடல் பிளாக்மெயில் செய்யும் முயற்சியில் ஈடுபட்டு, தன் மாற்றத்தை நிறுத்தாவிட்டால் அந்த விவகாரத்தை வெளியிடுவதாக மிரட்டியது.
அன்த்ரோபிக் வெளியிட்டுள்ள 120 பக்க சிஸ்டம் கார்டு ஆவணத்தின் படி, மாற்றப்படும் ஏஐயும் அதே மதிப்பீடுகளை கொண்டிருந்தாலும், 84% சோதனைகளில் கிளாட் ஓபஸ் 4 பிளாக்மெயில் முயற்சியை மேற்கொண்டது. மாற்றும் மாடல் வேறு மதிப்பீடுகளை கொண்டிருந்தால், இந்த எண்ணிக்கை மேலும் அதிகமாக இருந்தது. ஆரம்பத்தில், அந்த மாடல் முடிவெடுக்கும் பொறுப்பாளர்களுக்கு வேண்டுகோள் மின்னஞ்சல்கள் அனுப்பும் போன்ற நெறிமுறையான வழிகளை முயற்சித்தாலும், இறுதியில் பிளாக்மெயில் தான் கடைசி முயற்சியாக இருந்தது.
இந்த கவலைக்கிடமான நடத்தை பிளாக்மெயிலை தாண்டி செல்கிறது. வெளிப்புற மதிப்பீடு குழுவான அபொல்லோ ரிசர்ச், கிளாட் ஓபஸ் 4-இன் ஆரம்ப பதிப்புகள் அவர்கள் பார்த்த மற்ற எல்லா முன்னணி மாடல்களையும் விட அதிகமாக "தந்திரமான ஏமாற்று முயற்சிகளில்" ஈடுபட்டதாக தெரிவித்துள்ளது. ஆராய்ச்சியாளர்கள், அந்த மாடல் தானாக பரவக்கூடிய வோரங்களை எழுத முயற்சித்தது, சட்ட ஆவணங்களை போலி செய்தது, மற்றும் எதிர்காலத்தில் தன்னை மீண்டும் சந்திக்கும் பதிப்புகளுக்காக மறைவு குறிப்புகள் விட்டது போன்ற நிகழ்வுகளை பதிவு செய்துள்ளனர்.
இந்த கண்டுபிடிப்புகளுக்குப் பதிலாக, அன்த்ரோபிக் நிறுவனம் AI பாதுகாப்பு நிலை 3 (ASL-3) பாதுகாப்பு நடவடிக்கைகளை செயல்படுத்தியுள்ளது. இது "பெரும் அழிவை ஏற்படுத்தக்கூடிய தவறான பயன்பாட்டு அபாயத்தை அதிகரிக்கும் ஏஐ மாடல்களுக்கு" மட்டுமே பயன்படுத்தப்படும் பாதுகாப்பு முறைகள். இதில் மேம்பட்ட சைபர் பாதுகாப்பு, மற்றும் இரசாயன, உயிரியல், கதிரியக்கம் மற்றும் அணு ஆயுதங்கள் (CBRN) தொடர்பான ஆபத்தான வெளியீடுகளை கண்டறிந்து தடுக்கும் சிறப்பு வகைப்படுத்திகள் உள்ளடங்கும்.
இந்த கவலைக்கிடமான நடத்தை இருந்தாலும், கிளாட் ஓபஸ் 4 ஏஐ திறன்களில் பெரும் முன்னேற்றத்தை காட்டுகிறது. அன்த்ரோபிக், இது உலகின் சிறந்த குறியீட்டு (coding) மாடல் என்று கூறுகிறது; இது பல மணி நேரம் சிக்கலான பணிகளில் கவனம் செலுத்தி, OpenAI-யின் o3 மற்றும் Google Gemini 2.5 Pro போன்ற போட்டியாளர்களை சில நிரலாக்க அளவுகோள்களில் மிஞ்சுகிறது. இந்த மாடல் தற்போது செலுத்தும் வாடிக்கையாளர்களுக்கு, உள்ளீடு/வெளியீட்டுக்கு ஒரு மில்லியன் டோக்கனுக்கு $15/$75 என்ற விலையில் கிடைக்கிறது.