சீனத்தைச் சேர்ந்த செயற்கை நுண்ணறிவு ஸ்டார்ட்அப் DeepSeek, ஜனவரியில் தனது புரட்சி கொண்ட R1 மாதிரியுடன் தொழில்நுட்ப பங்குகளை வீழ்த்திய நிறுவனம், அதன் முக்கியமான ஏஐ அமைப்பிற்கு ஒரு முக்கியமான மேம்படுத்தலை அமைதியாக அறிமுகப்படுத்தியுள்ளது.
DeepSeek-R1-0528 என அழைக்கப்படும் இந்த புதிய பதிப்பு, மே 28-ஆம் தேதி நிறுவத்தின் WeChat குழுவில் ஒரு சுருக்கமான அறிவிப்புடன் வெளியிடப்பட்டது. DeepSeek இதை 'சிறிய சோதனை மேம்படுத்தல்' என விவரித்தாலும், ஆரம்ப சோதனைகள் பல்வேறு துறைகளில் குறிப்பிடத்தக்க முன்னேற்றங்களை வெளிப்படுத்துகின்றன.
LiveCodeBench தலைப்பட்டையில், மேம்படுத்தப்பட்ட மாதிரி தற்போது குறியீடு எழுதும் திறனில் நான்காவது இடத்தில் உள்ளது; Pass@1 மதிப்பெண் 73.1 ஆகும். இது OpenAI-யின் O3 மற்றும் O4-Mini மாதிரிகளுக்கு அடுத்ததாகும். மேற்கு நிறுவனங்களைவிட குறைந்த வளங்களுடன் உருவாக்கப்பட்ட ஓப்பன்-சோர்ஸ் மாதிரிக்காக இது ஒரு பெரிய முன்னேற்றமாகும்.
தொழில்நுட்ப விவரங்களில், R1-0528 அதன் முன்னோடியான MoE (Mixture-of-Experts) கட்டமைப்பைத் தொடர்கிறது; மொத்தம் சுமார் 685 பில்லியன் அளவிலான அளவுருக்கள் உள்ளன, ஆனால் முடிவெடுக்கும் போது சுமார் 37 பில்லியன் மட்டுமே செயல்படுகின்றன. மாதிரி தற்போது 128K டோக்கன்கள் வரை விரிவாக்கப்பட்ட சூழல் சாளரத்தை (context window) ஆதரிக்கிறது; இது மிகப்பெரிய ஆவணங்கள் மற்றும் குறியீடுகளை செயலாக்க அனுமதிக்கிறது.
பயனர் கருத்துக்கள் காரணமுறை ஆழம், எழுத்துத் தரம் மற்றும் சிக்கலான பிரச்சனைகளைத் தீர்க்கும் திறனில் முன்னேற்றங்களை வெளிப்படுத்துகின்றன. டெவலப்பர்கள், மாதிரி தற்போது Google மாதிரிகளுக்கு ஒப்பாக 30-60 நிமிடங்கள் நீடிக்கும் விரிவான காரணமுறை அமர்வுகளை மேற்கொள்ள முடிகிறது என தெரிவிக்கின்றனர். மேம்படுத்தல், முன்பு இருந்த உரை உருவாக்க குறைபாடுகளை சரிசெய்து, மேலும் இயற்கையான மற்றும் நன்கு வடிவமைக்கப்பட்ட உள்ளடக்கத்தை வழங்குகிறது.
DeepSeek-ன் தொடர்ச்சியான புதுமை, ஏஐ வளர்ச்சி பெரும் கணினி சக்தி மற்றும் முதலீடு தேவை என்பதைக் கேள்விக்குறியாக்குகிறது. செலவு குறைந்த, ஓப்பன்-சோர்ஸ் மாதிரிகளுடன் DeepSeek பெற்ற வெற்றி, OpenAI விலை குறைத்தல் மற்றும் Google தள்ளுபடி கட்டணங்களை அறிமுகப்படுத்துதல் போன்ற பதில்களை ஏற்க வைத்துள்ளது. இதேசமயம், Alibaba மற்றும் Tencent போன்ற சீன போட்டியாளர்களும் DeepSeek-ஐ மிஞ்சும் திறன் கொண்ட மாதிரிகளை வெளியிட்டுள்ளதாக தெரிவிக்கின்றனர்.
R1-0528 மேம்படுத்தல், Hugging Face தளத்தில் MIT உரிமத்தின் கீழ் கிடைக்கிறது; இது வணிக பயன்பாடு மற்றும் மாற்றங்களை அனுமதிக்கிறது. தொழில்நுட்ப வல்லுநர்கள், DeepSeek விரைவில் அதன் விரிவான R2 மாதிரியை வெளியிடும் என எதிர்பார்க்கின்றனர்; இது ஏஐ துறையில் மேலும் பெரிய மாற்றங்களை ஏற்படுத்தக்கூடும்.