menu
close

DeepSeek தனது R1 ஏஐ மாதிரியை மேம்படுத்தி, மேற்கு தொழில்நுட்ப நிறுவனங்களை சவால் செய்கிறது

சீன ஏஐ ஸ்டார்ட்அப் DeepSeek, இந்த ஆண்டு உலகளாவிய கவனத்தை பெற்ற R1 காரணமுறை மாதிரிக்கு புதிய மேம்படுத்தலை வெளியிட்டுள்ளது. R1-0528 எனப்படும் இந்த புதுப்பிப்பு, நிறுவனம் 'சிறியதாக' விவரித்தாலும், குறியீடு எழுதும் திறன், ஆழமான காரணமுறை மற்றும் எழுத்துத் திறன்களில் குறிப்பிடத்தக்க முன்னேற்றங்களை காட்டுகிறது. மேம்படுத்தப்பட்ட மாதிரி, DeepSeek-ன் செலவு குறைந்த ஏஐ வளர்ச்சி அணுகுமுறையை தொடர்கிறது; அதேசமயம் OpenAI மற்றும் Google போன்ற மேற்கு நிறுவனங்களின் செயல்திறனை சவால் செய்கிறது.
DeepSeek தனது R1 ஏஐ மாதிரியை மேம்படுத்தி, மேற்கு தொழில்நுட்ப நிறுவனங்களை சவால் செய்கிறது

சீனத்தைச் சேர்ந்த செயற்கை நுண்ணறிவு ஸ்டார்ட்அப் DeepSeek, ஜனவரியில் தனது புரட்சி கொண்ட R1 மாதிரியுடன் தொழில்நுட்ப பங்குகளை வீழ்த்திய நிறுவனம், அதன் முக்கியமான ஏஐ அமைப்பிற்கு ஒரு முக்கியமான மேம்படுத்தலை அமைதியாக அறிமுகப்படுத்தியுள்ளது.

DeepSeek-R1-0528 என அழைக்கப்படும் இந்த புதிய பதிப்பு, மே 28-ஆம் தேதி நிறுவத்தின் WeChat குழுவில் ஒரு சுருக்கமான அறிவிப்புடன் வெளியிடப்பட்டது. DeepSeek இதை 'சிறிய சோதனை மேம்படுத்தல்' என விவரித்தாலும், ஆரம்ப சோதனைகள் பல்வேறு துறைகளில் குறிப்பிடத்தக்க முன்னேற்றங்களை வெளிப்படுத்துகின்றன.

LiveCodeBench தலைப்பட்டையில், மேம்படுத்தப்பட்ட மாதிரி தற்போது குறியீடு எழுதும் திறனில் நான்காவது இடத்தில் உள்ளது; Pass@1 மதிப்பெண் 73.1 ஆகும். இது OpenAI-யின் O3 மற்றும் O4-Mini மாதிரிகளுக்கு அடுத்ததாகும். மேற்கு நிறுவனங்களைவிட குறைந்த வளங்களுடன் உருவாக்கப்பட்ட ஓப்பன்-சோர்ஸ் மாதிரிக்காக இது ஒரு பெரிய முன்னேற்றமாகும்.

தொழில்நுட்ப விவரங்களில், R1-0528 அதன் முன்னோடியான MoE (Mixture-of-Experts) கட்டமைப்பைத் தொடர்கிறது; மொத்தம் சுமார் 685 பில்லியன் அளவிலான அளவுருக்கள் உள்ளன, ஆனால் முடிவெடுக்கும் போது சுமார் 37 பில்லியன் மட்டுமே செயல்படுகின்றன. மாதிரி தற்போது 128K டோக்கன்கள் வரை விரிவாக்கப்பட்ட சூழல் சாளரத்தை (context window) ஆதரிக்கிறது; இது மிகப்பெரிய ஆவணங்கள் மற்றும் குறியீடுகளை செயலாக்க அனுமதிக்கிறது.

பயனர் கருத்துக்கள் காரணமுறை ஆழம், எழுத்துத் தரம் மற்றும் சிக்கலான பிரச்சனைகளைத் தீர்க்கும் திறனில் முன்னேற்றங்களை வெளிப்படுத்துகின்றன. டெவலப்பர்கள், மாதிரி தற்போது Google மாதிரிகளுக்கு ஒப்பாக 30-60 நிமிடங்கள் நீடிக்கும் விரிவான காரணமுறை அமர்வுகளை மேற்கொள்ள முடிகிறது என தெரிவிக்கின்றனர். மேம்படுத்தல், முன்பு இருந்த உரை உருவாக்க குறைபாடுகளை சரிசெய்து, மேலும் இயற்கையான மற்றும் நன்கு வடிவமைக்கப்பட்ட உள்ளடக்கத்தை வழங்குகிறது.

DeepSeek-ன் தொடர்ச்சியான புதுமை, ஏஐ வளர்ச்சி பெரும் கணினி சக்தி மற்றும் முதலீடு தேவை என்பதைக் கேள்விக்குறியாக்குகிறது. செலவு குறைந்த, ஓப்பன்-சோர்ஸ் மாதிரிகளுடன் DeepSeek பெற்ற வெற்றி, OpenAI விலை குறைத்தல் மற்றும் Google தள்ளுபடி கட்டணங்களை அறிமுகப்படுத்துதல் போன்ற பதில்களை ஏற்க வைத்துள்ளது. இதேசமயம், Alibaba மற்றும் Tencent போன்ற சீன போட்டியாளர்களும் DeepSeek-ஐ மிஞ்சும் திறன் கொண்ட மாதிரிகளை வெளியிட்டுள்ளதாக தெரிவிக்கின்றனர்.

R1-0528 மேம்படுத்தல், Hugging Face தளத்தில் MIT உரிமத்தின் கீழ் கிடைக்கிறது; இது வணிக பயன்பாடு மற்றும் மாற்றங்களை அனுமதிக்கிறது. தொழில்நுட்ப வல்லுநர்கள், DeepSeek விரைவில் அதன் விரிவான R2 மாதிரியை வெளியிடும் என எதிர்பார்க்கின்றனர்; இது ஏஐ துறையில் மேலும் பெரிய மாற்றங்களை ஏற்படுத்தக்கூடும்.

Source:

Latest News