சீனத்தைச் சேர்ந்த ஏஐ ஸ்டார்ட்அப் டீப்-சீக், மாடல் மேம்பாட்டு புதுமைகளில் தொடர்ந்து உலகளாவிய செயற்கை நுண்ணறிவு துறையை கலக்கி வருகிறது. மே 29 அன்று, சமீபத்தில் மேம்படுத்தப்பட்ட R1-0528 காரணமுறை மாடல் பதிப்பை, அலிபாபாவின் Qwen 3 8B Base மாடலை அறிவு சுருக்கம் (Distillation) என்ற முறையில் மேம்படுத்த பயன்படுத்தியதாக நிறுவனம் அறிவித்தது.
அறிவு சுருக்கம் என்பது, ஒரு பெரிய மற்றும் முன்னேற்றமான மாடலில் உள்ள அறிவை சிறிய மாடலுக்கு மாற்றும் தொழில்நுட்பமாகும். இதன் மூலம், டீப்-சீக்கின் R1-0528 மாடலில் உள்ள காரணமுறை செயல்முறைகள் அலிபாபாவின் மாடலுக்கு மாற்றப்பட்டன. டீப்-சீக்கின் அறிவிப்பின்படி, இந்த செயல்முறை Qwen 3 மாடலில் 10% க்கும் அதிகமான செயல்திறன் முன்னேற்றத்தை வழங்கியுள்ளது.
"DeepSeek-R1-0528 இன் சிந்தனை சங்கிலி (Chain-of-thought) கல்வி மற்றும் நடைமுறை பயன்பாடுகளுக்கு மிக முக்கியத்துவம் பெறும் என நாங்கள் நம்புகிறோம்," என டீப்-சீக் தெரிவித்துள்ளது. முன்னதாகவும், Qwen மற்றும் மெட்டாவின் Llama கட்டமைப்புகளை அடிப்படையாகக் கொண்ட, 1.5B முதல் 70B அளவிலான பல அறிவு சுருக்கப்பட்ட மாடல்களை டீப்-சீக் வெளியிட்டுள்ளது.
டீப்-சீக்கின் ஏஐ மேம்பாட்டு அணுகுமுறை, 2024 ஜனவரியில் அதன் R1 மாடல், OpenAI மற்றும் Google வழங்கும் மாடல்களுக்கு நிகராக, குறைந்த கணினி செலவில் செயல்திறன் காட்டியபோது பெரும் கவனத்தை பெற்றது. இந்த வெற்றி, முன்னணி ஏஐக்கு பெரும் கணினி வளங்கள் மற்றும் முதலீடு அவசியம் என்ற நிலைபாட்டை சவாலுக்கு உட்படுத்தியது.
அதிக திறன் கொண்ட ஏஐ சிப்களில் அமெரிக்காவின் ஏற்றுமதி கட்டுப்பாடுகள் இருந்தபோதிலும், டீப்-சீக் தங்கள் மாடல்களை குறைந்த சக்தி, ஏற்றுமதி அனுமதிக்கப்பட்ட ஹார்ட்வேர் மீது திறம்பட இயங்கும் வகையில் மேம்படுத்தியுள்ளது. இந்தத் தந்திரம், போட்டியாளர்களை தங்கள் ஹார்ட்வேர் சார்புகளை மறுபரிசீலனை செய்ய வலியுறுத்தி, ஏஐ சந்தை இயக்கத்தில் மாற்றங்களை ஏற்படுத்தியுள்ளது.
சமீபத்திய R1-0528 மேம்பாடு, டீப்-சீக்கின் மாடலை OpenAI-யின் o3 காரணமுறை மாடல்கள் மற்றும் Google Gemini 2.5 Pro-வின் செயல்திறனுக்கு மேலும் அருகிலாக்கியுள்ளது. இதில், காரணமுறை ஆழம், தீர்மான திறன் மற்றும் தவறான பதில்கள் குறைப்பு ஆகியவற்றில் குறிப்பிடத்தக்க முன்னேற்றம் காணப்படுகிறது. தொடர்ந்து புதுமை மற்றும் திறந்த மூல அணுகுமுறையுடன் செயல்படும் டீப்-சீக், ஏஐ மாடல் மேம்பாடு மற்றும் செயல்திறன் எதிர்பார்ப்புகளை மறுவமைக்கிறது.