சீனத்தைச் சேர்ந்த செயற்கை நுண்ணறிவு ஸ்டார்ட்அப் DeepSeek, அதன் திறந்த மூல காரணி மாதிரியில் R1-0528 எனும் முக்கியமான மேம்பாட்டை அறிமுகப்படுத்தியுள்ளது. இந்த மேம்பாடு, OpenAI-யின் o3 மற்றும் Google-ன் Gemini 2.5 Pro போன்ற தொழில்நுட்ப முன்னணிகளுடன் ஒப்பிடும் அளவுக்கு DeepSeek-ன் செயல்திறனை உயர்த்தியுள்ளது.
இந்த மேம்பாடு, அதிகப்படியான கணிப்பொறி வளங்கள் மற்றும் வழிமுறை மேம்பாடுகள் மூலம் DeepSeek-ன் காரணி திறனில் பெரிய முன்னேற்றத்தை குறிக்கிறது. தரப்படுத்தல் சோதனைகளில், இந்த மாதிரி கணித காரணிப்பில் குறிப்பிடத்தக்க முன்னேற்றத்தை காட்டியுள்ளது; குறிப்பாக, AIME 2025 கணிதத் தேர்வில் துல்லியம் 70% இலிருந்து 87.5% ஆக உயர்ந்துள்ளது. இந்த முன்னேற்றம், மாதிரி ஒவ்வொரு கேள்விக்கும் சராசரியாக 23,000 டோக்கன்களை பயன்படுத்துவதன் மூலம் காரணிப்பின் ஆழம் இரட்டிப்பாக அதிகரித்ததைக் காட்டுகிறது (முந்தைய பதிப்பில் 12,000 டோக்கன்கள்).
கணித மேம்பாடுகளைத் தாண்டி, R1-0528 பல புதிய வசதிகளையும் வழங்குகிறது. இப்போது இந்த மாதிரி system prompts, function calling மற்றும் JSON output ஆகியவற்றை ஆதரிக்கிறது; இதன் மூலம் பயன்பாடுகளில் ஒருங்கிணைப்பது எளிதாகிறது. மேலும், மறுபிரதி எழுதல் மற்றும் சுருக்குதல் பணிகளில் தவறான தகவல் உருவாக்கும் வீதம் 45-50% குறைந்துள்ளதாக தெரிவிக்கப்பட்டுள்ளது. vibe coding-க்கு சிறந்த ஆதரவு வழங்குகிறது, அதாவது இயற்கை மொழியில் இருந்து குறியீடு உருவாக்கும் பணிகளில் மேம்பட்டுள்ளது.
வளங்கள் குறைந்த பயனர்களுக்காக, DeepSeek, DeepSeek-R1-0528-Qwen3-8B எனும் வடிகட்டிய பதிப்பையும் வெளியிட்டுள்ளது. Alibaba-வின் Qwen3 8B மாதிரியை, முழு R1-0528-ன் காரணி வடிவமைப்புகளுடன் fine-tune செய்து உருவாக்கப்பட்ட இந்த சிறிய மாதிரி, ஒரு சாதாரண GPU-வில் இயங்கும் திறனுடன், சில கணித தரப்படுத்தல் சோதனைகளில் Google-ன் Gemini 2.5 Flash-ஐவிட சிறப்பாக செயல்படுகிறது; மேலும், Microsoft-ன் Phi 4 reasoning plus மாதிரியை நெருங்கும் அளவுக்கு காரணி திறனை வழங்குகிறது.
முந்தைய பதிப்பைப் போலவே, R1-0528 MIT உரிமம் கீழ் வெளியிடப்பட்டுள்ளது; இதன் மூலம் வணிக பயன்பாடும் தனிப்பயனாக்கமும் சுதந்திரமாக செய்ய முடியும். Amazon Web Services மற்றும் Microsoft Azure போன்ற முக்கிய கிளவுட் வழங்குநர்கள் DeepSeek-ன் மாதிரிகளை தங்கள் வாடிக்கையாளர்களுக்கு வழங்குகின்றனர்; இருப்பினும், தரவு பாதுகாப்பிற்காக சீன சேவையகங்களில் இருந்து தனிமைப்படுத்தப்பட்டுள்ளன.
இந்த வெளியீடு, திறந்த மூல ஏஐ துறையில் DeepSeek மற்றும் Meta ஆகியவற்றை முன்னணியில் நிலைநிறுத்துகிறது. OpenAI, Google, Microsoft மற்றும் Anthropic போன்ற தனியார் மாதிரிகளுக்கு மாற்றாக குறைந்த கணிப்பொறி செலவில் சக்திவாய்ந்த திறந்த மூல மாதிரிகளை வழங்குகிறது.