DeepSeek, sebuah startup kecerdasan buatan dari China, telah menaik taraf model penaakulan sumber terbuka mereka secara signifikan dengan pelancaran R1-0528, menjadikan prestasinya hampir setaraf dengan peneraju industri seperti o3 dari OpenAI dan Gemini 2.5 Pro dari Google.
Naik taraf ini mewakili kemajuan besar dalam keupayaan penaakulan DeepSeek melalui peningkatan sumber pengkomputeran dan pengoptimuman algoritma. Dalam ujian penanda aras, model ini menunjukkan peningkatan ketara dalam penaakulan matematik, dengan ketepatan dalam ujian matematik AIME 2025 meningkat daripada 70% kepada 87.5%. Peningkatan ini berpunca daripada kedalaman penaakulan yang lebih baik, di mana model kini menggunakan purata 23,000 token bagi setiap soalan berbanding 12,000 sebelum ini.
Selain penambahbaikan matematik, R1-0528 menawarkan beberapa ciri baharu yang lebih mesra pembangun. Model ini kini menyokong arahan sistem (system prompts), pemanggilan fungsi (function calling), dan output JSON, memudahkan integrasi ke dalam aplikasi. Ia juga menunjukkan kadar halusinasi yang lebih rendah—dilaporkan turun sebanyak 45-50% dalam tugasan penulisan semula dan penringkasan—serta sokongan lebih baik untuk 'vibe coding', di mana pembangun menggunakan bahasa semula jadi untuk menjana kod.
Dalam perkembangan penting untuk pengguna dengan sumber terhad, DeepSeek turut memperkenalkan versi terdistilasi yang dinamakan DeepSeek-R1-0528-Qwen3-8B. Model kecil ini, yang dihasilkan dengan melaras halus model Qwen3 8B dari Alibaba menggunakan corak penaakulan daripada R1-0528 penuh, boleh dijalankan pada satu GPU pengguna biasa namun masih mengatasi Gemini 2.5 Flash dari Google dalam beberapa penanda aras matematik dan hampir menyamai model reasoning plus Phi 4 dari Microsoft.
Seperti pendahulunya, R1-0528 tersedia di bawah Lesen MIT yang permisif, membenarkan penggunaan komersial dan penyesuaian. Penyedia awan utama termasuk Amazon Web Services dan Microsoft Azure kini menawarkan model DeepSeek kepada pelanggan mereka, namun mengasingkannya daripada pelayan China untuk memastikan privasi data.
Pelancaran ini mengukuhkan lagi kedudukan DeepSeek dan Meta sebagai peneraju dalam ruang AI sumber terbuka, menawarkan alternatif berkuasa kepada model proprietari daripada OpenAI, Google, Microsoft, dan Anthropic pada kos pengkomputeran yang jauh lebih rendah.