DeepSeek, startup kecerdasan buatan (AI) dari China yang menggegarkan pasaran saham teknologi pada Januari lalu dengan model R1 yang inovatif, secara senyap telah melancarkan kemas kini penting kepada sistem AI utamanya.
Versi baharu ini, yang dinamakan DeepSeek-R1-0528, telah dikeluarkan pada 28 Mei melalui pengumuman ringkas di kumpulan WeChat syarikat. Walaupun DeepSeek menyifatkannya sebagai "naik taraf percubaan kecil", ujian awal menunjukkan peningkatan ketara dalam pelbagai bidang.
Menurut papan kedudukan LiveCodeBench, model yang dikemas kini kini berada di kedudukan keempat dalam keupayaan pengekodan dengan skor Pass@1 sebanyak 73.1, hanya di belakang model O3 dan O4-Mini daripada OpenAI. Ini merupakan lonjakan besar bagi model sumber terbuka, terutamanya yang dibangunkan dengan sumber yang jauh lebih sedikit berbanding pesaing Baratnya.
Spesifikasi teknikal menunjukkan R1-0528 mengekalkan seni bina Mixture-of-Experts (MoE) seperti pendahulunya, dengan kira-kira 685 bilion parameter secara keseluruhan, walaupun hanya sekitar 37 bilion yang aktif semasa inferens. Model ini kini menyokong tetingkap konteks yang diperluas sehingga 128K token, membolehkannya memproses dokumen dan kod yang jauh lebih besar.
Maklum balas pengguna menonjolkan peningkatan dalam kedalaman penaakulan, kualiti penulisan, dan keupayaan menyelesaikan masalah. Pembangun melaporkan model ini kini boleh terlibat dalam sesi penaakulan lanjutan selama 30-60 minit untuk tugasan kompleks, setanding dengan model keluaran Google. Kemas kini ini juga menangani keanehan sebelum ini dalam penjanaan teks, menghasilkan kandungan yang lebih semula jadi dan berformat baik.
Inovasi berterusan DeepSeek mencabar tanggapan bahawa penskalaan AI memerlukan kuasa pengkomputeran dan pelaburan yang besar. Kejayaan syarikat dengan model sumber terbuka yang kos efektif telah memaksa gergasi teknologi bertindak balas, dengan OpenAI menurunkan harga dan Google memperkenalkan akses pada kadar diskaun. Sementara itu, pesaing dari China seperti Alibaba dan Tencent turut melancarkan model mereka sendiri yang mendakwa mengatasi keupayaan DeepSeek.
Kemas kini R1-0528 boleh didapati di Hugging Face di bawah lesen MIT, membolehkan penggunaan komersial dan pengubahsuaian. Pemerhati industri menjangkakan DeepSeek akan melancarkan model R2 yang lebih komprehensif dalam beberapa bulan akan datang, berpotensi mengubah landskap AI dengan lebih lanjut.