DeepSeek, startup AI asal Tiongkok, menegaskan posisinya sebagai penantang serius dominasi AI Barat melalui pembaruan model R1-0528 terbaru yang kini mampu bersaing dengan pemimpin industri seperti OpenAI dan Google.
Model terbaru ini, meski disebut DeepSeek sebagai "peningkatan versi minor", menghadirkan peningkatan signifikan di berbagai kemampuan utama. Dalam penalaran matematika, akurasi model pada tes AIME 2025 yang menantang melonjak dari 70% menjadi 87,5%, menandakan kemampuan pemecahan masalah yang semakin baik. Kemajuan ini didorong oleh kedalaman penalaran model yang kini menggunakan sekitar 23.000 token per permintaan, dibandingkan 12.000 pada versi sebelumnya.
Selain matematika, R1-0528 juga menunjukkan lonjakan kemampuan dalam pemrograman. Pada tantangan pemrograman Codeforces, model ini meraih rating sekitar 1930, naik dari 1530 sebelumnya—peningkatan 400 poin yang mencerminkan kemampuan menghasilkan kode dan pemecahan masalah yang lebih unggul. Performa pada berbagai tes pemrograman komprehensif juga meningkat secara signifikan.
Kemajuan model ini sejalan dengan temuan Laporan Indeks AI 2025 dari Stanford University, yang mencatat penyempitan dramatis kesenjangan performa antara model AI teratas AS dan Tiongkok. Menurut laporan tersebut, perbedaan antara model terdepan Amerika dan Tiongkok pada tolok ukur utama menyusut dari dua digit pada 2023 menjadi hampir setara di awal 2025. Pada Chatbot Arena Leaderboard, kesenjangan antara model teratas AS dan Tiongkok turun dari 9,26% pada Januari 2024 menjadi hanya 1,70% pada Februari 2025.
Para pemimpin industri turut menyoroti perubahan ini. CEO Nvidia, Jensen Huang, pada Mei lalu mengakui bahwa "DeepSeek dan Qwen dari [Alibaba] Tiongkok adalah di antara model AI open-source terbaik yang dirilis secara bebas. Mereka telah mendapatkan perhatian di AS, Eropa, dan wilayah lain."
Pencapaian DeepSeek semakin menonjol mengingat perusahaan ini berawal sebagai startup yang relatif kecil. Model ini tersedia dengan lisensi permisif, baik dalam versi penuh maupun varian "distilled" yang lebih kecil dan dapat dijalankan di perangkat keras yang kurang bertenaga, sehingga membuka akses kemampuan AI canggih bagi pengembang di seluruh dunia.