DeepSeek, sebuah startup AI dari China, telah menonjol sebagai pencabar utama kepada dominasi AI Barat melalui kemas kini model terbaharunya, R1-0528, yang kini berprestasi hampir setaraf dengan peneraju industri seperti OpenAI dan Google.
Model yang dinaik taraf ini, walaupun digambarkan oleh DeepSeek sebagai "naik taraf versi kecil," memberikan peningkatan ketara dalam keupayaan utama. Dalam penaakulan matematik, ketepatan model dalam ujian AIME 2025 yang mencabar melonjak daripada 70% kepada 87.5%, membuktikan keupayaan penyelesaian masalah yang lebih baik. Kemajuan ini berpunca daripada peningkatan kedalaman penaakulan model, yang kini menggunakan kira-kira 23,000 token bagi setiap pertanyaan berbanding 12,000 dalam versi sebelumnya.
Selain matematik, R1-0528 turut menunjukkan peningkatan besar dalam kemahiran pengaturcaraan. Dalam cabaran pengaturcaraan Codeforces, model ini mencapai penarafan sekitar 1930, naik daripada 1530 sebelum ini—peningkatan 400 mata yang mencerminkan keupayaan penjanaan kod dan penyelesaian masalah yang lebih unggul. Prestasinya dalam ujian pengaturcaraan menyeluruh juga bertambah baik dengan ketara.
Kemajuan model ini selari dengan penemuan Laporan Indeks AI 2025 Universiti Stanford, yang mendokumentasikan penyusutan jurang prestasi secara dramatik antara model AI terkemuka AS dan China. Menurut laporan tersebut, perbezaan antara model teratas Amerika dan China dalam penanda aras utama telah berkurang daripada dua digit pada 2023 kepada hampir setara menjelang awal 2025. Di Leaderboard Chatbot Arena, jurang antara model teratas AS dan China menyusut daripada 9.26% pada Januari 2024 kepada hanya 1.70% pada Februari 2025.
Peneraju industri turut mengambil maklum perubahan ini. Ketua Pegawai Eksekutif Nvidia, Jensen Huang, mengakui pada Mei bahawa "DeepSeek dan Qwen [Alibaba] dari China adalah antara model AI sumber terbuka terbaik yang dikeluarkan secara percuma. Mereka telah mendapat perhatian di AS, Eropah dan seluruh dunia."
Pencapaian DeepSeek amat ketara kerana ia datang daripada syarikat yang bermula sebagai startup kecil. Model ini ditawarkan di bawah lesen yang longgar, dengan versi penuh serta varian "distilled" yang lebih kecil dan boleh dijalankan pada perkakasan kurang berkuasa, sekali gus menjadikan keupayaan AI canggih lebih mudah diakses oleh pembangun di seluruh dunia.