menu
close

DeepSeek Tingkatkan Model AI R1, Tantang Raksasa Teknologi Barat

Startup AI asal Tiongkok, DeepSeek, merilis pembaruan untuk model reasoning R1 yang sebelumnya telah mengangkat nama perusahaan ini ke panggung global awal tahun ini. Pembaruan R1-0528, meski disebut 'minor' oleh perusahaan, menunjukkan peningkatan signifikan dalam kemampuan pemrograman, kedalaman penalaran, dan tugas penulisan. Model terbaru ini tetap mempertahankan pendekatan efisien biaya dalam pengembangan AI, namun mampu menyaingi performa model dari OpenAI dan Google.
DeepSeek Tingkatkan Model AI R1, Tantang Raksasa Teknologi Barat

DeepSeek, startup kecerdasan buatan asal Tiongkok yang sempat mengguncang pasar saham teknologi pada Januari lalu lewat model R1 yang inovatif, diam-diam meluncurkan pembaruan signifikan untuk sistem AI andalannya.

Versi terbaru yang dinamai DeepSeek-R1-0528 ini dirilis pada 28 Mei melalui pengumuman singkat di grup WeChat perusahaan. Meski DeepSeek menyebutnya sebagai "pembaruan uji coba minor", pengujian awal menunjukkan peningkatan substansial di berbagai bidang.

Menurut papan peringkat LiveCodeBench, model terbaru ini kini menempati peringkat keempat dalam kemampuan pemrograman dengan skor Pass@1 sebesar 73,1, hanya terpaut di belakang model O3 dan O4-Mini milik OpenAI. Ini merupakan lonjakan besar bagi model open-source, terutama yang dikembangkan dengan sumber daya jauh lebih sedikit dibandingkan pesaing Baratnya.

Spesifikasi teknis menunjukkan R1-0528 tetap menggunakan arsitektur Mixture-of-Experts (MoE) seperti pendahulunya, dengan total sekitar 685 miliar parameter, meski hanya sekitar 37 miliar yang aktif saat inferensi. Model ini kini mendukung context window yang diperluas hingga 128K token, memungkinkan pemrosesan dokumen dan basis kode yang jauh lebih besar.

Umpan balik pengguna menyoroti peningkatan dalam kedalaman penalaran, kualitas penulisan, dan kemampuan pemecahan masalah. Para pengembang melaporkan model ini kini mampu melakukan sesi penalaran lanjutan selama 30-60 menit untuk tugas-tugas kompleks, setara dengan model milik Google. Pembaruan ini juga mengatasi keanehan sebelumnya dalam generasi teks, menghasilkan konten yang lebih alami dan terformat dengan baik.

Inovasi berkelanjutan dari DeepSeek menantang anggapan bahwa pengembangan AI harus selalu mengandalkan daya komputasi dan investasi besar. Keberhasilan perusahaan dengan model open-source yang efisien biaya telah memaksa respons dari para raksasa teknologi, seperti OpenAI yang menurunkan harga dan Google yang memperkenalkan tingkat akses diskon. Sementara itu, pesaing Tiongkok seperti Alibaba dan Tencent juga meluncurkan model mereka sendiri yang mengklaim mampu melampaui kemampuan DeepSeek.

Pembaruan R1-0528 tersedia di Hugging Face dengan lisensi MIT, memungkinkan penggunaan komersial dan modifikasi. Para pengamat industri memperkirakan DeepSeek akan merilis model R2 yang lebih komprehensif dalam beberapa bulan mendatang, yang berpotensi semakin mengubah lanskap AI.

Source:

Latest News