menu
close

DeepSeek Iniaangat ang R1 AI Model, Hinahamon ang mga Higanteng Teknolohiya ng Kanluran

Naglabas ang Chinese AI startup na DeepSeek ng update sa kanilang R1 reasoning model na nagdala sa kanila sa pandaigdigang kasikatan ngayong taon. Bagamat tinawag ng kumpanya na 'minor' ang R1-0528 update, makikita ang malalaking pagbuti sa kakayahan sa pag-code, lalim ng pag-aanalisa, at mga gawaing pagsusulat. Nanatili ang abot-kayang approach ng DeepSeek sa pag-develop ng AI habang nakikipagsabayan sa performance ng mga modelo mula sa OpenAI at Google.
DeepSeek Iniaangat ang R1 AI Model, Hinahamon ang mga Higanteng Teknolohiya ng Kanluran

Tahimik na inilunsad ng DeepSeek, ang Chinese artificial intelligence startup na nagpagalaw ng merkado ng teknolohiya noong Enero sa pamamagitan ng kanilang makabagong R1 model, ang isang mahalagang update sa kanilang pangunahing AI system.

Ang bagong bersyon, na tinawag na DeepSeek-R1-0528, ay inilabas noong Mayo 28 sa pamamagitan lamang ng maikling anunsyo sa WeChat group ng kumpanya. Bagamat tinukoy ng DeepSeek na ito ay isang "minor trial upgrade," ipinapakita ng mga unang pagsusuri ang malalaking pagbuti sa iba't ibang larangan.

Ayon sa LiveCodeBench leaderboard, pumapangalawa na ngayon ang updated na modelo sa coding capabilities na may Pass@1 score na 73.1, na kaunti lamang ang pagitan sa mga modelo ng OpenAI na O3 at O4-Mini. Isa itong malaking hakbang para sa isang open-source na modelo, lalo na kung ikukumpara sa mas malalaking resources ng mga katapat mula sa Kanluran.

Ayon sa technical specifications, nananatili ang Mixture-of-Experts (MoE) architecture ng R1-0528 na may humigit-kumulang 685 bilyong parameters, ngunit 37 bilyon lamang ang aktibo tuwing inference. Suportado na rin ngayon ng modelo ang mas malawak na context window na hanggang 128K tokens, kaya nitong magproseso ng mas malalaking dokumento at codebase.

Ipinapakita ng feedback ng mga user ang pagbuti ng lalim ng pag-aanalisa, kalidad ng pagsusulat, at kakayahan sa paglutas ng problema. Ibinahagi ng mga developer na kaya na ngayong makipag-ugnayan ng modelo sa mas mahahabang reasoning sessions na tumatagal ng 30-60 minuto para sa mga komplikadong gawain, katulad ng mga modelo ng Google. Tinugunan din ng update ang mga dating isyu sa text generation, kaya mas natural at maayos na ang nilalabas na content.

Patuloy na hinahamon ng inobasyon ng DeepSeek ang paniniwalang kailangan ng napakalaking computing power at investment para mag-scale ng AI. Ang tagumpay ng kumpanya sa abot-kayang open-source na mga modelo ay nag-udyok na ng mga tugon mula sa mga higanteng teknolohiya, gaya ng pagbaba ng presyo ng OpenAI at paglabas ng Google ng mas murang access tiers. Samantala, ang mga kakompetensyang Tsino gaya ng Alibaba at Tencent ay naglabas na rin ng kani-kanilang mga modelo na sinasabing mas mahusay pa sa DeepSeek.

Ang R1-0528 update ay available na sa Hugging Face sa ilalim ng MIT license, na nagpapahintulot ng komersyal na paggamit at pagbabago. Inaasahan ng mga tagamasid sa industriya na ilalabas ng DeepSeek ang mas komprehensibong R2 model sa mga susunod na buwan, na posibleng magdulot ng mas malaking pagbabago sa AI landscape.

Source:

Latest News