menu
close

Chinese AI Firm DeepSeek, Lumalapit sa Antas ng mga Higanteng Kanluranin

Inilabas ng Chinese AI startup na DeepSeek ang pinahusay nitong modelong R1-0528, na nagpapakita ng kakayahang makipagsabayan sa mga nangungunang produkto ng OpenAI at Google. Malaki ang inangat ng modelo sa larangan ng matematikal na pangangatwiran, programming, at lohika, kung saan tumaas ang accuracy mula 70% patungong 87.5% sa AIME 2025 math test. Ipinapakita ng pag-unlad na ito ang natuklasan ng Stanford University AI Index 2025 na malaki ang nabawas sa agwat ng performance ng mga pangunahing AI model ng US at Tsina nitong nakaraang taon.
Chinese AI Firm DeepSeek, Lumalapit sa Antas ng mga Higanteng Kanluranin

Itinataguyod ng DeepSeek, isang Chinese AI startup, ang sarili bilang isang matinding kakumpitensya sa dominasyon ng Kanluran sa AI sa pamamagitan ng pinakabagong update ng modelong R1-0528, na ngayon ay nagpapakita ng performance na halos kaantabay ng mga lider sa industriya gaya ng OpenAI at Google.

Bagama't inilarawan ng DeepSeek ang update bilang isang "minor version upgrade," naghatid ito ng malalaking pagbuti sa mahahalagang kakayahan. Sa matematikal na pangangatwiran, umangat ang accuracy ng modelo sa mahirap na AIME 2025 test mula 70% patungong 87.5%, na nagpapakita ng mas pinahusay na kakayahan sa paglutas ng problema. Ang pag-unlad na ito ay nagmula sa mas malalim na reasoning ng modelo, na ngayon ay gumagamit ng humigit-kumulang 23,000 token bawat query kumpara sa 12,000 sa nakaraang bersyon.

Bukod sa matematika, nagpakita rin ng malaking pag-angat ang R1-0528 sa larangan ng programming. Sa Codeforces programming challenge, nakamit ng modelo ang rating na humigit-kumulang 1930, mula sa dating 1530—isang pagtaas ng 400 puntos na sumasalamin sa mas mahusay na code generation at problem-solving. Malaki rin ang inangat ng performance nito sa mga komprehensibong coding test.

Ang progreso ng modelong ito ay tumutugma sa mga natuklasan ng Stanford University's 2025 AI Index Report, na nagdokumento ng malaking pagbawas sa agwat ng performance ng mga nangungunang AI model ng US at Tsina. Ayon sa ulat, ang pagkakaiba ng mga nangungunang modelo ng Amerika at Tsina sa mahahalagang benchmark ay lumiit mula double digits noong 2023 patungo sa halos pagkakapantay sa unang bahagi ng 2025. Sa Chatbot Arena Leaderboard, bumaba ang agwat mula 9.26% noong Enero 2024 patungong 1.70% na lamang pagsapit ng Pebrero 2025.

Napansin ng mga lider ng industriya ang pagbabagong ito. Noong Mayo, kinilala ni Nvidia CEO Jensen Huang na "Ang DeepSeek at [Alibaba's] Qwen mula Tsina ay kabilang sa pinakamahusay na open-source AI models na malayang inilabas. Sila ay tinatangkilik na sa U.S., Europa, at iba pang panig ng mundo."

Lalo pang kapansin-pansin ang tagumpay ng DeepSeek dahil ito ay nagmula sa isang maliit na startup. Ang modelo ay available sa ilalim ng isang maluwag na lisensya, na may parehong full version at mas maliit na "distilled" variant na maaaring patakbuhin sa hindi gaanong makapangyarihang hardware, kaya mas napapalapit ang advanced na kakayahan ng AI sa mga developer sa buong mundo.

Source:

Latest News