menu
close

DeepSeek uppgraderar R1 AI-modellen och utmanar västerländska teknikjättar

Det kinesiska AI-startupbolaget DeepSeek har släppt en uppdatering av sin R1-resoneringsmodell, som tidigare i år bidrog till företagets globala genomslag. Uppdateringen, kallad R1-0528, beskrivs som 'mindre' av företaget men visar på tydliga förbättringar inom kodningsförmåga, resonemangs­djup och skrivuppgifter. Den uppdaterade modellen behåller DeepSeeks kostnadseffektiva strategi för AI-utveckling och matchar samtidigt prestandan hos modeller från OpenAI och Google.
DeepSeek uppgraderar R1 AI-modellen och utmanar västerländska teknikjättar

DeepSeek, det kinesiska artificiella intelligensbolaget som fick teknikaktier att falla i januari med sin banbrytande R1-modell, har i det tysta lanserat en betydande uppdatering av sitt flaggskeppssystem för AI.

Den nya versionen, DeepSeek-R1-0528, släpptes den 28 maj utan större uppståndelse genom ett kort meddelande i företagets WeChat-grupp. Trots att DeepSeek beskriver uppgraderingen som en 'mindre testuppdatering' visar tidiga tester på avsevärda förbättringar inom flera områden.

Enligt LiveCodeBench-topplistan rankas den uppdaterade modellen nu som nummer fyra inom kodningsförmåga, med ett Pass@1-resultat på 73,1. Det placerar den strax bakom OpenAIs O3- och O4-Mini-modeller. Detta är ett stort steg framåt för en öppen källkodsmodell, särskilt med tanke på att den utvecklats med betydligt mindre resurser än sina västerländska motsvarigheter.

Tekniska specifikationer visar att R1-0528 behåller föregångarens Mixture-of-Experts (MoE)-arkitektur, med totalt cirka 685 miljarder parametrar, även om endast omkring 37 miljarder är aktiva vid inferens. Modellen har nu ett utökat kontextfönster på upp till 128 000 token, vilket gör det möjligt att bearbeta betydligt större dokument och kodbaser.

Användarfeedback lyfter fram förbättringar i resonemangs­djup, skrivkvalitet och problemlösningsförmåga. Utvecklare rapporterar att modellen nu kan genomföra längre resonemangssessioner på 30–60 minuter för komplexa uppgifter, likt Googles modeller. Uppdateringen åtgärdar även tidigare egenheter i textgenereringen och ger mer naturligt och bättre formaterat innehåll.

DeepSeeks fortsatta innovation utmanar föreställningen om att AI-utveckling kräver enorm datorkraft och investeringar. Företagets framgång med kostnadseffektiva, öppna modeller har redan tvingat teknikjättarna till motdrag, där OpenAI sänkt priserna och Google infört rabatterade åtkomstnivåer. Samtidigt har kinesiska konkurrenter som Alibaba och Tencent lanserat egna modeller som påstår sig överträffa DeepSeeks kapacitet.

Uppdateringen R1-0528 finns tillgänglig på Hugging Face under MIT-licens, vilket möjliggör kommersiell användning och modifieringar. Branschanalytiker förväntar sig att DeepSeek kommer att släppa sin mer omfattande R2-modell inom de närmaste månaderna, vilket potentiellt kan omforma AI-landskapet ytterligare.

Source:

Latest News