menu
close

DeepSeek opgraderer R1 AI-model og udfordrer vestlige teknologigiganter

Den kinesiske AI-startup DeepSeek har udgivet en opdatering til sin R1-reasoning-model, som tidligere i år gjorde virksomheden globalt kendt. R1-0528-opdateringen, som virksomheden selv beskriver som 'mindre', viser markante forbedringer inden for kodning, dybde i ræsonnement og skriveopgaver. Den opdaterede model fastholder DeepSeeks omkostningseffektive tilgang til AI-udvikling og matcher samtidig ydeevnen fra modeller fra OpenAI og Google.
DeepSeek opgraderer R1 AI-model og udfordrer vestlige teknologigiganter

DeepSeek, den kinesiske kunstig intelligens-startup, der i januar sendte teknologiske aktier på rutsjetur med sin banebrydende R1-model, har stille og roligt lanceret en markant opdatering af sit flagskibs-AI-system.

Den nye version, kaldet DeepSeek-R1-0528, blev frigivet den 28. maj uden større fanfare via en kort meddelelse i virksomhedens WeChat-gruppe. Selvom DeepSeek selv omtaler det som en "mindre prøveopgradering", viser tidlige tests betydelige forbedringer på flere områder.

Ifølge LiveCodeBench-leaderboardet indtager den opdaterede model nu fjerdepladsen inden for kodning med en Pass@1-score på 73,1, hvilket placerer den lige efter OpenAIs O3- og O4-Mini-modeller. Dette er et stort spring fremad for en open source-model, især én udviklet med væsentligt færre ressourcer end de vestlige konkurrenter.

De tekniske specifikationer viser, at R1-0528 bevarer Mixture-of-Experts (MoE)-arkitekturen fra sin forgænger med cirka 685 milliarder parametre i alt, selvom kun omkring 37 milliarder er aktive under inferens. Modellen understøtter nu et udvidet kontekstvindue på op til 128K tokens, hvilket gør det muligt at behandle langt større dokumenter og kodebaser.

Brugerfeedback fremhæver forbedringer i ræsonnementets dybde, skrivekvalitet og problemløsningsevner. Udviklere rapporterer, at modellen nu kan indgå i længerevarende ræsonnementssessioner på 30-60 minutter ved komplekse opgaver, på niveau med Googles modeller. Opdateringen adresserer også tidligere særheder i tekstgenerering og leverer mere naturligt og bedre formateret indhold.

DeepSeeks fortsatte innovation udfordrer opfattelsen af, at skalering af AI kræver enorme computerressourcer og investeringer. Virksomhedens succes med omkostningseffektive open source-modeller har allerede tvunget teknologigiganter til at reagere, hvor OpenAI har sænket priserne og Google har introduceret billigere adgangsniveauer. Imens har kinesiske konkurrenter som Alibaba og Tencent lanceret egne modeller, der hævder at overgå DeepSeeks evner.

R1-0528-opdateringen er tilgængelig på Hugging Face under en MIT-licens, hvilket muliggør kommerciel brug og tilpasning. Branchen forventer, at DeepSeek i de kommende måneder vil frigive sin mere omfattende R2-model, hvilket potentielt kan forstyrre AI-landskabet yderligere.

Source:

Latest News