DeepSeek Forbedrer Alibabas AI Gennem Knowledge Distillation

Den kinesiske AI-startup DeepSeek annoncerede den 29. maj 2025, at virksomheden har forbedret Alibabas Qwen 3 8B Base-model gennem en knowledge distillation-proces ved brug af den opdaterede R1-0528 reasoning-model. Distillation-teknikken overførte DeepSeeks avancerede ræsonnementsevner til Alibabas model, hvilket resulterede i en præstationsforbedring på over 10%. Dette samarbejde understreger DeepSeeks voksende indflydelse i AI-sektoren og virksomhedens engagement i at fremme modeleffektivitet gennem innovative optimeringsmetoder.

Den kinesiske AI-startup DeepSeek fortsætter med at forandre det globale kunstig intelligens-landskab med sin seneste innovation inden for modeloptimering. Den 29. maj afslørede virksomheden, at en variant af den nyligt opdaterede R1-0528 reasoning-model blev brugt til at forbedre Alibabas Qwen 3 8B Base-model gennem en proces kendt som distillation.

Distillation-teknikken, som overfører viden fra en mere avanceret model til en mindre, gjorde det muligt for DeepSeek at overføre ræsonnementprocesserne fra sin R1-0528-model til Alibabas system. Ifølge DeepSeeks meddelelse resulterede denne proces i præstationsforbedringer på over 10% for Qwen 3-modellen.

"Vi mener, at chain-of-thought fra DeepSeek-R1-0528 vil få stor betydning både for akademisk forskning og praktiske anvendelser," udtalte DeepSeek i sin meddelelse. Virksomheden har tidligere udgivet flere distillerede modeller baseret på både Qwen- og Metas Llama-arkitekturer med størrelser fra 1,5B til 70B parametre.

DeepSeeks tilgang til AI-udvikling har tiltrukket betydelig opmærksomhed siden januar, hvor R1-modellen demonstrerede ydeevne på niveau med løsninger fra OpenAI og Google, men til en brøkdel af de beregningsmæssige omkostninger. Virksomhedens succes har udfordret den udbredte opfattelse af, at banebrydende AI kræver enorme computerressourcer og investeringer.

På trods af amerikanske eksportrestriktioner på avancerede AI-chips har DeepSeek optimeret sine modeller til at køre effektivt på mindre kraftfuldt, eksportgodkendt hardware. Denne strategi har tvunget konkurrenter til at genoverveje deres hardwareafhængighed og har påvirket markedsdynamikken i AI-sektoren.

Den seneste R1-0528-opdatering bringer DeepSeeks model tættere på ydeevneniveauet for OpenAIs o3 reasoning-modeller og Googles Gemini 2.5 Pro, med markante forbedringer i ræsonnementsdybde, inferensevner og reduktion af hallucinationer. Virksomhedens fortsatte innovation og open source-tilgang er med til at ændre forventningerne til udvikling og effektiv implementering af AI-modeller.

Source:

DeepSeek Forbedrer Alibabas AI Gennem Knowledge Distillation

Latest News

DeepSeek opgraderer R1 AI-model og udfordrer vestlige teknologigiganter

Google Beam: Revolutionerende 3D-videosamtaler lanceres i 2025

Google lancerer Gemini 2.5 Deep Think på I/O 2025

AMD opkøber Enosemi for at fremme siliciumfotonik til AI

Warren kræver, at Pentagon sikrer konkurrence om AI-kontrakter midt i Musks voksende indflydelse

Caltechs ATMO-robot forvandler sig i luften for problemfri kørsel på jorden

Google lancerer Project Astra og AI-tilstand på I/O 2025

AI-systemer overgår mennesker i tests af følelsesmæssig intelligens

ByteDances Doubao AI tilbyder nu realtids videoassistance

OnePlus dropper Alert Slider til fordel for AI-drevet Plus Key

DeepSeek Forbedrer Alibabas AI Gennem Knowledge Distillation

Related Articles

DeepSeek opgraderer R1 AI-model og udfordrer vestlige teknologigiganter

Google lancerer Gemini 2.5 Deep Think på I/O 2025

AMD opkøber Enosemi for at fremme siliciumfotonik til AI

Warren kræver, at Pentagon sikrer konkurrence om AI-kontrakter midt i Musks voksende indflydelse

Google lancerer Project Astra og AI-tilstand på I/O 2025

Latest News

DeepSeek opgraderer R1 AI-model og udfordrer vestlige teknologigiganter

Google Beam: Revolutionerende 3D-videosamtaler lanceres i 2025

Google lancerer Gemini 2.5 Deep Think på I/O 2025

AMD opkøber Enosemi for at fremme siliciumfotonik til AI

Warren kræver, at Pentagon sikrer konkurrence om AI-kontrakter midt i Musks voksende indflydelse

Caltechs ATMO-robot forvandler sig i luften for problemfri kørsel på jorden

Google lancerer Project Astra og AI-tilstand på I/O 2025

AI-systemer overgår mennesker i tests af følelsesmæssig intelligens

ByteDances Doubao AI tilbyder nu realtids videoassistance

OnePlus dropper Alert Slider til fordel for AI-drevet Plus Key