menu
close

DeepSeek aktualisiert R1-KI-Modell und fordert westliche Tech-Giganten heraus

Das chinesische KI-Startup DeepSeek hat ein Update für sein R1-Reasoning-Modell veröffentlicht, das das Unternehmen Anfang des Jahres weltweit bekannt gemacht hat. Das R1-0528-Update, das vom Unternehmen als „klein“ bezeichnet wird, zeigt deutliche Verbesserungen bei Programmierfähigkeiten, Argumentationstiefe und Schreibaufgaben. Das aktualisierte Modell bleibt dem kosteneffizienten Ansatz von DeepSeek treu und konkurriert in der Leistung mit Modellen von OpenAI und Google.
DeepSeek aktualisiert R1-KI-Modell und fordert westliche Tech-Giganten heraus

DeepSeek, das chinesische Unternehmen für künstliche Intelligenz, das im Januar mit seinem bahnbrechenden R1-Modell für Turbulenzen an den Technologiebörsen sorgte, hat still und leise ein bedeutendes Update seines Flaggschiff-KI-Systems veröffentlicht.

Die neue Version, DeepSeek-R1-0528 genannt, wurde am 28. Mai ohne großes Aufsehen über eine kurze Ankündigung in der WeChat-Gruppe des Unternehmens veröffentlicht. Obwohl DeepSeek das Update als „kleines Test-Upgrade“ bezeichnet, zeigen erste Tests deutliche Verbesserungen in mehreren Bereichen.

Laut der LiveCodeBench-Bestenliste belegt das aktualisierte Modell nun den vierten Platz bei den Programmierfähigkeiten mit einem Pass@1-Score von 73,1 und liegt damit direkt hinter OpenAIs O3- und O4-Mini-Modellen. Dies stellt einen großen Fortschritt für ein Open-Source-Modell dar, insbesondere eines, das mit deutlich weniger Ressourcen entwickelt wurde als seine westlichen Pendants.

Die technischen Spezifikationen zeigen, dass R1-0528 die Mixture-of-Experts-Architektur (MoE) seines Vorgängers beibehält, mit insgesamt etwa 685 Milliarden Parametern, von denen jedoch nur rund 37 Milliarden während der Inferenz aktiv sind. Das Modell unterstützt nun ein erweitertes Kontextfenster von bis zu 128.000 Tokens, was die Verarbeitung deutlich größerer Dokumente und Codebasen ermöglicht.

Nutzerfeedback hebt Verbesserungen bei Argumentationstiefe, Textqualität und Problemlösungsfähigkeiten hervor. Entwickler berichten, dass das Modell nun in der Lage ist, längere Argumentationsketten von 30 bis 60 Minuten für komplexe Aufgaben zu führen – ähnlich wie die Modelle von Google. Das Update behebt zudem frühere Schwächen bei der Textgenerierung und liefert natürlichere und besser formatierte Inhalte.

Die kontinuierliche Innovationskraft von DeepSeek stellt die Vorstellung infrage, dass für die Skalierung von KI enorme Rechenleistung und Investitionen nötig sind. Der Erfolg des Unternehmens mit kosteneffizienten Open-Source-Modellen hat bereits zu Reaktionen der Tech-Giganten geführt: OpenAI senkte die Preise, Google führte vergünstigte Zugangsstufen ein. Gleichzeitig haben chinesische Konkurrenten wie Alibaba und Tencent eigene Modelle vorgestellt, die angeblich DeepSeeks Fähigkeiten übertreffen.

Das R1-0528-Update ist unter einer MIT-Lizenz auf Hugging Face verfügbar und erlaubt kommerzielle Nutzung sowie Modifikationen. Branchenbeobachter erwarten, dass DeepSeek in den kommenden Monaten sein umfassenderes R2-Modell veröffentlichen wird, was das KI-Ökosystem weiter aufmischen könnte.

Source:

Latest News