DeepSeek, ein chinesisches Unternehmen für künstliche Intelligenz, hat mit der Veröffentlichung von R1-0528 sein Open-Source-Reasoning-Modell deutlich aufgewertet und dessen Leistung nahezu auf das Niveau von Branchenführern wie OpenAIs o3 und Googles Gemini 2.5 Pro gehoben.
Das Upgrade stellt einen bedeutenden Fortschritt in DeepSeeks Schlussfolgerungsfähigkeiten dar – dank gesteigerter Rechenressourcen und algorithmischer Optimierung. In Benchmark-Tests zeigte das Modell bemerkenswerte Verbesserungen im mathematischen Denken: Die Genauigkeit im AIME-2025-Mathematiktest stieg von 70 % auf 87,5 %. Dieser Fortschritt resultiert aus einer erhöhten Tiefe der Schlussfolgerungen, wobei das Modell nun durchschnittlich 23.000 Token pro Frage verarbeitet – zuvor waren es 12.000.
Über die mathematischen Verbesserungen hinaus bietet R1-0528 mehrere neue Funktionen, die es für Entwickler attraktiver machen. Das Modell unterstützt jetzt System-Prompts, Funktionsaufrufe und die Ausgabe im JSON-Format, was die Integration in Anwendungen erleichtert. Zudem konnte die Halluzinationsrate – insbesondere beim Umschreiben und Zusammenfassen von Texten – um 45–50 % gesenkt werden. Auch beim sogenannten Vibe Coding, bei dem Entwickler mit natürlicher Sprache Code generieren, liefert das Modell bessere Ergebnisse.
Für Nutzer mit begrenzten Ressourcen veröffentlichte DeepSeek außerdem eine destillierte Version namens DeepSeek-R1-0528-Qwen3-8B. Diese wurde durch Feintuning von Alibabas Qwen3-8B-Modell mit den Schlussfolgerungsmustern des vollständigen R1-0528 erstellt. Das kleinere Modell läuft auf einer einzelnen Consumer-GPU, übertrifft in bestimmten Mathematik-Benchmarks sogar Googles Gemini 2.5 Flash und kommt beinahe an Microsofts Phi 4 Reasoning Plus heran.
Wie sein Vorgänger steht R1-0528 unter der freizügigen MIT-Lizenz zur Verfügung, die kommerzielle Nutzung und Anpassung erlaubt. Große Cloud-Anbieter wie Amazon Web Services und Microsoft Azure bieten DeepSeeks Modelle inzwischen ihren Kunden an, isolieren sie jedoch von chinesischen Servern, um den Datenschutz zu gewährleisten.
Mit diesem Release festigt DeepSeek – gemeinsam mit Meta – seine Position als führender Anbieter im Open-Source-KI-Bereich und bietet leistungsfähige Alternativen zu proprietären Modellen von OpenAI, Google, Microsoft und Anthropic – und das bei einem Bruchteil der Rechenkosten.