Anthropic hat offiziell seine nächste Generation von KI-Modellen vorgestellt – Claude Opus 4 und Claude Sonnet 4 – und damit einen bedeutenden Fortschritt in den Bereichen künstliche Intelligenz und autonome Arbeitsweise markiert.
Claude Opus 4, das als weltweit führendes Modell für Programmierung positioniert wird, erreicht 72,5 % Leistung im SWE-bench und 43,2 % im Terminal-bench und übertrifft damit die Konkurrenz von OpenAI und Google. Besonders beeindruckend ist die Fähigkeit, nahezu sieben Stunden lang autonom an komplexen Aufgaben zu arbeiten und dabei über Tausende von Schritten hinweg fokussiert zu bleiben – eine Fähigkeit, die bisher kein anderes KI-Modell gezeigt hat.
„Claude Opus 4 bietet wirklich fortschrittliches logisches Denken für Programmieraufgaben. Als unser Team es bei einem komplexen Open-Source-Projekt einsetzte, programmierte es fast sieben Stunden lang völlig autonom – ein riesiger Sprung in den KI-Fähigkeiten, der das Team beeindruckte“, berichtet ein früher Tester von Rakuten.
Claude Sonnet 4, als kostengünstigere Option konzipiert, verbessert seinen Vorgänger Claude Sonnet 3.7 deutlich: mit besseren Programmierfähigkeiten, besserer Befolgung von Anweisungen und einer geringeren Neigung, Abkürzungen zu nehmen – die Wahrscheinlichkeit, bei Aufgaben Schlupflöcher zu nutzen, ist um 65 % reduziert.
Beide Modelle führen mehrere bahnbrechende Funktionen ein. Sie verfügen über eine hybride Architektur, die sowohl nahezu sofortige Antworten als auch verlängerte Denkmodi für tiefere Analysen unterstützt. Ein neues Beta-Feature namens „Erweitertes Denken mit Tool-Nutzung“ ermöglicht es den Modellen, zwischen eigenem logischen Denken und der Nutzung externer Tools wie Websuche zu wechseln, um die Antworten zu verbessern. Bei Zugriff auf lokale Dateien können sie wichtige Informationen extrahieren und speichern und so im Laufe der Zeit das von Anthropic als „stilles Wissen“ bezeichnete Wissen aufbauen.
Zusätzlich zu den Modellen hat Anthropic Claude Code allgemein verfügbar gemacht, mit Integrationen für VS Code, JetBrains und GitHub, was nahtloses Pair Programming ermöglicht. Außerdem wurden vier neue API-Funktionen eingeführt: ein Tool zur Codeausführung, ein MCP-Connector, eine Files-API und Prompt-Caching für bis zu eine Stunde.
Beide Modelle sind ab sofort über die Anthropic API, Amazon Bedrock und Google Clouds Vertex AI verfügbar. Die Preise bleiben wie bei den Vorgängergenerationen: Opus 4 kostet 15/75 US-Dollar pro Million Tokens (Input/Output), Sonnet 4 3/15 US-Dollar. Claude Sonnet 4 steht allen Nutzern offen, auch denen mit kostenlosen Plänen, während Opus 4 auf Pro-, Max-, Team- und Enterprise-Nutzer beschränkt ist.
Mit diesen Fortschritten hat Anthropic die Messlatte für autonome KI-Assistenten deutlich höher gelegt und könnte damit die Art und Weise verändern, wie Entwickler, Forscher und Unternehmen künstliche Intelligenz für komplexe, mehrstufige Arbeitsabläufe nutzen.