Anthropic hat am 22. Mai 2025 seine nächste Generation von KI-Modellen vorgestellt und mit Claude Opus 4 sowie Claude Sonnet 4 Systeme präsentiert, die die Grenzen dessen verschieben, was KI ohne menschliches Zutun leisten kann.
Claude Opus 4, das von Anthropic als „das weltweit beste Programmiermodell“ bezeichnet wird, erreichte einen bahnbrechenden Wert von 72,5 % beim SWE-bench – einem anspruchsvollen Software-Engineering-Benchmark, der die Leistung bei realen Programmieraufgaben misst. Während eines Tests bei Rakuten zeigte das Modell eine beeindruckende Ausdauer, indem es fast sieben Stunden lang selbstständig an einem komplexen Open-Source-Projekt arbeitete – ein bedeutender Fortschritt gegenüber den minutenlangen Aufmerksamkeitsspannen früherer KI-Modelle.
Claude Sonnet 4, als effizientere Alternative zu Opus 4 konzipiert, bietet im Vergleich zu seinem Vorgänger Claude Sonnet 3.7 überlegene Programmier- und Denkfähigkeiten. Überraschenderweise erzielte es beim SWE-bench sogar einen noch höheren Wert von 72,7 % und übertraf damit Konkurrenten wie OpenAIs Codex-1 (72,1 %) und Googles Gemini 2.5 Pro (63,2 %).
Beide Modelle verfügen über hybride Denkfähigkeiten, die es ihnen ermöglichen, zwischen nahezu sofortigen Antworten und längeren Denkprozessen für tiefere Analysen zu wechseln. Während ihrer Überlegungen können sie Werkzeuge wie die Websuche nutzen und – sofern Zugriff auf lokale Dateien besteht – wichtige Informationen extrahieren und speichern, um Kontinuität zu gewährleisten und Wissen über die Zeit hinweg aufzubauen.
Die neuen Modelle markieren einen Paradigmenwechsel in der KI-Funktionalität: Sie entwickeln sich von einfachen Chatbots zu autonomen Arbeitsagenten, die in der Lage sind, komplexe, mehrstufige Arbeitsabläufe über Tausende von Schritten hinweg zu bewältigen. Diese Entwicklung ermöglicht es KI, ganztägige Projekte von der Konzeption bis zum Abschluss zu übernehmen und dabei den Kontext durchgehend aufrechtzuerhalten.
Claude Sonnet 4 steht allen Claude-Nutzern zur Verfügung, einschließlich derjenigen im kostenlosen Tarif, während Claude Opus 4 ausschließlich Abonnenten der Pro-, Max-, Team- und Enterprise-Pläne vorbehalten ist. Beide Modelle sind zudem über die Anthropic API, Amazon Bedrock und Google Clouds Vertex AI verfügbar, wobei die Preise im Vergleich zu den Vorgängermodellen unverändert bleiben: Opus 4 kostet 15/75 US-Dollar pro Million Tokens (Input/Output), Sonnet 4 liegt bei 3/15 US-Dollar.