Anthropics Claude-4-Modelle setzen neuen KI-Benchmark für Programmierung

Anthropic hat Claude Opus 4 und Claude Sonnet 4 vorgestellt – die bisher fortschrittlichsten KI-Modelle des Unternehmens, die neue Maßstäbe in den Bereichen Programmierung, logisches Denken und autonome Arbeit setzen. Claude Opus 4 zeigt eine bislang unerreichte Ausdauer und kann nahezu sieben Stunden lang selbstständig an komplexen Aufgaben arbeiten – fast ein kompletter Arbeitstag. Beide Modelle verfügen über hybride Denkfähigkeiten, Websuche-Integration und verbessertes Erinnerungsvermögen und markieren damit einen bedeutenden Entwicklungsschritt von Chatbots hin zu autonomen KI-Agenten.

Anthropic hat am 22. Mai 2025 seine nächste Generation von KI-Modellen vorgestellt und mit Claude Opus 4 sowie Claude Sonnet 4 Systeme präsentiert, die die Grenzen dessen verschieben, was KI ohne menschliches Zutun leisten kann.

Claude Opus 4, das von Anthropic als „das weltweit beste Programmiermodell“ bezeichnet wird, erreichte einen bahnbrechenden Wert von 72,5 % beim SWE-bench – einem anspruchsvollen Software-Engineering-Benchmark, der die Leistung bei realen Programmieraufgaben misst. Während eines Tests bei Rakuten zeigte das Modell eine beeindruckende Ausdauer, indem es fast sieben Stunden lang selbstständig an einem komplexen Open-Source-Projekt arbeitete – ein bedeutender Fortschritt gegenüber den minutenlangen Aufmerksamkeitsspannen früherer KI-Modelle.

Claude Sonnet 4, als effizientere Alternative zu Opus 4 konzipiert, bietet im Vergleich zu seinem Vorgänger Claude Sonnet 3.7 überlegene Programmier- und Denkfähigkeiten. Überraschenderweise erzielte es beim SWE-bench sogar einen noch höheren Wert von 72,7 % und übertraf damit Konkurrenten wie OpenAIs Codex-1 (72,1 %) und Googles Gemini 2.5 Pro (63,2 %).

Beide Modelle verfügen über hybride Denkfähigkeiten, die es ihnen ermöglichen, zwischen nahezu sofortigen Antworten und längeren Denkprozessen für tiefere Analysen zu wechseln. Während ihrer Überlegungen können sie Werkzeuge wie die Websuche nutzen und – sofern Zugriff auf lokale Dateien besteht – wichtige Informationen extrahieren und speichern, um Kontinuität zu gewährleisten und Wissen über die Zeit hinweg aufzubauen.

Die neuen Modelle markieren einen Paradigmenwechsel in der KI-Funktionalität: Sie entwickeln sich von einfachen Chatbots zu autonomen Arbeitsagenten, die in der Lage sind, komplexe, mehrstufige Arbeitsabläufe über Tausende von Schritten hinweg zu bewältigen. Diese Entwicklung ermöglicht es KI, ganztägige Projekte von der Konzeption bis zum Abschluss zu übernehmen und dabei den Kontext durchgehend aufrechtzuerhalten.

Claude Sonnet 4 steht allen Claude-Nutzern zur Verfügung, einschließlich derjenigen im kostenlosen Tarif, während Claude Opus 4 ausschließlich Abonnenten der Pro-, Max-, Team- und Enterprise-Pläne vorbehalten ist. Beide Modelle sind zudem über die Anthropic API, Amazon Bedrock und Google Clouds Vertex AI verfügbar, wobei die Preise im Vergleich zu den Vorgängermodellen unverändert bleiben: Opus 4 kostet 15/75 US-Dollar pro Million Tokens (Input/Output), Sonnet 4 liegt bei 3/15 US-Dollar.

Source:

Anthropics Claude-4-Modelle setzen neuen KI-Benchmark für Programmierung

Latest News

ByteDances Doubao-AI bietet jetzt Echtzeit-Video-Unterstützung

OnePlus ersetzt Alert Slider durch KI-gesteuerte Plus-Taste

Deutsche Technologiekonzerne vereinen sich für EU-unterstützte KI-Gigafabrik

US-Staatsanwälte untersuchten Builder.ai vor Zusammenbruch des 1,5-Milliarden-Dollar-AI-Startups

Norwegens 1,8-Billionen-Dollar-Fonds macht KI für Mitarbeitende zur Pflicht

OpenTools.ai stellt AI News Hub für Technologie-Profis vor

Google erweitert KI-Computersteuerung für Entwickler über Gemini

Google verbessert Gemini-Modelle mit transparenten Gedankenzusammenfassungen

Anthropics Claude-4-Modelle setzen neuen KI-Benchmark für Programmierung

Related Articles

ByteDances Doubao-AI bietet jetzt Echtzeit-Video-Unterstützung

OnePlus ersetzt Alert Slider durch KI-gesteuerte Plus-Taste

Deutsche Technologiekonzerne vereinen sich für EU-unterstützte KI-Gigafabrik

Latest News

ByteDances Doubao-AI bietet jetzt Echtzeit-Video-Unterstützung

OnePlus ersetzt Alert Slider durch KI-gesteuerte Plus-Taste

Deutsche Technologiekonzerne vereinen sich für EU-unterstützte KI-Gigafabrik

US-Staatsanwälte untersuchten Builder.ai vor Zusammenbruch des 1,5-Milliarden-Dollar-AI-Startups

Norwegens 1,8-Billionen-Dollar-Fonds macht KI für Mitarbeitende zur Pflicht

OpenTools.ai stellt AI News Hub für Technologie-Profis vor

Google erweitert KI-Computersteuerung für Entwickler über Gemini

Google verbessert Gemini-Modelle mit transparenten Gedankenzusammenfassungen