Anthropic veröffentlicht Claude Opus 4.5: Erstes KI-Modell, das die 80%-Programmier-Benchmark durchbricht, Leistung übertrifft menschliche Fähigkeiten, Preis um 67% gesenkt

November 25, 2025
Anthropic
5 min

Nachrichtenübersicht

Anthropic hat am 24. November 2025 offiziell sein neuestes Flaggschiff-KI-Modell Claude Opus 4.5 veröffentlicht. Dieses Modell erzielt bahnbrechende Verbesserungen in den Bereichen Softwareentwicklung, Schlussfolgerungsfähigkeit und der Bearbeitung komplexer mehrstufiger Aufgaben. Es ist ab sofort über die Claude-Anwendung, die API und die drei großen Cloud-Plattformen für Nutzer zugänglich. Dies ist nach der Einführung von Sonnet 4.5 im September und Haiku 4.5 im Oktober die dritte große Modellveröffentlichung von Anthropic innerhalb von zwei Monaten und signalisiert, dass der Wettbewerb in der KI-Branche eine hitzige Phase erreicht hat.


Die bemerkenswerteste Änderung bei Claude Opus 4.5 ist eine deutliche Preissenkung. Der Preis beträgt 5 US-Dollar pro Million Eingabe-Tokens und 25 US-Dollar pro Million Ausgabe-Tokens. Dies entspricht einer Reduzierung von 67 % gegenüber dem Vorgängermodell Opus 4.1 (15/75 US-Dollar) und macht erstklassige KI-Fähigkeiten zugänglicher. Diese Preisstrategie macht es im Wettbewerb mit OpenAIs GPT-5.1 (1,25/10 US-Dollar) und Googles Gemini 3 Pro (2/12 US-Dollar) attraktiver.

In Bezug auf die Leistung erreichte Claude Opus 4.5 im SWE-bench Verified Benchmark eine Genauigkeitsrate von 80,9 %. Damit ist es das erste Modell, das die 80%-Marke überschreitet, und übertrifft OpenAIs GPT-5.1-Codex-Max (77,9 %) und Googles Gemini 3 Pro (76,2 %). Dieser Benchmark testet speziell die Leistung von KI-Systemen bei realen Software-Engineering-Aufgaben, und das Ergebnis von Claude Opus 4.5 setzt einen neuen Industriestandard.

Noch beeindruckender ist, dass Anthropic Opus 4.5 mit dem tatsächlichen technischen Test geprüft hat, der bei der Einstellung von Performance-Ingenieuren im Unternehmen verwendet wird. Das Modell übertraf dabei die höchste Punktzahl, die jemals von menschlichen Bewerbern erreicht wurde. Dieses Ergebnis hat in der Branche eine intensive Diskussion darüber ausgelöst, wie KI-Technologie Angestelltenberufe neu gestalten könnte.

Technisch gesehen ist Claude Opus 4.5 mit einem Kontextfenster von 200.000 Tokens und einer Ausgabebeschränkung von 64.000 Tokens ausgestattet. Der Wissensstichtag wurde auf März 2025 aktualisiert. Das Modell weist erhebliche Verbesserungen im Speichermanagement auf, insbesondere optimiert für Operationen mit langem Kontext, und kann wichtige Details intelligenter speichern. Diese Verbesserungen machen es besonders geeignet als Hauptagent, um die Zusammenarbeit mehrerer Haiku-Subagenten zu steuern.

In der Praxis berichten frühe Tester, dass Opus 4.5 Aufgaben bewältigen kann, die Sonnet 4.5 kaum lösen konnte. Es findet Lösungen für komplexe Multisystemprobleme, ohne dass eine detaillierte Anleitung erforderlich ist. Der bekannte Entwickler Simon Willison nutzte Claude Code für eine umfassende Refaktorierung von sqlite-utils in einem Wochenendtest. Er schloss innerhalb von zwei Tagen 20 Commits ab, die 39 Dateien, 2022 neue Codezeilen und 1173 gelöschte Zeilen umfassten.

Bezüglich der Sicherheit erklärt Anthropic, dass Opus 4.5 das bisher robusteste Modell in Bezug auf Alignment ist. Es hat erhebliche Fortschritte bei der Abwehr von Prompt-Injection-Angriffen gemacht und ist schwieriger zu täuschen als jedes andere führende Modell in der Branche. Dies ist besonders wichtig für Unternehmenskunden, die Claude für kritische Aufgaben einsetzen.

Zeitgleich mit der Modellveröffentlichung hat Anthropic eine Reihe von Produktaktualisierungen eingeführt: Die Claude for Chrome-Erweiterung ist jetzt für alle Max-Benutzer verfügbar. Claude for Excel wurde offiziell für Max-, Team- und Enterprise-Benutzer eingeführt und unterstützt Pivot-Tabellen, Diagramme und Dateiuploads. Die Desktop-Anwendung Claude Code wurde ebenfalls offiziell veröffentlicht und unterstützt Windows-, macOS- und Windows (Arm 64)-Plattformen. Sie ermöglicht Entwicklern, mehrere Kodierungs- oder Forschungssitzungen parallel auszuführen.

Bemerkenswert ist, dass Anthropic die Nutzungslimits angepasst hat. Benutzer mit Zugriff auf Opus 4.5 können das Modell nun auf einem ähnlichen Niveau wie zuvor die Sonnet-Stufe nutzen. Dies bedeutet, dass Benutzer sich keine Sorgen machen müssen, im täglichen Gebrauch übermäßig eingeschränkt zu sein.

Im Hinblick auf die Marktwettbewerbslandschaft haben Microsoft und Nvidia letzte Woche Investitionen in Milliardenhöhe in Anthropic angekündigt. Dies erhöhte die Bewertung des KI-Labors auf rund 350 Milliarden US-Dollar. Anthropic erzielte im ersten Quartal 2025 annualisierte Einnahmen von 2 Milliarden US-Dollar, eine Verdoppelung gegenüber den 1 Milliarde US-Dollar im Vorquartal. Die Anzahl der Kunden mit jährlichen Ausgaben von über 100.000 US-Dollar stieg im Jahresvergleich um das Achtfache.

Die Veröffentlichung von Claude Opus 4.5 fällt in eine Zeit intensiven Wettbewerbs in der KI-Branche. OpenAI veröffentlichte GPT-5.1 am 12. November, Google stellte Gemini 3 am 18. November vor, und nun reagiert Anthropic mit Opus 4.5 auf den Markt. Scott White, Produktleiter bei Anthropic, erklärte: "Die Anzahl der Produkte, die wir auf den Markt bringen, und der daraus resultierende Feedback-Loop begeistern mich ungemein."

Bezüglich der Zielgruppe wies White darauf hin, dass die idealen Nutzer von Opus 4.5 professionelle Softwareentwickler und Wissensarbeiter sind. Dazu gehören Finanzanalysten, Berater und Buchhalter sowie diejenigen, die Kreativität fördern und Neues schaffen wollen.

Entwickler können Claude Opus 4.5 über die API mit dem Modellstring "claude-opus-4-5-20251101" aufrufen. Gleichzeitig profitieren sie von 90 % Kosteneinsparungen durch Prompt-Caching und 50 % Kosteneinsparungen durch Batch-Verarbeitung. Das Modell ist bereits auf Plattformen wie Amazon Bedrock, Google Clouds Vertex AI und Microsoft Foundry verfügbar.

Anthropic betont, dass Opus 4.5 ein fortschrittliches Modell ist, das für "beispiellose Anwendungsfälle" entwickelt wurde. Es eignet sich besonders für professionelles Software-Engineering, komplexe Agenten-Workflows und risikoreiche Unternehmensaufgaben. Seine hybride Schlussfolgerungsfähigkeit ermöglicht einen flexiblen Wechsel zwischen sofortiger Reaktion und erweitertem Nachdenken. API-Benutzer können den gesamten Aufwand, den das Modell in eine Antwort investiert, feinabstimmen, um ein Gleichgewicht zwischen Leistung, Latenz und Kosten zu erzielen.

Das Feedback von Industriepartnern bestätigt ebenfalls die Leistungsfähigkeit von Opus 4.5. Lovable berichtet, dass das Modell in seinem Chat-Modus modernste Schlussfolgerungsfähigkeiten bietet, tiefgreifende Schlussfolgerungen die Planung verändern und eine exzellente Planung zu einer besseren Codegenerierung führt. Warp meldet eine Leistungssteigerung von 15 % bei Opus 4.5 gegenüber Sonnet 4.5 im Terminal Bench-Test, was besonders im Planning Mode deutlich wird. Nico Christie, Mitbegründer von Fundamental Research Labs, einem Finanzmodellierungsunternehmen, erklärte, dass in internen Bewertungen die Genauigkeit um 20 % und die Effizienz um 15 % gestiegen sei, und ehemals unerreichbar scheinende komplexe Aufgaben nun realisierbar seien.

Die Veröffentlichung von Claude Opus 4.5 stellt nicht nur einen neuen Durchbruch in der technologischen Leistungsfähigkeit von Anthropic dar. Sie deutet auch darauf hin, dass KI-Assistenten sich von einfachen Frage-Antwort-Tools zu intelligenten Systemen entwickeln, die komplexe professionelle Aufgaben eigenständig erledigen können. Mit dem drastischen Preisverfall und den erheblichen Leistungssteigerungen wird die kommerzielle Anwendung der KI-Technologie voraussichtlich weiter beschleunigt und tiefgreifende Veränderungen in allen Branchen bewirken.