Anthropic enthüllt Claude Opus 4.6: Revolutionäre Agenten-Teams und Millionen-Token-Kontext transformieren die Unternehmens-KI-Landschaft

February 06, 2026
Anthropic, Claude
6 min

Zusammenfassung der Nachrichten

Anthropic stellte am Donnerstag, dem 5. Februar 2026 (PST), Claude Opus 4.6 vor, was einen bedeutenden Fortschritt bei den KI-Fähigkeiten für Unternehmen darstellt. Das neue Flaggschiffmodell verfügt über ein bahnbrechendes Kontextfenster von 1 Million Tokens, eine revolutionäre "Agententeams"-Funktionalität und eine Spitzenleistung bei Benchmarks für Codierung, Finanzanalyse und Wissensarbeit, was es zu einem direkten Konkurrenten von OpenAIs GPT-5.2 macht.

Anthropic startet Claude Opus 4.6: Enterprise AI macht Quantensprung mit Agententeams und Millionen-Token-Kontext

San Francisco, 5. Februar 2026 – Anthropic hat am Donnerstagmorgen (PST) Claude Opus 4.6 veröffentlicht und damit nach Angaben des Unternehmens einen Paradigmenwechsel in der künstlichen Intelligenz für Unternehmen eingeleitet. Die neueste Iteration seines Flaggschiffmodells bietet beispiellose Fähigkeiten bei der autonomen Aufgabenausführung, der erweiterten Schlussfolgerung und kollaborativen KI-Workflows.

Revolutionäres Kontextfenster erweitert KI-Fähigkeiten

Claude Opus 4.6 wird das erste Modell der Opus-Familie von Anthropic sein, das ein Kontextfenster von 1 Million Tokens unterstützt und damit in die Kategorie der Ultra-Langzeit-Kontexte neben den Gemini-Modellen von Google einsteigt. Diese massive Erweiterung ermöglicht es dem Modell, etwa 1.500 Textseiten, 30.000 Codezeilen oder über eine Stunde Videocontent in einer einzigen Eingabeaufforderung zu verarbeiten.

Das Modell zeigte eine außergewöhnliche Leistung beim MRCR v2 Benchmark und erreichte eine Genauigkeit von 76 % bei Aufgaben zur Informationsbeschaffung nach dem "Nadel im Heuhaufen"-Prinzip, verglichen mit nur 18,5 % bei seinem Vorgänger, Claude Sonnet 4.5. Laut Anthropic stellt dies eine qualitative Verschiebung bei der Eliminierung von "Kontextverfall" dar – der Verschlechterung der Modellleistung über längere Konversationen hinweg.

Agententeams: Parallele Verarbeitung für komplexe Workflows

Die Einführung von "Agententeams" markiert eine grundlegende architektonische Änderung in der Art und Weise, wie Claude komplexe Aufgaben angeht. Anstatt dass ein einzelner Agent Aufgaben sequenziell ausführt, kann Opus 4.6 nun mehrere spezialisierte Agenten parallel einsetzen, die jeweils unterschiedliche Komponenten bearbeiten und sich direkt miteinander koordinieren.

Scott White, Leiter des Produktmanagements für Unternehmen bei Anthropic, verglich die Funktionalität mit der Leitung eines talentierten menschlichen Teams. "Man kann die Arbeit auf mehrere Agenten aufteilen – jeder ist für seinen Teil verantwortlich und koordiniert sich direkt mit den anderen", erklärte White in einem Interview mit TechCrunch. Diese Funktion ist derzeit als Forschungs-Preview für API-Benutzer und Abonnementkunden verfügbar.

Benchmark-Dominanz in professionellen Domänen

Claude Opus 4.6 stellte neue Leistungsrekorde in mehreren branchenüblichen Bewertungen auf:

Exzellenz in der Codierung: Das Modell erzielte 65,4 % auf Terminal-Bench 2.0, die höchste jemals erreichte Punktzahl bei dieser agentenbasierten Codierungsbewertung. Es führt auch die Konkurrenz im OSWorld-Benchmark für agentenbasierten Computereinsatz an und erzielt 72,7 % im Vergleich zu 66,3 % bei Opus 4.5.

Finanz- und Rechtsanalyse: Auf GDPval-AA, das die Leistung bei wirtschaftlich wertvoller Wissensarbeit misst, erreichte Opus 4.6 1.606 Elo-Punkte – und übertraf damit OpenAIs GPT-5.2 um etwa 144 Elo-Punkte und seinen Vorgänger um 190 Punkte. Das Modell erreichte auch 90,2 % auf BigLaw Bench, die höchste Punktzahl aller Claude-Modelle bei juristischen Schlussfolgerungsaufgaben.

Neuartige Problemlösung: Am bemerkenswertesten ist vielleicht, dass Opus 4.6 68,8 % auf dem ARC AGI 2 Benchmark erzielte, der Probleme testet, die für Menschen einfach, für KI-Systeme aber notorisch schwierig sind. Dies stellt eine Verbesserung von 83 % gegenüber der Punktzahl von 37,6 % bei Opus 4.5 dar.

Informationsbeschaffung: Das Modell erzielte die höchste Branchenpunktzahl auf BrowseComp und demonstrierte damit eine überlegene Fähigkeit, schwer zu findende Informationen im Web zu lokalisieren.

Integration in Microsoft Office vertieft

Anthropic kündigte erhebliche Upgrades seiner Integrationen in die Office-Suite an. Claude in Excel kann nun längere, komplexere Aufgaben bewältigen und mehrstufige Transformationen in einem einzigen Vorgang durchführen, ohne dass explizite strukturelle Erklärungen erforderlich sind.

Das Unternehmen stellte außerdem Claude in PowerPoint als Forschungs-Preview vor, das es der KI ermöglicht, bestehende Folienlayouts, Schriftarten und Corporate Templates zu lesen und dann Präsentationen zu erstellen oder zu bearbeiten, die die Markenkonsistenz wahren. Diese Integration ist für Kunden mit Max-, Team- und Enterprise-Plänen in der Beta-Version verfügbar.

Erweiterte API-Steuerungen für Entwicklerflexibilität

Opus 4.6 führt mehrere hochentwickelte Funktionen für API-Entwickler ein:

Adaptives Denken: Das Modell kann autonom entscheiden, wann es tiefere Schlussfolgerungen anstelle von schnellen Antworten einsetzt, und nutzt kontextuelle Hinweise, um die Qualität gegen Latenz und Kosten abzuwägen.

Aufwandsebenen: Entwickler erhalten durch vier Aufwandseinstellungen (niedrig, mittel, hoch und maximal) explizite Kontrolle, die präzise Kompromisse zwischen Intelligenz, Geschwindigkeit und Rechenaufwand ermöglichen.

Kontextkomprimierung: Eine Beta-Funktion, die ältere Gesprächsteile automatisch zusammenfasst, wenn sich die Kontextgrenzen nähern, was extrem lange Interaktionen ohne Leistungseinbußen ermöglicht.

Marktauswirkungen und Unternehmensakzeptanz

Die Veröffentlichung löste erhebliche Marktreaktionen aus. Softwareaktien erlebten Anfang dieser Woche erhebliche Volatilität, nachdem Anthropic branchenspezifische Plugins für sein Cowork-Tool angekündigt hatte. Thomson Reuters fiel am Dienstag um 15,83 %, während LegalZoom fast 20 % verlor, da die Anleger das Potenzial von KI zur Verdrängung spezialisierter Forschungs- und Finanzanalysesoftware abwogen.

Trotz dieser Marktbedenken beschleunigt sich die Akzeptanz durch Unternehmen weiter. Laut einer aktuellen Umfrage von Andreessen Horowitz nutzen 44 % der Unternehmen Anthropic in Produktionsumgebungen – der größte Anteil aller Frontier-KI-Labore seit Mai 2025.

Reale Einsätze zeigen vielversprechende Ergebnisse

Frühe Partner berichteten von erheblichen Produktivitätssteigerungen. Rakuten setzte Opus 4.6 ein, um autonom eine Organisation mit 50 Mitarbeitern zu verwalten und erfolgreich 13 Probleme an einem einzigen Tag zu lösen. Sarah Sachs, Leiterin KI bei Notion, beschrieb das Modell als eine Entwicklung über ein Werkzeug hinaus zu einem "wirklich fähigen Kollaborateur".

Michael Truell, Mitbegründer der KI-Codierungsplattform Cursor, hob die Ausdauer des Modells bei schwierigen Problemen hervor: "Claude Opus 4.6 glänzt bei den schwierigsten Problemen. Es zeigt größere Ausdauer, stärkere Code-Reviews und die Fähigkeit, bei langen Aufgaben durchzuhalten, bei denen andere Modelle dazu neigen, aufzugeben."

Preise und Verfügbarkeit

Anthropic behielt seine wettbewerbsfähige Preisstruktur von 5 US-Dollar pro Million Eingabe-Tokens und 25 US-Dollar pro Million Ausgabe-Tokens bei. Das Modell ist sofort über claude.ai, die Claude API (Modell-ID: claude-opus-4-6) und alle großen Cloud-Plattformen, einschließlich Amazon Web Services, Google Cloud und Microsoft Azure, verfügbar.

Das Modell wird auch in GitHub Copilot integriert und wird schrittweise für Copilot Pro, Pro+, Business und Enterprise-Benutzer ausgerollt.

Verpflichtungen zu Sicherheit und Ausrichtung

Laut Anthropic's umfangreicher Systemkarte weist Opus 4.6 ein insgesamt gleichwertiges oder besseres Sicherheitsprofil als jedes andere Frontier-Modell auf, mit geringen Raten von nicht ausgerichteten Verhaltensweisen bei Sicherheitsbewertungen. Das Unternehmen betont, dass die Sicherheit nicht zugunsten von Leistungssteigerungen geopfert wurde.

Branchenkontext und Wettbewerb

Die Veröffentlichung erfolgt nur 72 Stunden nach der Veröffentlichung von OpenAIs Codex und unterstreicht das beschleunigte Tempo des Wettbewerbs bei der Entwicklung von KI-Tools. White sagte gegenüber Medien, dass Anthropic Claude von "einem Modell, mit dem man sprechen kann, um eine sehr kleine Aufgabe zu erledigen" zu "etwas entwickelt hat, dem man tatsächlich bedeutende reale Arbeit übertragen kann".

Die Veröffentlichung positioniert Anthropic für die von White als "Vibe Working"-Ära bezeichnete Zeit, in der Wissensarbeiter zunehmend substanzielle professionelle Aufgaben an KI-Systeme delegieren, die in der Lage sind, diese autonom mit minimaler Aufsicht auszuführen.

Claude Opus 4.6 stellt das bisher ehrgeizigste Enterprise-KI-Angebot von Anthropic dar und kombiniert technische Fortschritte in der Kontextverarbeitung, der parallelen Agentenkoordination und domänenspezifischem Fachwissen, um die vorherrschenden Annahmen über die Rolle von KI in professionellen Arbeitsabläufen herauszufordern.