GPT-5.4 ist da: OpenAIs vereinheitlichtes KI-Modell kann jetzt Ihren Computer steuern und Ihre Kollegen übertreffen
Eilmeldung: GPT-5.4 geht live für ChatGPT, API und Codex
Am Donnerstag, dem 5. März 2026 (EST), hat OpenAI offiziell GPT-5.4 gestartet, sein bisher leistungsfähigstes und token-effizientestes Spitzenmodell. Die Veröffentlichung erfolgte gleichzeitig für ChatGPT, die Entwickler-API und die Codex-Plattform. OpenAI-CEO Sam Altman deutete den Start auf X (ehemals Twitter) an und schrieb: „Ich glaube, die Leute werden das mögen.“
Das neue Modell ist ab sofort für ChatGPT Plus-, Team- und Pro-Abonnenten verfügbar. Nutzer von Enterprise- und Education-Plänen können den frühen Zugriff über die Admin-Einstellungen aktivieren. Eine leistungsfähigere Variante, GPT-5.4 Pro, ist ebenfalls für Benutzer verfügbar, die maximale Leistung bei hochkomplexen Aufgaben benötigen.
Was ist neu: Ein einheitliches Powerhouse-Modell
GPT-5.4 stellt eine bedeutende Konsolidierung in der Modellpalette von OpenAI dar. Es vereint die branchenführenden Codierungsfähigkeiten von GPT-5.3-Codex mit verbesserter Logik, agentenbasierten Arbeitsabläufen und professionellen Produktivitätstools – alles in einem einzigen Modell.
Zu den wichtigsten Upgrades gehören:
- Native Computer-Nutzungsfähigkeiten: Zum ersten Mal in einem Allzweckmodell kann GPT-5.4 in Codex und der API Computer autonom bedienen, Browser und Desktop-Anwendungen navigieren und komplexe mehrstufige Arbeitsabläufe ausführen.
- 1 Million Token Kontextfenster: GPT-5.4 unterstützt bis zu 1 Million Token Kontext, was es Agenten ermöglicht, Aufgaben über erweiterte Sitzungen hinweg zu planen, auszuführen und zu verifizieren.
- Tool-Suchsystem: Eine neu eingeführte Tool-Suchfunktion ermöglicht es dem Modell, Tool-Definitionen nur bei Bedarf nachzuschlagen, wodurch der Token-Verbrauch reduziert und die Antwortgeschwindigkeit in großen Tool-Ökosystemen verbessert wird.
- Vorausgeplante Logikpläne: In ChatGPT kann die GPT-5.4 Thinking-Version vor der Generierung der vollständigen Antwort einen anfänglichen Plan ihrer Logik präsentieren, sodass Benutzer den Kurs während des Prozesses anpassen können.
- Token-Effizienz: GPT-5.4 ist das bisher token-effizienteste Logikmodell von OpenAI und verbraucht deutlich weniger Token als GPT-5.2 zur Lösung von Problemen – was hilft, den etwas höheren Preis pro Token auszugleichen.
Benchmark-Leistung: Rekordverdächtige Ergebnisse
GPT-5.4 hat die Leistungsgrenzen in mehreren professionellen Bewertungsrahmen gesprengt:
- GDPval: Erreichte 83 % und übertraf damit Büroangestellte in 44 Berufen bei realen Aufgaben.
- APEX-Agents (Mercor): Erreichte die Spitzenplatzierung in diesem Benchmark, der zur Prüfung der KI-Leistung in den Bereichen Recht und Finanzen entwickelt wurde.
- OSWorld-Verified & WebArena Verified: Setzte neue Rekorde in Computer-Nutzungs-Benchmarks, die messen, wie effektiv KI-Systeme mit Softwareumgebungen interagieren.
- Tabellenkalkulationsmodellierung: Erreichte 87,3 % in einem internen Benchmark, der Aufgaben von Investmentbanking-Analysten simuliert, im Vergleich zu 68,4 % für GPT-5.2.
- Präsentationserstellung: Menschliche Bewerter bevorzugten die Präsentationen von GPT-5.4 in 68 % der Fälle gegenüber den Ausgaben von GPT-5.2.
Reduzierte Halluzinationen und verbesserte Genauigkeit
OpenAI legte bei dieser Veröffentlichung großen Wert auf Zuverlässigkeit. Laut dem Unternehmen ist GPT-5.4:
- 33 % weniger wahrscheinlich als GPT-5.2, Fehler bei einzelnen Faktenaussagen zu produzieren.
- 18 % weniger wahrscheinlich als GPT-5.2, dass die Gesamtenantworten sachliche Fehler enthalten.
Eine neue Sicherheitsbewertung, die sich auf Chain-of-Thought (CoT)-Logik konzentrierte, ergab, dass Täuschungen in der GPT-5.4 Thinking-Version weniger wahrscheinlich sind, wobei OpenAI feststellte, dass „das Modell nicht in der Lage ist, seine Logik zu verbergen, und dass die CoT-Überwachung ein wirksames Sicherheitsinstrument bleibt.“
Unternehmens- und Wettbewerbsimplikationen
Der Start signalisiert den intensivierten Vorstoß von OpenAI in den Unternehmensmarkt – einen Bereich, in dem Anthropic historisch eine starke Position innehatte. Die sofort einsatzbereiten agentenbasierten Fähigkeiten von GPT-5.4, kombiniert mit seinen professionellen Dokumenten-, Tabellenkalkulations- und Präsentationsfähigkeiten, stellen es in direkten Wettbewerb mit Claudes von Anthropic für Unternehmensworkflows.
Parallel zu GPT-5.4 stellte OpenAI auch ein ChatGPT für Excel Add-in vor, das KI direkt in die allgegenwärtige Tabellenkalkulationssoftware von Microsoft bringt. Neue App-Integrationen und Skills wurden auch für die Nutzung innerhalb von ChatGPT angekündigt.
Marktanalysten beobachten die Situation genau. Anfang 2026 löste die Veröffentlichung von Anthropic's Cowork-Plugins einen breiten Ausverkauf bei SaaS-Aktien aus. Eine ähnliche Reaktion könnte folgen, da die agentenbasierten Fähigkeiten von GPT-5.4 neue Fragen über die Zukunft von Unternehmenssoftware aufwerfen.
Modellverfügbarkeit und Übergang von Altsystemen
- GPT-5.4 Thinking ist jetzt in ChatGPT für Plus-, Team- und Pro-Benutzer live und ersetzt GPT-5.2 Thinking.
- GPT-5.2 Thinking bleibt drei Monate lang im Bereich Legacy Models verfügbar und wird dann am 5. Juni 2026 (EST) eingestellt.
- API-Preise auf OpenRouter werden mit 2,50 $ pro 1 Mio. Eingabetoken und 20,00 $ pro 1 Mio. Ausgabetoken angegeben, mit einem 1-Mio.-Token-Kontextfenster und maximal 128.000 Ausgabetoken.
- Prompts, die 272.000 Eingabetoken überschreiten, unterliegen für die gesamte Sitzung 2-fachen Eingabe- und 1,5-fachen Ausgabepreisen.
Fazit
GPT-5.4 ist die bisher umfassendste Modellveröffentlichung von OpenAI in jüngster Zeit – sie kombiniert Spitzenlogik, Codierung, autonome Computer-Nutzung und professionelle Produktivität in einem einzigen, effizienteren Paket. Mit rekordverdächtigen Benchmark-Ergebnissen, signifikanten Reduzierungen von Halluzinationen und nativen Unternehmensintegrationen setzt es einen neuen Standard und verschärft das Rennen zwischen den weltweit führenden KI-Laboren.