GPT-5.4 ist da: OpenAIs vereinheitlichtes KI-Modell kann jetzt Ihren Computer steuern und Ihre Kollegen übertreffen

March 06, 2026
GPT-5.4
4 min

Eilmeldung: GPT-5.4 geht live für ChatGPT, API und Codex

Am Donnerstag, dem 5. März 2026 (EST), hat OpenAI offiziell GPT-5.4 gestartet, sein bisher leistungsfähigstes und token-effizientestes Spitzenmodell. Die Veröffentlichung erfolgte gleichzeitig für ChatGPT, die Entwickler-API und die Codex-Plattform. OpenAI-CEO Sam Altman deutete den Start auf X (ehemals Twitter) an und schrieb: „Ich glaube, die Leute werden das mögen.“

Das neue Modell ist ab sofort für ChatGPT Plus-, Team- und Pro-Abonnenten verfügbar. Nutzer von Enterprise- und Education-Plänen können den frühen Zugriff über die Admin-Einstellungen aktivieren. Eine leistungsfähigere Variante, GPT-5.4 Pro, ist ebenfalls für Benutzer verfügbar, die maximale Leistung bei hochkomplexen Aufgaben benötigen.


Was ist neu: Ein einheitliches Powerhouse-Modell

GPT-5.4 stellt eine bedeutende Konsolidierung in der Modellpalette von OpenAI dar. Es vereint die branchenführenden Codierungsfähigkeiten von GPT-5.3-Codex mit verbesserter Logik, agentenbasierten Arbeitsabläufen und professionellen Produktivitätstools – alles in einem einzigen Modell.

Zu den wichtigsten Upgrades gehören:

  • Native Computer-Nutzungsfähigkeiten: Zum ersten Mal in einem Allzweckmodell kann GPT-5.4 in Codex und der API Computer autonom bedienen, Browser und Desktop-Anwendungen navigieren und komplexe mehrstufige Arbeitsabläufe ausführen.
  • 1 Million Token Kontextfenster: GPT-5.4 unterstützt bis zu 1 Million Token Kontext, was es Agenten ermöglicht, Aufgaben über erweiterte Sitzungen hinweg zu planen, auszuführen und zu verifizieren.
  • Tool-Suchsystem: Eine neu eingeführte Tool-Suchfunktion ermöglicht es dem Modell, Tool-Definitionen nur bei Bedarf nachzuschlagen, wodurch der Token-Verbrauch reduziert und die Antwortgeschwindigkeit in großen Tool-Ökosystemen verbessert wird.
  • Vorausgeplante Logikpläne: In ChatGPT kann die GPT-5.4 Thinking-Version vor der Generierung der vollständigen Antwort einen anfänglichen Plan ihrer Logik präsentieren, sodass Benutzer den Kurs während des Prozesses anpassen können.
  • Token-Effizienz: GPT-5.4 ist das bisher token-effizienteste Logikmodell von OpenAI und verbraucht deutlich weniger Token als GPT-5.2 zur Lösung von Problemen – was hilft, den etwas höheren Preis pro Token auszugleichen.

Benchmark-Leistung: Rekordverdächtige Ergebnisse

GPT-5.4 hat die Leistungsgrenzen in mehreren professionellen Bewertungsrahmen gesprengt:

  • GDPval: Erreichte 83 % und übertraf damit Büroangestellte in 44 Berufen bei realen Aufgaben.
  • APEX-Agents (Mercor): Erreichte die Spitzenplatzierung in diesem Benchmark, der zur Prüfung der KI-Leistung in den Bereichen Recht und Finanzen entwickelt wurde.
  • OSWorld-Verified & WebArena Verified: Setzte neue Rekorde in Computer-Nutzungs-Benchmarks, die messen, wie effektiv KI-Systeme mit Softwareumgebungen interagieren.
  • Tabellenkalkulationsmodellierung: Erreichte 87,3 % in einem internen Benchmark, der Aufgaben von Investmentbanking-Analysten simuliert, im Vergleich zu 68,4 % für GPT-5.2.
  • Präsentationserstellung: Menschliche Bewerter bevorzugten die Präsentationen von GPT-5.4 in 68 % der Fälle gegenüber den Ausgaben von GPT-5.2.

Reduzierte Halluzinationen und verbesserte Genauigkeit

OpenAI legte bei dieser Veröffentlichung großen Wert auf Zuverlässigkeit. Laut dem Unternehmen ist GPT-5.4:

  • 33 % weniger wahrscheinlich als GPT-5.2, Fehler bei einzelnen Faktenaussagen zu produzieren.
  • 18 % weniger wahrscheinlich als GPT-5.2, dass die Gesamtenantworten sachliche Fehler enthalten.

Eine neue Sicherheitsbewertung, die sich auf Chain-of-Thought (CoT)-Logik konzentrierte, ergab, dass Täuschungen in der GPT-5.4 Thinking-Version weniger wahrscheinlich sind, wobei OpenAI feststellte, dass „das Modell nicht in der Lage ist, seine Logik zu verbergen, und dass die CoT-Überwachung ein wirksames Sicherheitsinstrument bleibt.“


Unternehmens- und Wettbewerbsimplikationen

Der Start signalisiert den intensivierten Vorstoß von OpenAI in den Unternehmensmarkt – einen Bereich, in dem Anthropic historisch eine starke Position innehatte. Die sofort einsatzbereiten agentenbasierten Fähigkeiten von GPT-5.4, kombiniert mit seinen professionellen Dokumenten-, Tabellenkalkulations- und Präsentationsfähigkeiten, stellen es in direkten Wettbewerb mit Claudes von Anthropic für Unternehmensworkflows.

Parallel zu GPT-5.4 stellte OpenAI auch ein ChatGPT für Excel Add-in vor, das KI direkt in die allgegenwärtige Tabellenkalkulationssoftware von Microsoft bringt. Neue App-Integrationen und Skills wurden auch für die Nutzung innerhalb von ChatGPT angekündigt.

Marktanalysten beobachten die Situation genau. Anfang 2026 löste die Veröffentlichung von Anthropic's Cowork-Plugins einen breiten Ausverkauf bei SaaS-Aktien aus. Eine ähnliche Reaktion könnte folgen, da die agentenbasierten Fähigkeiten von GPT-5.4 neue Fragen über die Zukunft von Unternehmenssoftware aufwerfen.


Modellverfügbarkeit und Übergang von Altsystemen

  • GPT-5.4 Thinking ist jetzt in ChatGPT für Plus-, Team- und Pro-Benutzer live und ersetzt GPT-5.2 Thinking.
  • GPT-5.2 Thinking bleibt drei Monate lang im Bereich Legacy Models verfügbar und wird dann am 5. Juni 2026 (EST) eingestellt.
  • API-Preise auf OpenRouter werden mit 2,50 $ pro 1 Mio. Eingabetoken und 20,00 $ pro 1 Mio. Ausgabetoken angegeben, mit einem 1-Mio.-Token-Kontextfenster und maximal 128.000 Ausgabetoken.
  • Prompts, die 272.000 Eingabetoken überschreiten, unterliegen für die gesamte Sitzung 2-fachen Eingabe- und 1,5-fachen Ausgabepreisen.

Fazit

GPT-5.4 ist die bisher umfassendste Modellveröffentlichung von OpenAI in jüngster Zeit – sie kombiniert Spitzenlogik, Codierung, autonome Computer-Nutzung und professionelle Produktivität in einem einzigen, effizienteren Paket. Mit rekordverdächtigen Benchmark-Ergebnissen, signifikanten Reduzierungen von Halluzinationen und nativen Unternehmensintegrationen setzt es einen neuen Standard und verschärft das Rennen zwischen den weltweit führenden KI-Laboren.