GPT-5.4 arrive : Le modèle d'IA unifié d'OpenAI peut désormais contrôler votre ordinateur et surpasser vos collègues

March 06, 2026
GPT-5.4
5 min

Urgent : GPT-5.4 est disponible sur ChatGPT, API et Codex

Jeudi 5 mars 2026 (EST), OpenAI a officiellement lancé GPT-5.4, son modèle de pointe le plus performant et le plus efficace en termes de tokens à ce jour. Le lancement a été simultané sur ChatGPT, l'API développeur et la plateforme Codex. Le PDG d'OpenAI, Sam Altman, a annoncé le lancement sur X (anciennement Twitter), écrivant : « Je pense que les gens vont aimer ça. »

Le nouveau modèle est immédiatement disponible pour les abonnés ChatGPT Plus, Team et Pro. Les utilisateurs des plans Entreprise et Éducation peuvent activer l'accès anticipé via les paramètres d'administration. Une variante plus puissante, GPT-5.4 Pro, est également disponible pour les utilisateurs qui nécessitent des performances maximales sur des tâches très complexes.


Nouveautés : Un modèle unifié et puissant

GPT-5.4 représente une consolidation majeure dans la gamme de modèles d'OpenAI. Il fusionne les capacités de codage de pointe de GPT-5.3-Codex avec un raisonnement amélioré, des flux de travail d'agents et des outils de productivité professionnelle — le tout dans un seul modèle.

Les principales améliorations incluent :

  • Capacités natives d'utilisation d'ordinateurs : Pour la première fois dans un modèle à usage général, GPT-5.4 dans Codex et l'API peut faire fonctionner des ordinateurs de manière autonome, naviguer dans des navigateurs et des applications de bureau, et exécuter des flux de travail complexes en plusieurs étapes.
  • Fenêtre de contexte de 1 million de tokens : GPT-5.4 prend en charge jusqu'à 1 million de tokens de contexte, permettant aux agents de planifier, d'exécuter et de vérifier des tâches sur des sessions étendues.
  • Système de recherche d'outils : Une nouvelle fonctionnalité de recherche d'outils permet au modèle de rechercher les définitions d'outils uniquement lorsque nécessaire, réduisant ainsi l'utilisation des tokens et améliorant la vitesse de réponse dans les grands écosystèmes d'outils.
  • Plans de raisonnement initiaux : Dans ChatGPT, la version GPT-5.4 Thinking peut présenter un plan initial de son raisonnement avant de générer la réponse complète, permettant aux utilisateurs d'ajuster le cours en cours de processus.
  • Efficacité des tokens : GPT-5.4 est le modèle de raisonnement le plus efficace en termes de tokens d'OpenAI à ce jour, utilisant significativement moins de tokens que GPT-5.2 pour résoudre des problèmes — aidant à compenser le prix par token légèrement plus élevé.

Performances de référence : Résultats record

GPT-5.4 a pulvérisé les benchmarks de performance sur plusieurs cadres d'évaluation professionnels :

  • GDPval : A obtenu 83 %, surpassant les employés de bureau dans 44 professions sur des tâches du monde réel.
  • APEX-Agents (Mercor) : A atteint le premier rang sur ce benchmark conçu pour tester les performances de l'IA dans les domaines juridique et financier.
  • OSWorld-Verified & WebArena Verified : A établi de nouveaux records sur les benchmarks d'utilisation d'ordinateurs qui mesurent l'efficacité avec laquelle les systèmes d'IA interagissent avec les environnements logiciels.
  • Modélisation de feuilles de calcul : A obtenu 87,3 % sur un benchmark interne simulant des tâches d'analyste en banque d'investissement, contre 68,4 % pour GPT-5.2.
  • Génération de présentations : Les évaluateurs humains ont préféré les présentations de GPT-5.4 68 % du temps par rapport aux sorties de GPT-5.2.

Réduction des hallucinations et amélioration de la précision

OpenAI a mis un fort accent sur la fiabilité dans cette version. Selon l'entreprise, GPT-5.4 est :

  • 33 % moins susceptible de produire des erreurs dans des affirmations factuelles individuelles par rapport à GPT-5.2.
  • 18 % moins susceptible d'avoir des réponses globales contenant des erreurs factuelles.

Une nouvelle évaluation de sécurité axée sur le raisonnement en chaîne de pensée (CoT) a révélé que la tromperie est moins probable dans la version GPT-5.4 Thinking, OpenAI déclarant que « le modèle n'a pas la capacité de cacher son raisonnement et que la surveillance CoT reste un outil de sécurité efficace ».


Implications pour les entreprises et la concurrence

Le lancement signale l'intensification des efforts d'OpenAI sur le marché des entreprises — un espace où Anthropic a historiquement occupé une position forte. Les capacités d'agentivité prêtes à l'emploi de GPT-5.4, combinées à ses compétences professionnelles en matière de documents, de feuilles de calcul et de présentations, le placent en concurrence directe avec Claude d'Anthropic pour les flux de travail d'entreprise.

Parallèlement à GPT-5.4, OpenAI a également lancé un complément ChatGPT pour Excel, apportant l'IA directement dans le logiciel de feuille de calcul omniprésent de Microsoft. De nouvelles intégrations d'applications et de compétences ont également été annoncées pour une utilisation dans ChatGPT.

Les analystes du marché observent attentivement. Plus tôt en 2026, la sortie des plugins Cowork d'Anthropic a déclenché une large vente d'actions SaaS. Une réaction similaire pourrait suivre alors que les capacités d'agentivité de GPT-5.4 soulèvent de nouvelles questions sur l'avenir des logiciels d'entreprise.


Disponibilité du modèle et transition de l'héritage

  • GPT-5.4 Thinking est désormais disponible dans ChatGPT pour les utilisateurs Plus, Team et Pro, remplaçant GPT-5.2 Thinking.
  • GPT-5.2 Thinking restera disponible dans la section Modèles hérités pendant trois mois, avant d'être retiré le 5 juin 2026 (EST).
  • Les tarifs de l'API sur OpenRouter sont indiqués à 2,50 $ par 1 million de tokens d'entrée et 20,00 $ par 1 million de tokens de sortie, avec une fenêtre de contexte de 1 million et une sortie maximale de 128K.
  • Les invites dépassant 272K tokens d'entrée sont soumises à des tarifs 2x pour l'entrée et 1,5x pour la sortie pour la session complète.

En résumé

GPT-5.4 est la version la plus complète d'OpenAI ces derniers temps — combinant raisonnement de pointe, codage, autonomie d'utilisation d'ordinateurs et productivité professionnelle dans un ensemble unique et plus efficace. Avec des scores de référence record, des réductions significatives des hallucinations et des intégrations d'entreprise natives, il établit une nouvelle norme et intensifie la course entre les principaux laboratoires d'IA du monde.