GPT-5.4が登場:OpenAIの統合AIモデルがあなたのコンピュータを制御し、同僚を凌駕する思考力を持つ
速報:GPT-5.4、ChatGPT、API、Codexで稼働開始
2026年3月5日(米国東部標準時)、OpenAIは、これまでにないほど高性能でトークン効率の高い最先端モデルであるGPT-5.4を正式にリリースしました。このリリースは、ChatGPT、開発者向けAPI、Codexプラットフォームで同時に展開されました。OpenAIのCEOであるサム・アルトマン氏は、X(旧Twitter)で「人々はこれを気に入るだろうと思う」と投稿し、このローンチを予告しました。
新モデルは、ChatGPT Plus、Team、Proの加入者はすぐに利用可能です。エンタープライズおよびエデュケーションプランのユーザーは、管理者設定を通じて早期アクセスを有効にできます。より強力なバリアントであるGPT-5.4 Proも、非常に複雑なタスクで最高のパフォーマンスを必要とするユーザー向けに提供されています。
新機能:統合された強力なモデル
GPT-5.4は、OpenAIのモデルラインナップにおける大きな統合を表します。業界をリードするGPT-5.3-Codexのコーディング能力と、強化された推論、エージェントワークフロー、プロフェッショナルな生産性ツールを、すべて単一のモデルに統合しました。
主なアップグレードは以下の通りです。
- ネイティブなコンピューター操作能力:汎用モデルとしては初めて、CodexおよびAPIのGPT-5.4は、コンピューターを自律的に操作し、ブラウザやデスクトップアプリケーションをナビゲートし、複雑な複数ステップのワークフローを実行できます。
- 100万トークンのコンテキストウィンドウ:GPT-5.4は最大100万トークンのコンテキストをサポートし、エージェントが拡張セッション全体でタスクを計画、実行、検証できるようになります。
- ツール検索システム:新たに導入されたツール検索機能により、モデルは必要な場合にのみツール定義を検索できるようになり、トークン使用量を削減し、大規模なツールエコシステムでの応答速度を向上させます。
- 事前の推論計画:ChatGPTでは、GPT-5.4 Thinkingバージョンは、完全な応答を生成する前に推論の初期計画を提示でき、ユーザーはプロセス中にコースを調整できます。
- トークン効率:GPT-5.4は、OpenAIのこれまでの推論モデルの中で最もトークン効率が高く、GPT-5.2よりも大幅に少ないトークンで問題を解決します。これにより、トークンあたりの価格がわずかに高くても相殺されます。
ベンチマークパフォーマンス:記録破りの結果
GPT-5.4は、複数の専門評価フレームワークでパフォーマンスベンチマークを打ち破りました。
- GDPval:実世界のタスクにおいて、44の職種でオフィスワーカーを上回るスコア**83%**を達成しました。
- APEX-Agents (Mercor):法律および金融分野におけるAIパフォーマンスをテストするために設計されたこのベンチマークでトップランクを獲得しました。
- OSWorld-Verified & WebArena Verified:AIシステムがソフトウェア環境とどの程度効果的に対話できるかを測定するコンピューター操作ベンチマークで新記録を樹立しました。
- スプレッドシートモデリング:投資銀行アナリストのタスクをシミュレートした内部ベンチマークで**87.3%のスコアを達成しました。GPT-5.2は68.4%**でした。
- プレゼンテーション生成:人間による評価では、GPT-5.4のプレゼンテーションはGPT-5.2の出力と比較して**68%**の割合で好まれました。
ハルシネーションの削減と精度の向上
OpenAIは今回のリリースで信頼性を重視しました。同社によると、GPT-5.4は以下の通りです。
- GPT-5.2と比較して、個々の事実主張におけるエラーの発生確率が33%低い。
- 事実誤認を含む全体的な応答の発生確率が18%低い。
連鎖思考(CoT)推論に焦点を当てた新しい安全評価では、GPT-5.4 Thinkingバージョンでの欺瞞の可能性が低いことが判明し、OpenAIは「モデルは推論を隠す能力がなく、CoT監視は効果的な安全ツールであり続ける」と述べています。
エンタープライズおよび競合への影響
このローンチは、OpenAIがエンタープライズ市場への進出を強化していることを示しています。この市場では、Anthropicが歴史的に強力な地位を占めてきました。GPT-5.4のすぐに利用可能なエージェント機能は、プロフェッショナルなドキュメント、スプレッドシート、プレゼンテーションスキルと組み合わさることで、エンタープライズワークフローにおいてAnthropicのClaudeと直接競合します。
GPT-5.4と同時に、OpenAIはChatGPT for Excelアドインも発表し、AIをMicrosoftの普及したスプレッドシートソフトウェアに直接統合しました。ChatGPT内で使用するための新しいアプリ統合とスキルも発表されました。
市場アナリストは注視しています。2026年初頭には、AnthropicのCoworkプラグインのリリースがSaaS株の広範な売りを引き起こしました。GPT-5.4のエージェント機能がエンタープライズソフトウェアの将来について新たな疑問を投げかける中、同様の反応が続く可能性があります。
モデルの可用性とレガシー移行
- GPT-5.4 Thinkingは、Plus、Team、Proユーザー向けのChatGPTで稼働を開始し、GPT-5.2 Thinkingを置き換えます。
- GPT-5.2 Thinkingは、レガシーモデルセクションで3ヶ月間利用可能ですが、2026年6月5日(米国東部標準時)に廃止されます。
- OpenRouterでのAPI価格は、入力100万トークンあたり2.50ドル、出力100万トークンあたり20.00ドルで、コンテキストウィンドウは100万トークン、最大出力は128Kです。
- 272K入力トークンを超えるプロンプトは、セッション全体で入力2倍、出力1.5倍の価格が適用されます。
まとめ
GPT-5.4は、OpenAIの最近のリリースの中で最も包括的なモデルであり、最先端の推論、コーディング、コンピューター操作の自律性、プロフェッショナルな生産性を、より効率的な単一パッケージに統合しています。記録的なベンチマークスコア、ハルシネーションの大幅な削減、ネイティブなエンタープライズ統合により、新たな基準を設定し、世界の主要AIラボ間の競争を激化させます。