GPT-5.4 출시: OpenAI의 통합 AI 모델, 이제 컴퓨터를 제어하고 동료보다 뛰어난 사고력 발휘

March 06, 2026

GPT-5.4

4 min

속보: GPT-5.4, ChatGPT, API 및 Codex 전반에 걸쳐 출시

2026년 3월 5일 목요일(EST), OpenAI는 현재까지 가장 뛰어나고 토큰 효율적인 최첨단 모델인 GPT-5.4를 공식 출시했습니다. 이번 출시는 ChatGPT, 개발자 API 및 Codex 플랫폼 전반에 걸쳐 동시에 이루어졌습니다. OpenAI CEO 샘 알트먼은 X(구 트위터)를 통해 "사람들이 이것을 좋아할 것이라고 생각한다"고 글을 올리며 출시를 예고했습니다.

새로운 모델은 ChatGPT Plus, Team 및 Pro 구독자에게 즉시 제공됩니다. Enterprise 및 Education 플랜 사용자는 관리자 설정을 통해 조기 액세스를 활성화할 수 있습니다. 더 강력한 변형 모델인 GPT-5.4 Pro는 복잡한 작업에 최대 성능이 필요한 사용자에게도 제공됩니다.

새로운 기능: 통합된 강력한 모델

GPT-5.4는 OpenAI의 모델 라인업에서 중요한 통합을 나타냅니다. 이는 GPT-5.3-Codex의 업계 최고의 코딩 기능과 향상된 추론, 에이전트 워크플로우 및 전문 생산성 도구를 단일 모델로 통합합니다.

주요 업그레이드는 다음과 같습니다.

네이티브 컴퓨터 사용 기능: 범용 모델 최초로 Codex 및 API의 GPT-5.4는 컴퓨터를 자율적으로 작동하고, 브라우저 및 데스크톱 애플리케이션을 탐색하며, 복잡한 다단계 워크플로우를 수행할 수 있습니다.
100만 토큰 컨텍스트 창: GPT-5.4는 최대 100만 토큰의 컨텍스트를 지원하여 에이전트가 확장된 세션에서 작업을 계획, 실행 및 검증할 수 있습니다.
도구 검색 시스템: 새로 도입된 도구 검색 기능은 모델이 필요할 때만 도구 정의를 조회할 수 있도록 하여 토큰 사용량을 줄이고 대규모 도구 생태계에서 응답 속도를 향상시킵니다.
사전 추론 계획: ChatGPT에서 GPT-5.4 Thinking 버전은 전체 응답을 생성하기 전에 추론 계획을 먼저 제시하여 사용자가 중간 과정에서 방향을 조정할 수 있도록 합니다.
토큰 효율성: GPT-5.4는 현재까지 OpenAI의 가장 토큰 효율적인 추론 모델로, GPT-5.2보다 훨씬 적은 토큰을 사용하여 문제를 해결합니다. 이는 약간 더 높은 토큰당 가격을 상쇄하는 데 도움이 됩니다.

벤치마크 성능: 기록적인 결과

GPT-5.4는 여러 전문 평가 프레임워크에서 성능 벤치마크를 뛰어넘었습니다.

GDPval: **83%**를 기록하여 실제 작업에서 44개 직업의 사무직 근로자보다 뛰어난 성능을 보였습니다.
APEX-Agents (Mercor): 법률 및 금융 분야의 AI 성능을 테스트하도록 설계된 이 벤치마크에서 최고 순위를 달성했습니다.
OSWorld-Verified & WebArena Verified: AI 시스템이 소프트웨어 환경과 얼마나 효과적으로 상호 작용하는지 측정하는 컴퓨터 사용 벤치마크에서 새로운 기록을 세웠습니다.
스프레드시트 모델링: 내부 벤치마크에서 투자 은행 분석가 작업을 시뮬레이션한 결과 **87.3%**를 기록했으며, GPT-5.2는 **68.4%**였습니다.
프레젠테이션 생성: 인간 평가자는 GPT-5.4의 프레젠테이션을 GPT-5.2의 결과보다 68% 더 선호했습니다.

환각 감소 및 정확도 향상

OpenAI는 이번 출시에서 신뢰성에 중점을 두었습니다. 회사에 따르면 GPT-5.4는 다음과 같습니다.

GPT-5.2에 비해 개별 사실 주장에서 오류를 생성할 가능성이 33% 낮습니다.
전체 응답에 사실 오류가 포함될 가능성이 18% 낮습니다.

사슬 사고(CoT) 추론에 중점을 둔 새로운 안전 평가 결과, GPT-5.4 Thinking 버전에서 속임수가 발생할 가능성이 낮으며, OpenAI는 "모델이 추론을 숨길 능력이 없으며 CoT 모니터링은 효과적인 안전 도구로 남아 있다"고 밝혔습니다.

기업 및 경쟁적 영향

이번 출시는 OpenAI가 기업 시장에 대한 노력을 강화하고 있음을 시사합니다. 이 시장은 Anthropic이 역사적으로 강력한 입지를 유지해 왔습니다. GPT-5.4의 즉시 사용 가능한 에이전트 기능과 전문 문서, 스프레드시트 및 프레젠테이션 기술은 기업 워크플로우에서 Anthropic의 Claude와 직접 경쟁하게 합니다.

GPT-5.4와 함께 OpenAI는 ChatGPT for Excel 추가 기능을 출시하여 AI를 Microsoft의 보편적인 스프레드시트 소프트웨어에 직접 통합했습니다. ChatGPT 내에서 사용할 수 있는 새로운 앱 통합 및 기능도 발표되었습니다.

시장 분석가들은 면밀히 주시하고 있습니다. 2026년 초, Anthropic의 Cowork 플러그인 출시는 SaaS 주식의 광범위한 매도세를 촉발했습니다. GPT-5.4의 에이전트 기능이 기업 소프트웨어의 미래에 대한 새로운 의문을 제기함에 따라 유사한 반응이 뒤따를 수 있습니다.

모델 가용성 및 레거시 전환

GPT-5.4 Thinking은 이제 Plus, Team 및 Pro 사용자를 위한 ChatGPT에서 출시되었으며, GPT-5.2 Thinking을 대체합니다.
GPT-5.2 Thinking은 레거시 모델 섹션에서 3개월 동안 계속 사용할 수 있으며, **2026년 6월 5일(EST)**에 서비스가 종료됩니다.
OpenRouter의 API 가격은 입력 100만 토큰당 2.50달러, 출력 100만 토큰당 20.00달러이며, 컨텍스트 창은 100만 토큰, 최대 출력은 128K입니다.
272K 입력 토큰을 초과하는 프롬프트는 전체 세션에 대해 입력 2배, 출력 1.5배 가격이 적용됩니다.

요점

GPT-5.4는 최첨단 추론, 코딩, 컴퓨터 사용 자율성 및 전문 생산성을 단일의 더 효율적인 패키지로 결합한, 최근 기억에 남는 OpenAI의 가장 포괄적인 모델 출시입니다. 기록적인 벤치마크 점수, 상당한 환각 감소 및 네이티브 기업 통합을 통해 새로운 표준을 설정하고 세계 최고의 AI 연구소 간의 경쟁을 심화시킵니다.