GPT-5.4 출시: OpenAI의 통합 AI 모델, 이제 컴퓨터를 제어하고 동료보다 뛰어난 사고력 발휘
속보: GPT-5.4, ChatGPT, API 및 Codex 전반에 걸쳐 출시
2026년 3월 5일 목요일(EST), OpenAI는 현재까지 가장 뛰어나고 토큰 효율적인 최첨단 모델인 GPT-5.4를 공식 출시했습니다. 이번 출시는 ChatGPT, 개발자 API 및 Codex 플랫폼 전반에 걸쳐 동시에 이루어졌습니다. OpenAI CEO 샘 알트먼은 X(구 트위터)를 통해 "사람들이 이것을 좋아할 것이라고 생각한다"고 글을 올리며 출시를 예고했습니다.
새로운 모델은 ChatGPT Plus, Team 및 Pro 구독자에게 즉시 제공됩니다. Enterprise 및 Education 플랜 사용자는 관리자 설정을 통해 조기 액세스를 활성화할 수 있습니다. 더 강력한 변형 모델인 GPT-5.4 Pro는 복잡한 작업에 최대 성능이 필요한 사용자에게도 제공됩니다.
새로운 기능: 통합된 강력한 모델
GPT-5.4는 OpenAI의 모델 라인업에서 중요한 통합을 나타냅니다. 이는 GPT-5.3-Codex의 업계 최고의 코딩 기능과 향상된 추론, 에이전트 워크플로우 및 전문 생산성 도구를 단일 모델로 통합합니다.
주요 업그레이드는 다음과 같습니다.
- 네이티브 컴퓨터 사용 기능: 범용 모델 최초로 Codex 및 API의 GPT-5.4는 컴퓨터를 자율적으로 작동하고, 브라우저 및 데스크톱 애플리케이션을 탐색하며, 복잡한 다단계 워크플로우를 수행할 수 있습니다.
- 100만 토큰 컨텍스트 창: GPT-5.4는 최대 100만 토큰의 컨텍스트를 지원하여 에이전트가 확장된 세션에서 작업을 계획, 실행 및 검증할 수 있습니다.
- 도구 검색 시스템: 새로 도입된 도구 검색 기능은 모델이 필요할 때만 도구 정의를 조회할 수 있도록 하여 토큰 사용량을 줄이고 대규모 도구 생태계에서 응답 속도를 향상시킵니다.
- 사전 추론 계획: ChatGPT에서 GPT-5.4 Thinking 버전은 전체 응답을 생성하기 전에 추론 계획을 먼저 제시하여 사용자가 중간 과정에서 방향을 조정할 수 있도록 합니다.
- 토큰 효율성: GPT-5.4는 현재까지 OpenAI의 가장 토큰 효율적인 추론 모델로, GPT-5.2보다 훨씬 적은 토큰을 사용하여 문제를 해결합니다. 이는 약간 더 높은 토큰당 가격을 상쇄하는 데 도움이 됩니다.
벤치마크 성능: 기록적인 결과
GPT-5.4는 여러 전문 평가 프레임워크에서 성능 벤치마크를 뛰어넘었습니다.
- GDPval: **83%**를 기록하여 실제 작업에서 44개 직업의 사무직 근로자보다 뛰어난 성능을 보였습니다.
- APEX-Agents (Mercor): 법률 및 금융 분야의 AI 성능을 테스트하도록 설계된 이 벤치마크에서 최고 순위를 달성했습니다.
- OSWorld-Verified & WebArena Verified: AI 시스템이 소프트웨어 환경과 얼마나 효과적으로 상호 작용하는지 측정하는 컴퓨터 사용 벤치마크에서 새로운 기록을 세웠습니다.
- 스프레드시트 모델링: 내부 벤치마크에서 투자 은행 분석가 작업을 시뮬레이션한 결과 **87.3%**를 기록했으며, GPT-5.2는 **68.4%**였습니다.
- 프레젠테이션 생성: 인간 평가자는 GPT-5.4의 프레젠테이션을 GPT-5.2의 결과보다 68% 더 선호했습니다.
환각 감소 및 정확도 향상
OpenAI는 이번 출시에서 신뢰성에 중점을 두었습니다. 회사에 따르면 GPT-5.4는 다음과 같습니다.
- GPT-5.2에 비해 개별 사실 주장에서 오류를 생성할 가능성이 33% 낮습니다.
- 전체 응답에 사실 오류가 포함될 가능성이 18% 낮습니다.
사슬 사고(CoT) 추론에 중점을 둔 새로운 안전 평가 결과, GPT-5.4 Thinking 버전에서 속임수가 발생할 가능성이 낮으며, OpenAI는 "모델이 추론을 숨길 능력이 없으며 CoT 모니터링은 효과적인 안전 도구로 남아 있다"고 밝혔습니다.
기업 및 경쟁적 영향
이번 출시는 OpenAI가 기업 시장에 대한 노력을 강화하고 있음을 시사합니다. 이 시장은 Anthropic이 역사적으로 강력한 입지를 유지해 왔습니다. GPT-5.4의 즉시 사용 가능한 에이전트 기능과 전문 문서, 스프레드시트 및 프레젠테이션 기술은 기업 워크플로우에서 Anthropic의 Claude와 직접 경쟁하게 합니다.
GPT-5.4와 함께 OpenAI는 ChatGPT for Excel 추가 기능을 출시하여 AI를 Microsoft의 보편적인 스프레드시트 소프트웨어에 직접 통합했습니다. ChatGPT 내에서 사용할 수 있는 새로운 앱 통합 및 기능도 발표되었습니다.
시장 분석가들은 면밀히 주시하고 있습니다. 2026년 초, Anthropic의 Cowork 플러그인 출시는 SaaS 주식의 광범위한 매도세를 촉발했습니다. GPT-5.4의 에이전트 기능이 기업 소프트웨어의 미래에 대한 새로운 의문을 제기함에 따라 유사한 반응이 뒤따를 수 있습니다.
모델 가용성 및 레거시 전환
- GPT-5.4 Thinking은 이제 Plus, Team 및 Pro 사용자를 위한 ChatGPT에서 출시되었으며, GPT-5.2 Thinking을 대체합니다.
- GPT-5.2 Thinking은 레거시 모델 섹션에서 3개월 동안 계속 사용할 수 있으며, **2026년 6월 5일(EST)**에 서비스가 종료됩니다.
- OpenRouter의 API 가격은 입력 100만 토큰당 2.50달러, 출력 100만 토큰당 20.00달러이며, 컨텍스트 창은 100만 토큰, 최대 출력은 128K입니다.
- 272K 입력 토큰을 초과하는 프롬프트는 전체 세션에 대해 입력 2배, 출력 1.5배 가격이 적용됩니다.
요점
GPT-5.4는 최첨단 추론, 코딩, 컴퓨터 사용 자율성 및 전문 생산성을 단일의 더 효율적인 패키지로 결합한, 최근 기억에 남는 OpenAI의 가장 포괄적인 모델 출시입니다. 기록적인 벤치마크 점수, 상당한 환각 감소 및 네이티브 기업 통합을 통해 새로운 표준을 설정하고 세계 최고의 AI 연구소 간의 경쟁을 심화시킵니다.