Anthropic, Claude Opus 4.5 중대 발표: 최초로 80% 프로그래밍 기준 돌파한 AI 모델, 성능은 인간 초월, 가격은 67% 인하
뉴스 요약
Anthropic은 2025년 11월 24일 최신 플래그십 AI 모델인 Claude Opus 4.5를 공식 출시했습니다. 이 모델은 소프트웨어 개발, 추론 능력 및 복잡한 다단계 작업 처리에서 획기적인 발전을 이루었으며, 현재 Claude 애플리케이션, API 및 3대 주요 클라우드 플랫폼을 통해 사용자에게 제공됩니다. 이는 9월 Sonnet 4.5, 10월 Haiku 4.5 출시에 이어 Anthropic이 두 달 만에 세 번째로 발표한 주요 모델로, AI 산업 경쟁이 백열화 단계에 접어들었음을 알립니다.
Claude Opus 4.5의 가장 두드러진 변화는 가격의 대폭 인하입니다. 가격은 백만 입력 토큰당 5달러, 출력 토큰당 25달러로 책정되었으며, 이는 이전 버전인 Opus 4.1의 15/75달러에 비해 67% 인하된 수치로, 최고 수준의 AI 기능을 더욱 보편적으로 접근 가능하게 만듭니다. 이러한 가격 전략은 OpenAI의 GPT-5.1(1.25/10달러) 및 Google의 Gemini 3 Pro(2/12달러)와의 경쟁에서 더욱 매력적인 위치를 차지하게 합니다.
성능 면에서 Claude Opus 4.5는 SWE-bench Verified 벤치마크 테스트에서 80.9%의 정확도를 달성하여 80%를 돌파한 최초의 모델이 되었습니다. 이는 OpenAI의 GPT-5.1-Codex-Max(77.9%)와 Google의 Gemini 3 Pro(76.2%)를 능가하는 수치입니다. 이 벤치마크는 AI 시스템이 실제 소프트웨어 엔지니어링 작업에서 얼마나 잘 수행하는지를 특별히 테스트하며, Claude Opus 4.5의 성과는 업계의 새로운 기준을 제시합니다.
더욱 놀라운 점은 Anthropic이 회사에서 성능 엔지니어를 채용할 때 사용하는 실제 기술 시험으로 Opus 4.5를 테스트한 결과, 이 모델의 점수가 모든 인간 지원자의 역대 최고 점수를 넘어섰다는 것입니다. 이러한 결과는 AI 기술이 화이트칼라 직업을 어떻게 재편할지에 대한 업계의 심도 깊은 논의를 촉발했습니다.
기술적으로 Claude Opus 4.5는 20만 토큰 컨텍스트 창과 6.4만 토큰 출력 제한을 갖추고 있으며, 지식 마감일은 2025년 3월로 업데이트되었습니다. 모델은 메모리 관리에서 상당한 개선을 이루었으며, 특히 긴 컨텍스트 작업을 위해 최적화되어 핵심 세부 정보를 더 스마트하게 기억할 수 있습니다. 이러한 개선 사항 덕분에 여러 Haiku 하위 에이전트의 협업 시나리오에서 메인 에이전트 역할을 수행하는 데 특히 적합합니다.
실제 적용 사례에서 초기 테스터들은 Opus 4.5가 Sonnet 4.5로는 거의 불가능했던 작업을 처리할 수 있었으며, 복잡한 다중 시스템 문제에 직면했을 때 수동적인 지시 없이도 해결책을 찾을 수 있었다고 보고했습니다. 유명 개발자 Simon Willison은 주말 테스트에서 Claude Code를 사용하여 sqlite-utils의 대규모 리팩토링을 완료했으며, 이틀 만에 39개 파일, 2022줄의 새 코드 추가 및 1173줄 삭제를 포함하는 20번의 커밋을 수행했습니다.
보안 측면에서 Anthropic은 Opus 4.5가 현재까지 가장 견고하게 정렬된 모델이며, 프롬프트 주입 공격 방어에서 상당한 진전을 이루어 업계의 다른 어떤 최첨단 모델보다 속이기 어렵다고 밝혔습니다. 이는 Claude를 핵심 업무에 사용하는 기업 고객에게 특히 중요합니다.
모델 출시와 동시에 Anthropic은 일련의 제품 업데이트를 발표했습니다. Claude for Chrome 확장 프로그램은 이제 모든 Max 사용자에게 제공되며, Claude for Excel은 Max, Team 및 Enterprise 사용자를 대상으로 공식 출시되어 피벗 테이블, 차트 및 파일 업로드를 지원합니다. 데스크톱 버전 Claude Code 애플리케이션도 Windows, macOS 및 Windows(Arm 64) 플랫폼을 지원하며 공식 출시되어 개발자가 여러 코딩 또는 연구 세션을 병렬로 실행할 수 있도록 합니다.
주목할 점은 Anthropic이 사용 한도를 조정하여 Opus 4.5에 접근 권한이 있는 사용자가 이전 Sonnet 수준과 유사한 수준으로 모델을 사용할 수 있도록 했다는 것입니다. 이는 사용자가 일상 업무에서 과도한 제한에 대해 걱정할 필요가 없음을 의미합니다.
시장 경쟁 구도 측면에서 Microsoft와 NVIDIA는 지난주 Anthropic에 수십억 달러를 투자한다고 발표했으며, 이로 인해 이 AI 연구소의 기업 가치는 약 3,500억 달러로 상승했습니다. Anthropic은 2025년 1분기에 연간 매출 20억 달러를 달성하여 전 분기 10억 달러 대비 두 배 증가했으며, 연간 지출이 10만 달러를 초과하는 고객 수는 전년 대비 8배 증가했습니다.
Claude Opus 4.5의 출시는 AI 산업의 치열한 경쟁 시기에 이루어졌습니다. OpenAI는 11월 12일 GPT-5.1을 출시했고, Google은 11월 18일 Gemini 3를 선보였으며, 이제 Anthropic은 Opus 4.5로 시장에 대응하고 있습니다. Anthropic의 제품 책임자 Scott White는 "우리가 시장에 출시하는 제품의 수와 그로 인해 발생하는 피드백 순환에 대해 매우 기쁩니다"라고 말했습니다.
타겟 사용자층에 대해 White는 Opus 4.5의 이상적인 사용자는 전문 소프트웨어 개발자와 금융 분석가, 컨설턴트, 회계사와 같은 지식 근로자, 그리고 창의성을 발휘하고 새로운 것을 구축하고자 하는 사람들이라고 지적했습니다.
개발자는 API를 통해 모델 문자열 "claude-opus-4-5-20251101"을 사용하여 Claude Opus 4.5를 호출할 수 있으며, 동시에 프롬프트 캐싱으로 90%, 배치 처리로 50%의 비용 절감 혜택을 누릴 수 있습니다. 이 모델은 Amazon Bedrock, Google Cloud의 Vertex AI 및 Microsoft Foundry와 같은 플랫폼에 출시되었습니다.
Anthropic은 Opus 4.5가 "전례 없는 사용 사례"를 위해 탄생한 고급 모델이며, 특히 전문 소프트웨어 엔지니어링, 복잡한 에이전트 워크플로우 및 고위험 기업 업무에 적합하다고 강조했습니다. 이 모델의 하이브리드 추론 능력은 즉각적인 응답과 확장된 사고 사이를 유연하게 전환할 수 있게 하며, API 사용자는 모델이 응답에 투입하는 전반적인 노력을 정밀하게 제어하여 성능, 지연 시간 및 비용 사이의 균형을 맞출 수 있습니다.
업계 파트너들의 피드백 또한 Opus 4.5의 강력한 능력을 입증했습니다. Lovable은 이 모델이 채팅 모드에서 최첨단 추론 능력을 제공하며, 심층 추론이 계획 방식을 변화시키고, 우수한 계획이 더 나은 코드 생성을 가능하게 한다고 밝혔습니다. Warp는 Terminal Bench 테스트에서 Opus 4.5가 Sonnet 4.5보다 15% 향상되었으며, 이는 Planning Mode 사용에서 특히 두드러졌다고 보고했습니다. 금융 모델링 회사 Fundamental Research Labs의 공동 창립자 Nico Christie는 내부 평가에서 정확도가 20% 향상되고 효율성이 15% 증가하여, 한때는 불가능해 보였던 복잡한 작업들이 이제는 실현 가능해졌다고 말했습니다.
Claude Opus 4.5의 출시는 Anthropic의 기술력에 대한 새로운 돌파구를 의미할 뿐만 아니라, AI 비서가 단순한 질문-답변 도구에서 복잡한 전문 작업을 독립적으로 수행할 수 있는 지능형 시스템으로 진화하고 있음을 예고합니다. 가격의 대폭 인하와 능력의 현저한 향상에 따라 AI 기술의 상업적 응용은 더욱 가속화될 것으로 예상되며, 모든 산업 분야에 심오한 변화를 가져올 것입니다.