AI, 인간 해커를 능가하다: Claude, 14일 만에 22개의 CVE로 Firefox 방어선 돌파
뉴스 요약
AI 기반 보안 연구의 획기적인 시연에서 Anthropic의 Claude Opus 4.6은 2026년 2월 (ET)에 진행된 2주간의 협력 과정에서 Mozilla의 Firefox 브라우저에서 이전에 알려지지 않은 22개의 취약점을 식별했습니다. 이 중 14개는 고위험으로 분류되었으며, 이는 2025년 전체에 걸쳐 수정된 모든 고위험 Firefox 취약점의 거의 5분의 1에 해당합니다. 결과는 2026년 3월 6일 목요일 (ET)에 공개되었습니다.
배경: 의도적이고 엄격한 테스트
Anthropic의 Frontier Red Team이 Firefox를 시험장으로 선택한 데에는 특별한 이유가 있습니다. Firefox는 전 세계적으로 가장 철저하게 감사되고 안전한 오픈 소스 코드베이스 중 하나로 널리 인정받고 있으며, 매일 수억 명의 사용자가 사용하고 있습니다. 팀은 Claude가 합성 벤치마크를 넘어 실제 프로덕션 등급 소프트웨어로 나아갈 수 있는 도전을 원했습니다.
실험은 Claude에게 Firefox 코드베이스의 이전 버전에서 알려진 CVE(Common Vulnerabilities and Exposures)를 재현하도록 요청하는 것으로 시작되었습니다. 모델의 성공률은 상당히 높았지만, 연구원들은 일부 과거 CVE가 Claude의 훈련 데이터에 포함되었을 수 있음을 인정했습니다. 이러한 불확실성을 제거하기 위해 팀은 Claude가 현재 버전의 Firefox에서 완전히 새롭고 이전에 보고되지 않은 버그를 탐색하도록 방향을 전환했습니다.
탐색: JavaScript 엔진에서 전체 브라우저까지
Claude Opus 4.6은 Firefox의 JavaScript 엔진부터 배포되었습니다. 이는 방대한 공격 표면을 고려할 때 논리적인 진입점이었습니다. 이 엔진은 사용자가 웹을 탐색할 때 신뢰할 수 없는 외부 코드를 일상적으로 처리하므로 공격자에게 가장 가치 있는 대상 중 하나입니다.
자율 코드 탐색 시작 후 단 20분 만에 Claude는 Use-After-Free 취약점을 식별했습니다. 이는 공격자가 악의적인 페이로드로 데이터를 덮어쓸 수 있는 메모리 손상 결함의 한 종류입니다. 이 초기 성공을 바탕으로 Claude는 거의 6,000개의 C++ 소스 파일을 스캔하여 Mozilla의 Bugzilla 이슈 트래커에 직접 제출된 112개의 고유한 버그 보고서를 생성했습니다.
이 제출물을 분류한 후 Mozilla의 보안 엔지니어는 22개의 CVE를 확인했으며, 그중 14개는 고위험으로 평가되었습니다. 이 단 2주간의 작업만으로도 2025년 단일 달력 월 동안 인간 및 자동화된 모든 소스를 합친 것보다 더 많은 취약점 보고서가 생성되었습니다.
Mozilla의 대응: 대규모 신속 패치
Mozilla는 이 협력이 과거에 높은 오탐률과 과도한 노이즈로 어려움을 겪었던 일반적인 AI 지원 보안 제출과 현저히 다르다고 설명했습니다. Anthropic의 보고서는 최소한의 재현 가능한 테스트 사례와 함께 제공되어 Mozilla 엔지니어들이 몇 시간 내에 각 문제를 검증할 수 있었습니다.
Mozilla는 100건 이상의 버그 신고 유입을 관리하기 위해 "사고 대응" 태세를 활성화했다고 밝혔습니다. 여러 엔지니어링 팀이 결과를 검증하고, 패치를 작성하고, 릴리스를 조정하기 위해 동원되었습니다. 대부분의 수정 사항은 2026년 2월 24일 (ET)에 릴리스된 Firefox 148.0에 포함되었으며, 나머지 패치는 다음 브라우저 릴리스에 예정되어 있습니다.
22개의 CVE 외에도 Anthropic의 연구는 90개의 추가 비보안 버그를 발견했으며, 이 중 대부분도 해결되었습니다. 특히 Claude의 발견 중 일부는 기존 퍼징 기법으로는 이전에 발견되지 않았던 별도의 논리 오류 클래스를 나타냈습니다.
악용: AI가 여전히 뒤처지는 부분
인상적인 발견율에도 불구하고, 이 연구는 중요한 비대칭성을 드러냈습니다. Claude는 취약점을 찾는 데는 뛰어나지만 악용하는 데는 훨씬 더 뛰어나다는 것입니다. Anthropic은 기능적인 개념 증명 악용을 구성하기 위해 수백 번의 시도에 걸쳐 약 4,000달러의 API 크레딧을 사용했습니다. 두 개의 악용만 성공했으며, 둘 다 브라우저 샌드박스가 비활성화된 테스트 환경이 필요했습니다. 이는 Firefox의 계층적 보안 아키텍처가 실제 조건에서 이러한 공격을 차단했을 것임을 의미합니다.
Mozilla의 보안 책임자인 Tom Grinstead는 단일 취약점, 심지어 고위험 취약점이라도 실제 Firefox를 손상시키기에는 불충분하다고 지적했습니다. 현대 브라우저는 심층 방어에 의존합니다. 공격자는 의미 있는 악용을 시도하기 위해 여러 약점을 성공적으로 연결해야 합니다.
현재로서는 이러한 비대칭성이 방어자에게 유리합니다. AI는 취약점을 무기화하는 것보다 더 빠르고 저렴하게 버그를 찾을 수 있습니다.
더 넓은 의미: 방어 보안의 새로운 시대
Firefox 협력은 고립된 실험이 아니었습니다. Anthropic은 Claude Opus 4.6이 Linux 커널을 포함한 다른 중요한 오픈 소스 프로젝트 전반에 걸쳐 취약점을 식별하는 데 사용되었으며, 최근 몇 달 동안 프로젝트 전반에 걸쳐 500개 이상의 제로데이 취약점이 발견되었다고 밝혔습니다. Anthropic은 또한 현재 제한된 연구 미리 보기 상태인 Claude Code Security를 출시했으며, 이는 AI 기반 취약점 발견 및 패치 기능을 보안 팀 및 오픈 소스 유지 관리자에게 직접 제공합니다.
사이버 보안 커뮤니티에 대한 시사점은 분명합니다. AI는 방어 보안을 위한 진정한 힘의 증폭기로 부상하고 있습니다. 인간 전문성은 검증, 우선순위 지정 및 수정에 여전히 필수적이지만, AI 시스템은 이제 인간 팀만으로는 불가능한 속도와 규모로 수백만 줄의 복잡한 코드를 스캔할 수 있습니다.
사용자가 지금 해야 할 일
일반 Firefox 사용자의 경우 즉각적인 조치는 간단합니다. Firefox 148 이상으로 업데이트하십시오. 이 협력 과정에서 식별된 모든 고위험 취약점은 패치되었습니다. 아직 업데이트하지 않은 사용자는 즉시 업데이트해야 합니다. 영향을 받은 버전은 보고된 결함에 계속 노출되어 있기 때문입니다.