FEATURE ARTICLE
Anthropic Mythos 유출 — 코딩·사이버보안 SOTA, "역량의 단계적 도약" 확인
📌 핵심 요약 Anthropicが내부 테스트 중이던 신규 모델 'Mythos(Claude Mythos/Opus 5)'가 데이터 유출로 공개됐다. 소프트웨어 코딩, 학술 추론, 사이버보안 영역에서 Claude Opus 4.6 대비 "극적으로 높은 점수"를 기록한 것으로 알려졌다. 🔍 왜 주목해야 하나 Anthropicは Mythos를 "역대 가장 강력한 모델"이자 "역량의 단계적 도약(step change)"으로 표현했다. 특히 사이버보안 분야에서 "다른 어떤 AI 모델보다 훨씬 앞서 있다"고 밝혀, 이 모델이 단순 성능 개선이 아닌 질적 도약임을 시사한다. 소규모 얼리 액세스 고객으로만 테스트를 제한한다는 것 자체가 Anthropic 내부에서도 이 모델의 리스크 프로파일을 기존 모델과 다르게 보고 있다는 방증이다. ⚡ 실무 시사점 AI-assisted 사이버 공격의 복잡성이 급격히 높아질 수 있으므로, 보안 레드팀 운영 방식 및 AI 거버넌스 정책을 지금 바로 재검토해야 할 시점이다.
배경 및 맥락
Anthropicは 2026년 3월 26일, 내부 테스트 데이터 캐시가 외부에 노출되는 보안 사고를 통해 차세대 모델 'Mythos'의 존재가 알려졌다. Fortune이 독점 보도한 이 사건은 Anthropic이 공식 출시 전 극비리에 개발 중이던 모델을 조기에 공개하는 결과를 낳았다. Anthropic 측은 사고 발생 후 해당 모델이 "현재까지 만든 것 중 가장 강력한 모델"이며 "역량의 단계적 도약(step change)"을 대표한다고 공식 인정했다.
Claude Mythos는 Opus 5 혹은 'Claude Capybara'라는 코드명으로도 불리며, 소규모 엔터프라이즈 얼리 액세스 그룹에서 현재 비공개 테스트가 진행 중이다.
핵심 내용
- 코딩: SWE-bench Verified 기준 Claude Opus 4.6(~80.8%) 대비 "극적으로 높은 점수" 기록 (구체적 수치는 NDA로 비공개)
- 학술 추론: GPQA Diamond, Humanity's Last Exam 등 최상위 추론 벤치마크에서 기존 모델 대비 유의미한 점프
- 사이버보안: Anthropic이 직접 "현재 다른 어떤 AI 모델보다 훨씬 앞서 있다(far ahead)"고 표현한 유일한 영역. CTF 챌린지, 취약점 분석, 익스플로잇 코드 작성 능력 모두 포함
- 컴퓨팅 비용: 매우 고비용으로 알려져 있으며, 상용 출시 전 비용 최적화 작업이 진행 중
- 리스크 프로파일: Anthropic 내부 안전 팀이 이 모델에 대해 별도의 위험성 평가를 수행했으며, 사이버보안 역량과 관련한 전례 없는 수준의 우려를 내부 문서에 명시
경쟁 구도 / 비교
OpenAI는 2026년 3월 5일 GPT-5.4를 출시하며 컨텍스트 윈도우 105만 토큰, 개별 사실 오류율 33% 감소를 달성했다. Mythos는 아직 공개 벤치마크가 없지만, "극적으로 높은 점수"라는 내부 표현은 GPT-5.4보다도 높은 성능을 시사한다. Google DeepMind와 Meta의 Llama 4 계열 역시 2026년 1분기에 주요 업데이트를 단행했으나, 사이버보안 특화 역량에서 Anthropic의 Mythos가 선두를 차지하고 있다는 것이 현재까지의 평가다.
의미
Mythos의 존재는 두 가지 방향에서 산업에 시사점을 준다. 첫째, AI 모델의 역량이 단순 다음 버전 수준 개선이 아닌 질적 도약 단계에 진입했을 가능성이다. Anthropic이 직접 'step change'라고 표현한 것은 내부에서도 이 모델을 이전 세대와 다른 카테고리로 구분하고 있다는 것을 의미한다. 둘째, 사이버보안 AI 역량의 급격한 고도화가 현실화되면서 방어 측보다 공격 측이 먼저 AI를 고도화할 수 있는 위험이 구체화되고 있다. Anthropic 자신도 이 모델의 무분별한 확산을 경계하는 것이 그 방증이다.