PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 3월 31일

Anthropic Mythos 유출 — 코딩·사이버보안 SOTA, "역량의 단계적 도약" 확인

Anthropicが내부 테스트 중이던 신규 모델 'Mythos(Claude Mythos/Opus 5)'가 데이터 유출로 공개됐다. 소프트웨어 코딩, 학술 추론, 사이버보안 영역에서 Claude Opus 4.6 대비 "극적으로 높은 점수"를 기록한 것으로 알려졌다.

본문 읽기원문 보기

발행일

2026년 3월 31일

업데이트

2026년 3월 31일

주제

AI
모델
Claude
트렌드
원문 보기

배경 및 맥락

Anthropicは 2026년 3월 26일, 내부 테스트 데이터 캐시가 외부에 노출되는 보안 사고를 통해 차세대 모델 'Mythos'의 존재가 알려졌다. Fortune이 독점 보도한 이 사건은 Anthropic이 공식 출시 전 극비리에 개발 중이던 모델을 조기에 공개하는 결과를 낳았다. Anthropic 측은 사고 발생 후 해당 모델이 "현재까지 만든 것 중 가장 강력한 모델"이며 "역량의 단계적 도약(step change)"을 대표한다고 공식 인정했다.

Claude Mythos는 Opus 5 혹은 'Claude Capybara'라는 코드명으로도 불리며, 소규모 엔터프라이즈 얼리 액세스 그룹에서 현재 비공개 테스트가 진행 중이다.


핵심 내용

  • 코딩: SWE-bench Verified 기준 Claude Opus 4.6(~80.8%) 대비 "극적으로 높은 점수" 기록 (구체적 수치는 NDA로 비공개)
  • 학술 추론: GPQA Diamond, Humanity's Last Exam 등 최상위 추론 벤치마크에서 기존 모델 대비 유의미한 점프
  • 사이버보안: Anthropic이 직접 "현재 다른 어떤 AI 모델보다 훨씬 앞서 있다(far ahead)"고 표현한 유일한 영역. CTF 챌린지, 취약점 분석, 익스플로잇 코드 작성 능력 모두 포함
  • 컴퓨팅 비용: 매우 고비용으로 알려져 있으며, 상용 출시 전 비용 최적화 작업이 진행 중
  • 리스크 프로파일: Anthropic 내부 안전 팀이 이 모델에 대해 별도의 위험성 평가를 수행했으며, 사이버보안 역량과 관련한 전례 없는 수준의 우려를 내부 문서에 명시

경쟁 구도 / 비교

OpenAI는 2026년 3월 5일 GPT-5.4를 출시하며 컨텍스트 윈도우 105만 토큰, 개별 사실 오류율 33% 감소를 달성했다. Mythos는 아직 공개 벤치마크가 없지만, "극적으로 높은 점수"라는 내부 표현은 GPT-5.4보다도 높은 성능을 시사한다. Google DeepMind와 Meta의 Llama 4 계열 역시 2026년 1분기에 주요 업데이트를 단행했으나, 사이버보안 특화 역량에서 Anthropic의 Mythos가 선두를 차지하고 있다는 것이 현재까지의 평가다.


의미

Mythos의 존재는 두 가지 방향에서 산업에 시사점을 준다. 첫째, AI 모델의 역량이 단순 다음 버전 수준 개선이 아닌 질적 도약 단계에 진입했을 가능성이다. Anthropic이 직접 'step change'라고 표현한 것은 내부에서도 이 모델을 이전 세대와 다른 카테고리로 구분하고 있다는 것을 의미한다. 둘째, 사이버보안 AI 역량의 급격한 고도화가 현실화되면서 방어 측보다 공격 측이 먼저 AI를 고도화할 수 있는 위험이 구체화되고 있다. Anthropic 자신도 이 모델의 무분별한 확산을 경계하는 것이 그 방증이다.

이어 읽기

관련 읽을거리

전체 보기
2026년 4월 17일Claude Opus 4.7Anthropic은 신뢰할 수 있고 해석 가능하며 조종 가능한 AI 시스템을 구축하기 위해 노력하는 AI 안전 및 연구 회사입니다.2026년 3월 30일Anthropic, 데이터 누출로 공개된 차세대 모델 'Claude Mythos' — 사이버보안 역사상 가장 강력한 AIAnthropicが 비보안 데이터 캐시를 통해 실수로 유출된 내부 코드명 'Capybara'(공개명 Claude Mythos)는 현존 최고 모델인 Claude Opus 4.6 대비 코딩·추론·사이버보안 모든 벤치마크에서 급격한 성능 향상을 보이는 차세대 최대급 모델이다.2026년 3월 30일Anthropic 'Claude Mythos(Capybara)' 유출 — Opus 4.6 대비 코딩·추론·사이버보안 SOTA, 전례 없는 보안 리스크 공식 경고Anthropic이 내부 테스트 중이던 차세대 모델 'Claude Mythos(코드명 Capybara)'의 상세 스펙이 unsecured 데이터 스토어를 통해 공개적으로 유출됐다. Anthropic은 이를 '현재까지 개발한 가장 강력한 모델'로 규정하며 코딩·학술 추론·사이버보안 벤치마크에서 Claude Opus 4.6 대비 드라마틱한 수치 향상을 확인했다고 밝혔다.2026년 3월 27일ARC-AGI-3 출시 — 프론티어 모델 전부 1% 미만, AGI와의 간극 재확인ARC Prize가 3월 25일 ARC-AGI-3을 공식 출시했다. 텍스트 지시 없이 낯선 환경을 탐색하며 목표를 스스로 설정해야 하는 인터랙티브 추론 과제로 구성되며, 인간은 100% 해결하는 반면 GPT-5.4(0.26%), Claude Opus 4.6(0.25%), Gemini 3.1 Pro(0.37%), Grok-4.20(0.00%) 등 최상위 프론티어 모델은 모두 1% 미만을…