PickleeAI와 개발에 대한 짧은 노트
홈아티클아카이브검색

끝까지 읽는 글

AI와 개발에 관한 변화 중에서 블로그처럼 오래 읽을 수 있는 글만 골라 정리합니다.

© 2026 Picklee

RSSSitemap

글

2026년 3월 31일수정 2026년 3월 31일원문

Anthropic Mythos 유출 — 코딩·사이버보안 SOTA, "역량의 단계적 도약" 확인

Anthropicが내부 테스트 중이던 신규 모델 'Mythos(Claude Mythos/Opus 5)'가 데이터 유출로 공개됐다. 소프트웨어 코딩, 학술 추론, 사이버보안 영역에서 Claude Opus 4.6 대비 "극적으로 높은 점수"를 기록한 것으로 알려졌다. 🔍 왜 주목해야 하나 Anthropicは Mythos를 "역대 가장 강력한 모델"이자 "역량의 단계적 도약(step…

AI
모델
Claude
트렌드

배경 및 맥락

Anthropicは 2026년 3월 26일, 내부 테스트 데이터 캐시가 외부에 노출되는 보안 사고를 통해 차세대 모델 'Mythos'의 존재가 알려졌다. Fortune이 독점 보도한 이 사건은 Anthropic이 공식 출시 전 극비리에 개발 중이던 모델을 조기에 공개하는 결과를 낳았다. Anthropic 측은 사고 발생 후 해당 모델이 "현재까지 만든 것 중 가장 강력한 모델"이며 "역량의 단계적 도약(step change)"을 대표한다고 공식 인정했다.

Claude Mythos는 Opus 5 혹은 'Claude Capybara'라는 코드명으로도 불리며, 소규모 엔터프라이즈 얼리 액세스 그룹에서 현재 비공개 테스트가 진행 중이다.


핵심 내용

  • 코딩: SWE-bench Verified 기준 Claude Opus 4.6(~80.8%) 대비 "극적으로 높은 점수" 기록 (구체적 수치는 NDA로 비공개)
  • 학술 추론: GPQA Diamond, Humanity's Last Exam 등 최상위 추론 벤치마크에서 기존 모델 대비 유의미한 점프
  • 사이버보안: Anthropic이 직접 "현재 다른 어떤 AI 모델보다 훨씬 앞서 있다(far ahead)"고 표현한 유일한 영역. CTF 챌린지, 취약점 분석, 익스플로잇 코드 작성 능력 모두 포함
  • 컴퓨팅 비용: 매우 고비용으로 알려져 있으며, 상용 출시 전 비용 최적화 작업이 진행 중
  • 리스크 프로파일: Anthropic 내부 안전 팀이 이 모델에 대해 별도의 위험성 평가를 수행했으며, 사이버보안 역량과 관련한 전례 없는 수준의 우려를 내부 문서에 명시

경쟁 구도 / 비교

OpenAI는 2026년 3월 5일 GPT-5.4를 출시하며 컨텍스트 윈도우 105만 토큰, 개별 사실 오류율 33% 감소를 달성했다. Mythos는 아직 공개 벤치마크가 없지만, "극적으로 높은 점수"라는 내부 표현은 GPT-5.4보다도 높은 성능을 시사한다. Google DeepMind와 Meta의 Llama 4 계열 역시 2026년 1분기에 주요 업데이트를 단행했으나, 사이버보안 특화 역량에서 Anthropic의 Mythos가 선두를 차지하고 있다는 것이 현재까지의 평가다.


의미

Mythos의 존재는 두 가지 방향에서 산업에 시사점을 준다. 첫째, AI 모델의 역량이 단순 다음 버전 수준 개선이 아닌 질적 도약 단계에 진입했을 가능성이다. Anthropic이 직접 'step change'라고 표현한 것은 내부에서도 이 모델을 이전 세대와 다른 카테고리로 구분하고 있다는 것을 의미한다. 둘째, 사이버보안 AI 역량의 급격한 고도화가 현실화되면서 방어 측보다 공격 측이 먼저 AI를 고도화할 수 있는 위험이 구체화되고 있다. Anthropic 자신도 이 모델의 무분별한 확산을 경계하는 것이 그 방증이다.

더 읽기

같이 읽어볼 만한 글

전체 글 보기
2026년 3월 30일

Anthropic, 데이터 누출로 공개된 차세대 모델 'Claude Mythos' — 사이버보안 역사상 가장 강력한 AI

Anthropicが 비보안 데이터 캐시를 통해 실수로 유출된 내부 코드명 'Capybara'(공개명 Claude Mythos)는 현존 최고 모델인 Claude Opus 4.6 대비 코딩·추론·사이버보안 모든 벤치마크에서 급격한 성능 향상을 보이는 차세대 최대급 모델이다. 🔍 왜 주목해야 하나 Mythos는 단순한 다음 버전 모델이 아니라 Anthropic 스스로 "step…

2026년 3월 30일

Anthropic 'Claude Mythos(Capybara)' 유출 — Opus 4.6 대비 코딩·추론·사이버보안 SOTA, 전례 없는 보안 리스크 공식 경고

Anthropic이 내부 테스트 중이던 차세대 모델 'Claude Mythos(코드명 Capybara)'의 상세 스펙이 unsecured 데이터 스토어를 통해 공개적으로 유출됐다. Anthropic은 이를 '현재까지 개발한 가장 강력한 모델'로 규정하며 코딩·학술 추론·사이버보안 벤치마크에서 Claude Opus 4.6 대비 드라마틱한 수치 향상을 확인했다고 밝혔다. 🔍 왜 주목해야 하나…

2026년 3월 27일

ARC-AGI-3 출시 — 프론티어 모델 전부 1% 미만, AGI와의 간극 재확인

ARC Prize가 3월 25일 ARC-AGI-3을 공식 출시했다. 텍스트 지시 없이 낯선 환경을 탐색하며 목표를 스스로 설정해야 하는 인터랙티브 추론 과제로 구성되며, 인간은 100% 해결하는 반면 GPT-5.4(0.26%), Claude Opus 4.6(0.25%), Gemini 3.1 Pro(0.37%), Grok-4.20(0.00%) 등 최상위 프론티어 모델은 모두 1% 미만을…

2026년 2월 23일

Claude Sonnet 4.6

Claude Sonnet 4.6 is a full upgrade of the model’s skills across coding, computer use, long-reasoning, agent planning, knowledge work, and design. (카테고리: AI 모델, HN 1345점·댓글 1223)