Feature Article
Project Glasswing 출범 — Anthropic이 AI 사이버 방어를 다자 연합 프로그램으로 전환
배경 및 맥락
AI 모델의 코딩 능력이 높아질수록 보안 영역은 가장 먼저 구조적으로 흔들리는 분야가 된다. 과거에는 취약점 탐지와 익스플로잇 개발이 소수 숙련 연구자의 영역이었지만, 이제는 frontier 모델이 대규모 코드베이스를 읽고 약점을 찾는 속도가 인간을 빠르게 추월하고 있다. 문제는 이 능력이 생산성과 동시에 공격 표면도 키운다는 점이다.
Project Glasswing는 Anthropic이 이 변화를 방어 우위로 먼저 고정하려는 시도다. 단순한 연구 논문이나 시스템 카드가 아니라, 실제 산업 파트너와 오픈소스 유지보수 조직을 묶어 취약점 탐지, 패치, 공개 프로세스를 함께 운영하는 프로그램이라는 점에서 의미가 크다.
핵심 내용
Anthropic은 Claude Mythos Preview가 이미 주요 운영체제와 브라우저를 포함한 핵심 소프트웨어에서 수천 건의 high-severity 취약점을 찾아냈다고 밝혔다. CyberGym 재현 성능은 83.1%로 Opus 4.6의 66.6%를 크게 앞섰고, SWE-bench Pro는 77.8%, Terminal-Bench 2.0은 82.0%를 기록했다. 회사는 40개가 넘는 핵심 조직에 접근권을 제공하고, 최대 1억 달러의 모델 사용 크레딧과 400만 달러의 직접 기부를 약속했다.
또한 일반 공개 대신 제한된 defensive deployment를 택했다는 점이 중요하다. 발표문은 향후 90일 내 학습 결과와 수정된 취약점 정보를 공개하겠다고 했고, 이후에는 입력/출력 토큰당 $25/$125 가격으로 참여 조직에 제공한다고 밝혔다. 이는 고위험 모델 배포에서 통제된 운영과 정책 설계가 제품 기능만큼 중요해졌음을 보여준다.
경쟁 구도 / 비교
기존 보안 AI 시장은 주로 보안 분석 자동화나 코드 스캔 보조 중심이었다. Glasswing는 한 단계 더 나아가 frontier model 자체를 취약점 발굴과 방어 자동화의 핵심 엔진으로 배치한다. 이 점에서 단순 보안 보조 도구와 다르고, 시스템 카드 수준의 위험 고지에 머문 접근보다 실제 산업 배포 모델에 가깝다.
또한 OpenAI, Google, Microsoft가 각각 보안·정책 메시지를 내고 있지만, Anthropic은 다자 연합과 제한적 배포를 결합해 ‘고위험 모델의 책임 있는 상용화’라는 새로운 포지션을 만들고 있다.
의미
이 이슈는 AI 안전 논의가 이론적 위험 서술에서 운영 가능한 산업 메커니즘 설계로 이동했음을 보여준다. 앞으로 보안 분야의 경쟁력은 더 강한 모델을 보유했는지보다, 그 모델을 어떤 공개 정책과 협력 구조 안에서 운용하는지에 따라 갈릴 가능성이 높다.
실무적으로는 DevSecOps, 취약점 공개, 오픈소스 유지보수 프로세스를 AI-assisted 기준으로 다시 설계해야 한다. 특히 보안 책임자는 AI를 기능 확장 도구가 아니라 공격 속도와 방어 속도를 동시에 재정의하는 변수로 봐야 한다.