Anthropic Project Glasswing — AI 보안 이니셔티브 로고

cdn.sanity.io

Anthropic이 만들었지만 공개하지 않기로 한 모델 — Claude Mythos와 AI 보안의 전환점

Claude Mythos, Project Glasswing, AI 사이버보안, 제로데이AI 안전

Project Glasswing: Securing critical software for the AI era

Anthropic says its most powerful AI cyber model is too dangerous to release publicly

Anthropic built a model too risky to release

AI 모델이 27년간 숨어 있던 보안 취약점을 찾아냈어요. 보안 전문가들이 수십 년간 리뷰하고, 자동화 도구가 500만 번 테스트해도 못 찾은 것을요. 그런데 만든 회사는 이 모델을 공개하지 않기로 했습니다.

3초 요약

Claude Mythos 개발 → 수천 건 제로데이 발견 → 너무 위험해서 비공개 결정 → Project Glasswing 출범 → 12개 빅테크 + 40개 기관에만 제공

이게 뭔데?

2026년 4월 7일, Anthropic이 Project Glasswing을 발표했어요. 핵심은 간단해요 — Anthropic이 만든 최신 프론티어 모델 Claude Mythos Preview가 소프트웨어 취약점을 찾고 익스플로잇하는 데 인간 최고 수준을 넘어섰고, 그래서 일반에게 공개하지 않기로 결정했다는 거예요.

Mythos는 별도의 사이버보안 특화 훈련 없이, 순수하게 코딩 능력과 추론 능력의 향상만으로 이 수준에 도달했어요. SWE-bench Verified에서 93.9%(Opus 4.6은 80.8%), SWE-bench Pro에서 77.8%(Opus 4.6은 53.4%)를 기록했고요. Theo가 딱 한 마디로 정리했는데 — "Mythos는 Opus에게, Opus가 Sonnet에게인 것과 같은 관계"라고요.

더 무서운 건 구체적인 성과예요. Firefox 익스플로잇 생성에서 Opus 4.6이 수백 번 시도해 2개를 만들었을 때, Mythos는 181개를 만들어냈어요. 그리고 이런 취약점들을 발견했습니다:

OpenBSD 27년 된 버그
세계에서 가장 보안이 강한 OS로 알려진 OpenBSD에서, 27년간 숨어 있던 원격 크래시 취약점을 발견. 연결만으로 시스템을 무력화할 수 있었어요.
FFmpeg 16년 된 취약점
거의 모든 소프트웨어가 쓰는 비디오 인코더에서, 자동화 도구가 500만 번 테스트하고도 놓친 결함을 잡아냈어요.
Linux 커널 권한 상승 체인
여러 취약점을 자율적으로 발견하고 연결해서, 일반 사용자 권한에서 시스템 완전 장악까지의 공격 경로를 만들어냈어요.

181개

Firefox 익스플로잇 (Opus는 2개)

93.9%

SWE-bench Verified 점수

$100M

방어용 크레딧 투입

이 모든 건 사람의 개입 없이 완전 자율적으로 이루어졌어요. Mythos가 알아서 코드를 읽고, 취약점을 찾고, 익스플로잇을 개발한 거예요.

뭐가 달라지는 건데?

핵심은 "AI 기업이 자기가 만든 모델이 너무 위험해서 공개하지 않기로 했다"는 전례 없는 결정이에요. Anthropic의 Frontier Red Team 사이버 리더 Newton Cheng은 VentureBeat 인터뷰에서 이렇게 말했어요.

"AI 진보의 속도를 감안하면, 이런 능력이 확산되는 건 시간문제입니다. 안전하게 배포할 의지가 없는 행위자들에게까지요. 그 파장은 — 경제, 공공안전, 국가안보 측면에서 — 심각할 수 있습니다."
— Newton Cheng, Anthropic Frontier Red Team

	기존 AI 보안 도구	Claude Mythos
접근법	패턴 매칭 (알려진 취약점 DB)	추론 기반 (코드 맥락 이해)
자율성	사람이 설정한 규칙 따름	완전 자율 탐색 + 익스플로잇 개발
복합 공격	개별 취약점만 탐지	여러 취약점 자동 체이닝
발견 범위	알려진 패턴 내	수십 년 미발견 제로데이 포함
공개 여부	누구나 사용 가능	제한된 파트너에게만 제공

Platformer의 Casey Newton은 이 상황을 이렇게 짚었어요 — "AI 모델의 위험성으로부터 우리를 보호하는 유일한 방법이 그 위험한 모델을 먼저 만드는 것이라는, 깊이 불편한 전제 위에 서 있다"고요.

보안 업계의 반응은 더 현실적이었어요. Corridor의 CPO이자 전 Facebook/Yahoo 보안 책임자였던 Alex Stamos는 이렇게 경고했습니다.

"오픈웨이트 모델이 버그 발견에서 프론티어 모델을 따라잡는 데 약 6개월밖에 남지 않았습니다. 그 시점이 되면 모든 랜섬웨어 조직이 흔적 없이 취약점을 찾아 무기화할 수 있게 됩니다."
— Alex Stamos, 전 Facebook 보안 책임자

방어자에게 남은 시간은 "몇 년"이 아니라 "몇 달"이라는 게 업계의 공통된 진단이에요.

Project Glasswing — 방어자의 선제 무장

Anthropic의 대응은 Project Glasswing이에요. 핵심 구조는 이래요:

12개 빅테크 연합
AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks가 참여. 경쟁사인 Google과 Microsoft가 한 팀이라는 게 이 위협의 심각성을 보여줘요.
40개+ 추가 기관 접근
핵심 소프트웨어 인프라를 구축하거나 유지하는 40개 이상의 기관에도 Mythos Preview 접근권을 제공해요. 오픈소스 생태계를 우선 보호하겠다는 의도예요.
$100M 사용 크레딧 + $4M 기부
방어 연구용 모델 사용료를 Anthropic이 부담하고, Linux Foundation과 Apache Software Foundation에 직접 기부까지 해요.
책임 있는 공개 파이프라인
발견된 취약점을 오픈소스 메인테이너들에게 무더기로 보내지 않아요. 전문 인력이 수동 검증한 뒤, 메인테이너가 감당할 수 있는 속도로 공개해요. 패치 후 45일 버퍼를 두고 기술 세부 사항을 공개하는 구조예요.

아이러니한 상황

Anthropic이 "역대 최강 사이버 모델의 안전한 수호자"를 자처하고 있지만, 3월에 CMS 설정 오류로 Mythos 관련 내부 문서 3,000개가 유출됐고, Claude Code 소스코드 51만 줄이 npm을 통해 3시간 동안 공개된 적이 있어요. 둘 다 핵심 시스템 침해는 아니었지만, 국가 인프라급 보안 도구를 맡기겠다는 회사치고는 불안한 장면이었습니다.

비즈니스 맥락 — 왜 지금?

Glasswing 발표 당일, Anthropic은 연간 매출 $30B(전년 대비 3배 성장), Google-Broadcom과의 3.5GW 컴퓨팅 계약, 전 Microsoft 임원 Eric Boyd 영입도 함께 공개했어요. 빠르면 2026년 10월 IPO를 추진 중이라는 보도도 있고요.

디일렉(THE ELEC)은 이 타이밍을 이렇게 분석했어요 — "방어 이니셔티브라는 표면 아래에 IPO 내러티브 구축, 미 국방부 갈등에서의 협상력 강화, 파트너 기업들의 지지 확보라는 복합적 의도가 있다"고요.

흥미로운 건 CrowdStrike, Palo Alto Networks 같은 독자 AI 보안 기술을 가진 기업들이 참여했다는 점이에요. "자사의 보안 AI가 Mythos급 공격을 막을 수 없다는 걸 인정한 셈"이라는 해석도 나오고 있습니다.

핵심만 정리: 이게 나한테 왜 중요한데?

소프트웨어를 만드는 사람이라면
6개월 안에 오픈웨이트 모델도 비슷한 취약점 발견 능력을 갖게 돼요. 지금부터 보안 파이프라인을 재정비해야 해요. AI 보안 도구 도입을 미룰 이유가 없어요.
기업 의사결정자라면
"AI가 만든 보안 위협에 AI로 방어한다"는 새 패러다임이 시작됐어요. 보안 예산과 전략을 이 관점에서 재검토할 시점이에요.
AI 업계를 지켜보는 사람이라면
AI 기업이 "자기 모델이 위험하다"고 인정한 첫 사례예요. 이건 마케팅이 아니라, AI 안전 논의의 새로운 기준점이 될 수 있어요. 규제 논의에도 직접적 영향을 줄 거예요.

방어자의 시간표

Anthropic은 90일 내에 프로젝트 성과와 교훈을 공개 보고하겠다고 약속했어요. 그때까지가 "방어자 선점 시간"이에요. 보안 실무자라면 Anthropic의 Claude for Open Source 프로그램 신청을 고려해보세요.

🔗

더 깊이 파고 싶다면

Project Glasswing 공식 페이지

Anthropic의 발표 전문 — 벤치마크, 파트너 코멘트, 기술 세부사항 포함

VentureBeat 심층 분석

Newton Cheng 독점 인터뷰와 취약점 공개 파이프라인 상세 설명

Platformer: 사이버보안 전문가들의 반응

Alex Stamos 인터뷰 — "오픈웨이트 모델이 6개월 안에 따라잡는다"

디일렉: 너무 위험한 AI 모델, 미토스

한국어 심층 분석 — IPO 연계 전략과 미 국방부 갈등 맥락

Ben's Bites: Anthropic built a model too risky to release

Ben Tossell 뉴스레터 — Mythos 핵심 요약과 업계 맥락

자주 묻는 질문

Mythos를 쓸 수 있는 방법이 있나요?

일반 사용자에게는 공개되지 않아요. Project Glasswing 파트너 기업이나, 오픈소스 메인테이너로서 Claude for Open Source 프로그램에 신청하면 접근 가능성이 있어요. 프리뷰 이후 API 가격은 입력 $25/출력 $125 (100만 토큰당)이에요.

이전에 발표된 Claude Code Security와 뭐가 다른 건가요?

Claude Code Security는 Opus 4.6 기반의 보안 스캐닝 기능이에요. Mythos는 그보다 한 단계 위 — 취약점을 찾을 뿐 아니라 자율적으로 여러 취약점을 체이닝해서 실제 작동하는 공격 경로까지 만들어내요. 양적으로도 Firefox 익스플로잇이 2개 vs 181개로 차원이 달라요.

오픈소스 프로젝트 메인테이너인데, 갑자기 취약점 리포트가 쏟아지면 감당이 되나요?

Anthropic이 전문 트리아지 인력을 계약해서 모든 리포트를 수동 검증한 뒤 보내요. 한 프로젝트에 대량으로 보내지 않고, 메인테이너와 먼저 협의해서 감당 가능한 속도로 공개하는 프로세스를 갖추고 있어요.

6개월 뒤 오픈웨이트 모델이 따라잡으면, 이미 공격자도 같은 능력을 갖게 되는 거 아닌가요?

맞아요. 그래서 Project Glasswing의 핵심이 시간 선점이에요. 방어자가 먼저 취약점을 찾고 패치해서, 공격 능력이 확산되기 전에 공격 표면 자체를 줄이겠다는 전략이에요. 완벽하진 않지만 현실적으로 가능한 최선이라는 게 업계 중론이에요.