Anthropic Project Glasswing — AI 보안 이니셔티브 로고

cdn.sanity.io

Anthropicが作りながら公開しないと決めたモデル — Claude MythosとAIセキュリティの転換点

Claude Mythos、Project Glasswing、AIサイバーセキュリティ、ゼロデイビジネス

Project Glasswing: Securing critical software for the AI era

Anthropic says its most powerful AI cyber model is too dangerous to release publicly

Anthropic built a model too risky to release

AIモデルが27年間潜んでいたセキュリティの脆弱性を発見しました。セキュリティ専門家が何十年もレビューし、自動化ツールが500万回テストしても見つけられなかったものです。ところが開発した会社は、このモデルを公開しないと決めました。

3秒で要約

Claude Mythos 開発 → 数千件のゼロデイ発見 → 危険すぎるため非公開を決定 → Project Glasswing 始動 → 12社のビッグテック＋40機関にのみ提供

これは何?

2026年4月7日、AnthropicがProject Glasswingを発表しました。要点はシンプルです — Anthropicが開発した最新フロンティアモデルClaude Mythos Previewがソフトウェアの脆弱性を発見しエクスプロイトする能力で人間トップレベルを超えたため、一般には公開しないと決定したのです。

Mythosはサイバーセキュリティに特化した追加訓練なしに、純粋にコーディング能力と推論能力の向上だけでこのレベルに到達しました。SWE-bench Verifiedで93.9%（Opus 4.6は80.8%）、SWE-bench Proで77.8%（Opus 4.6は53.4%）を記録しています。 Theoがひと言で表現しています — 「MythosとOpusの関係は、OpusとSonnetの関係と同じだ」と。

さらに驚くのは具体的な成果です。Firefoxエクスプロイト生成では、Opus 4.6が数百回試みて2件作成したのに対し、Mythosは181件を生み出しました。そして以下の脆弱性を発見しています:

OpenBSDの27年前のバグ
世界で最もセキュアなOSとして知られるOpenBSDで、27年間潜んでいたリモートクラッシュ脆弱性を発見。接続するだけでシステムを無力化できるものでした。
FFmpegの16年前の脆弱性
ほぼすべてのソフトウェアが使用するビデオエンコーダーで、自動化ツールが500万回テストしても見逃した欠陥を検出しました。
Linuxカーネル権限昇格チェーン
複数の脆弱性を自律的に発見・連結し、一般ユーザー権限からシステムの完全掌握までの攻撃経路を構築しました。

181件

Firefoxエクスプロイト数（Opusは2件）

93.9%

SWE-bench Verified スコア

$100M

防御用クレジット投入

これらすべては人間の介入なしに完全自律的に行われました。Mythosが自らコードを読み、脆弱性を探し、エクスプロイトを開発したのです。

何が変わるのか?

核心は「AI企業が自社モデルは危険すぎると判断して公開しないことにした」という前例のない決断です。AnthropicのFrontier Red Teamサイバーリーダー、Newton ChengはVentureBeatのインタビューでこう語っています。

「AIの進歩のスピードを考えると、こうした能力が拡散するのは時間の問題です。安全に展開する意思のない行為者にまで広がる可能性があります。その影響は — 経済、公共安全、国家安全保障の観点から — 深刻なものになりかねません。」
— Newton Cheng, Anthropic Frontier Red Team

	既存のAIセキュリティツール	Claude Mythos
アプローチ	パターンマッチング（既知の脆弱性DB）	推論ベース（コードの文脈理解）
自律性	人が設定したルールに従う	完全自律探索＋エクスプロイト開発
複合攻撃	個別の脆弱性のみ検出	複数脆弱性の自動チェーン化
発見範囲	既知のパターン内	数十年未発見のゼロデイを含む
公開状況	誰でも使用可能	限定パートナーにのみ提供

PlatformerのCasey Newtonはこの状況をこう指摘しています — 「AIモデルの危険性から私たちを守る唯一の方法が、その危険なモデルを先に作ることだという、深く不快な前提の上に立っている」と。

セキュリティ業界の反応はより現実的なものでした。CorridorのCPOで元Facebook/Yahooセキュリティ責任者のAlex Stamosはこう警告しています。

「オープンウェイトモデルがバグ発見でフロンティアモデルに追いつくまで、約6ヶ月しか残っていません。その時点になれば、すべてのランサムウェア組織が痕跡なく脆弱性を発見し武器化できるようになります。」
— Alex Stamos、元Facebook セキュリティ責任者

防御側に残された時間は「数年」ではなく「数ヶ月」というのが業界の共通認識です。

Project Glasswing — 防御側の先手対策

Anthropicの対応がProject Glasswingです。核心となる構造はこうなっています:

12社のビッグテック連合
AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksが参加。競合他社であるGoogleとMicrosoftが同じチームにいることが、この脅威の深刻さを物語っています。
40機関以上への追加アクセス
重要なソフトウェアインフラを構築・維持する40以上の機関にも、Mythos Previewへのアクセス権を提供します。オープンソースエコシステムを優先的に守るという意図です。
$100M使用クレジット＋$4M寄付
防御研究用のモデル使用料をAnthropicが負担し、Linux FoundationとApache Software Foundationへの直接寄付も行います。
責任ある公開パイプライン
発見した脆弱性をオープンソースのメンテナーに一気に送りつけません。専門スタッフが手動で検証した後、メンテナーが対応できるペースで公開します。パッチ後45日のバッファを設けて技術的詳細を公開する仕組みです。

皮肉な状況

Anthropicは「史上最強のサイバーモデルの安全な守護者」を自任していますが、3月にCMS設定ミスでMythos関連の内部文書3,000件が流出し、Claude Codeのソースコード51万行がnpmを通じて3時間公開されたことがあります。どちらも中核システムへの侵害ではありませんでしたが、国家インフラ級のセキュリティツールを任せると言う会社としては、不安を感じさせる出来事でした。

ビジネスの背景 — なぜ今なのか?

Glasswing発表の当日、Anthropicは年間売上$30B（前年比3倍成長）、Google-Broadcomとの3.5GWコンピューティング契約、元Microsoft役員Eric Boydの採用も同時に発表しました。早ければ2026年10月にIPOを目指しているという報道もあります。

THE ELECはこのタイミングをこう分析しています — 「防御イニシアチブという表面の下に、IPOのナラティブ構築、米国防総省との交渉力強化、パートナー企業の支持確保という複合的な意図がある」と。

興味深いのは、CrowdStrikeやPalo Alto Networksのような独自のAIセキュリティ技術を持つ企業が参加したという点です。「自社のセキュリティAIがMythosレベルの攻撃を防げないことを認めたも同然」という解釈も出ています。

ポイント整理：自分に関係する理由

ソフトウェアを作る人は
6ヶ月以内にオープンウェイトモデルも同様の脆弱性発見能力を持つようになります。今からセキュリティパイプラインを見直すべきです。AIセキュリティツールの導入を先延ばしする理由はありません。
企業の意思決定者は
「AIが生み出した脅威をAIで防御する」という新しい枠組みが始まりました。セキュリティ予算と戦略をこの視点で見直す時期です。
AI業界を注視している人は
AI企業が「自社モデルが危険だ」と認めた初めての事例です。これはマーケティングではなく、AI安全性議論の新たな基準点となりえます。規制の議論にも直接的な影響を与えるでしょう。

防御側のスケジュール

Anthropicは90日以内にプロジェクトの成果と教訓を公開報告すると約束しています。それまでが「防御側の先行時間」です。セキュリティ実務者であれば、AnthropicのClaude for Open Sourceプログラムへの申請を検討してみてください。

🔗

さらに深掘りしたい人へ

Project Glasswing 公式ページ

Anthropicの公式発表全文 — ベンチマーク、パートナーコメント、技術詳細を含む

VentureBeat 深掘り分析

Newton Cheng独占インタビューと脆弱性公開パイプラインの詳細説明

Platformer：サイバーセキュリティ専門家たちの反応

Alex Stamosインタビュー — 「オープンウェイトモデルが6ヶ月以内に追いつく」

THE ELEC：危険すぎるAIモデル、Mythos

韓国語による深掘り分析 — IPO連動戦略と米国防総省との対立の背景

Ben's Bites: Anthropic built a model too risky to release

Ben Tossellのニュースレター — Mythosの要点と業界の背景

よくある質問

Mythosを使う方法はありますか?

一般ユーザーには公開されていません。Project Glasswingのパートナー企業、またはオープンソースメンテナーとしてClaude for Open Sourceプログラムに申請することでアクセスできる可能性があります。プレビュー後のAPIの価格は入力$25/出力$125（100万トークン当たり）です。

以前発表されたClaude Code Securityと何が違うのですか?

Claude Code SecurityはOpus 4.6ベースのセキュリティスキャン機能です。Mythosはそのひとつ上 — 脆弱性を見つけるだけでなく、自律的に複数の脆弱性をチェーン化して実際に機能する攻撃経路まで作り出します。量的にもFirefoxエクスプロイトが2件対181件と、次元が違います。

オープンソースプロジェクトのメンテナーですが、突然大量の脆弱性レポートが来ても対応できますか?

Anthropicが専門のトリアージスタッフを雇用し、すべてのレポートを手動で検証してから送ります。一つのプロジェクトに大量に送ることはなく、メンテナーと事前に協議して対応可能なペースで公開するプロセスを整えています。

6ヶ月後にオープンウェイトモデルが追いつけば、攻撃者も同じ能力を持つことになりませんか?

その通りです。だからこそProject Glasswingの核心は時間的な先手にあるのです。防御側が先に脆弱性を発見してパッチを当てることで、攻撃能力が広がる前に攻撃対象自体を減らすという戦略です。完璧ではありませんが、現実的に可能な最善策だというのが業界の共通認識です。