cf-assets.cloudflare.com

トップハッカーを超えたAIが登場 — Anthropicが非公開にした理由

Project Glasswing, Claude Mythos, AI脆弱性検出, ソフトウェアセキュリティ, wolfSSL開発

Project Glasswing: Securing Critical Software for the AI Era

Project Glasswing: An Initial Update

Anthropic Scales Claude Mythos to Critical Infrastructure in 15+ Countries

世界で最もセキュリティが強固とされるOS、OpenBSD。27年間、誰も発見できなかったバグが存在していました。AIが見つけました。

単独で、自動的に。そのAI、まだ誰も使えないんです。

3秒でわかるまとめ

AIがトップハッカーを超えた → 2万3千件以上の脆弱性を発見 → 公開せず防御連合を結成 → AIセキュリティのルールが変わった

AIセキュリティはまだ「補助ツール」だと思っていませんか？

正直なところ、最近まではその認識が正しかったんです。AIベースのセキュリティスキャナーは既知のパターンを検出する程度で、本物のゼロデイ脆弱性は依然として熟練したセキュリティ研究者の領域でした。

2026年4月、その認識が公式に覆されました。Anthropicが未公開モデル Claude Mythos Preview を発表したのです。ベンチマーク数値がかなり挑発的なんですよ。

83.1%

CyberGym（脆弱性再現）

93.9%

SWE-bench Verified

77.8%

SWE-bench Pro

数値よりも直接的な評価があります。独立セキュリティ研究機関のXBOWは「absolutely unprecedented precision（前例のない精度）」と表現し、英国AI安全研究所は「サイバーレンジを最初から最後まで解決した最初のモデル」と発表しました。

従来のセキュリティAIはバグを見つけると「これは不審です」で止まっていました。Mythosはバグを見つけ、実際の攻撃コードに変換し、複数の脆弱性を連鎖させてより大きな攻撃を構築するところまで行います。バグの特定ではなく、完全な侵入テストを自動実行するんですよ。

27年・16年前のバグを、どうやって見つけたのか

数字で話しましょう。Mythos Previewが1,000以上のオープンソースプロジェクトをスキャンした結果、合計23,019件の問題を発見。このうち6,202件が高リスクまたは深刻な深刻度です。 6つの独立したセキュリティ研究チームが検証した結果、90.6%が本物の脆弱性と確認されました。

ソフトウェア	潜伏期間	リスクレベル	影響
wolfSSL暗号化ライブラリ	CVE-2026-5194	深刻	証明書偽造 — 銀行・メールサイトのなりすましが可能
OpenBSD	27年	高リスク	リモートからシステムクラッシュを引き起こせる
FFmpeg（動画エンコーダー）	16年	高リスク	500万回以上の自動テストが気づかなかったバグ
Linuxカーネル	複数	深刻	一般ユーザー権限からシステム全体の制御奪取

wolfSSLをご存じなくても、あなたのデバイスが使っている可能性は高いです。IoT機器、組み込みシステム、自動車 — 数十億台のデバイスに搭載された暗号化ライブラリです。これを攻撃すれば、ブラウザの南京錠が緑色のままで偽サイトを本物に見せかけることができました。今はパッチ済みです。

Cloudflareはコードベースから2,000件のバグを発見、うち400件が高リスク・深刻レベル。誤検知率は人間のテスターより低かったです。 MozillaはFirefox 150で271件の脆弱性を発見 — Claude Opus 4.6で旧バージョンをスキャンした時より10倍以上多い数ですよ。

なぜ16年前のFFmpegバグを誰も見つけられなかったのか

自動テストが500万回以上実行されても見つかりませんでした。従来のファジャーは「この入力はクラッシュを引き起こすか？」を繰り返し確認するだけです。AIはコードの意味を理解し、精巧なエッジケースを設計します。パターンではなく論理を攻撃するんです。

なぜAnthropicは公開しなかったのか

ここが核心です。Mythos Previewは一般ユーザーが使えません。特定のパートナー組織にのみ限定的にアクセスが許可されており、一般公開は「より強力な安全機能が追加された後」に先送りされました。

単なる「危険だからロック」ではありません。同じAIで攻撃も防御もできる — どちらが先に使うかで結果が決まるという論理です。攻撃者がこのレベルのAIを持つのは時間の問題。だから防御側が先に使うべきという判断で連合を作ったんです。

それが Project Glasswing です。2026年4月に発足した産業防衛連合です。

AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks
— Project Glasswing 設立11社

最初は50のパートナーで始まり、2026年6月には150以上の組織に拡大、15カ国以上が参加しています。韓国も含まれており、Samsung、SK Hynix、SK Telecomがパートナーです。 Anthropicはモデル利用クレジット最大1億ドルとオープンソース財団への直接400万ドル拠出を約束しました。

	従来のセキュリティパラダイム	Glasswing以降
脆弱性発見速度	数か月	数週間
月間高リスク脆弱性発見数	150〜300件	900件以上
パッチ適用所要時間	平均60〜150日	目標2週間以内
誤検知率	高い（ノイズ問題）	人間テスターより低い

成果もすでに出ています。パートナー銀行で150万ドル規模の不正送金が検知・阻止され、Palo Alto Networksは通常の5倍のペースでパッチを適用しています。

今チームがやるべきこと

オープンソース依存関係の把握から始める
wolfSSLのように知らずに使っているライブラリがあります。npm audit、pip-audit、trivyで今すぐ依存ツリーを確認し、GitHub DependabotやSnykで脆弱性アラートを自動化しましょう。
パッチ適用サイクルを短縮する
業界平均のパッチ適用時間は60〜150日です。 AIが発見を数週間に圧縮しても、パッチが追いつかなければ意味がありません。CI/CDパイプラインにセキュリティパッチの自動検証・デプロイの仕組みを組み込むことが今最も急務です。
Claude Securityの順番待ちリストに登録する
Anthropicは企業顧客向けにClaude Securityのパブリックベータを運営しています。Claude Opus 4.7を使った3週間で2,100件の脆弱性がパッチされたという初期数値があります。今すぐ申請しておきましょう。
アーキテクチャ基盤の防御を見直す
CloudflareのGlasswing後の教訓：「パッチだけでは不十分」。 WAF、ゼロトラスト、システム分離などの構造的防御を並行して実施しないと、脆弱性を見つけてもパッチ前に攻撃者が侵入します。
AI vs AI時代を理解する
AI基盤の脆弱性発見の加速はMythosの前から始まっていました。防御チームもAIを使わなければ攻撃速度に追いつけない構造になってきましたよ。