ガイドライン  ·  2026-06-11

Anthropic、Claude Fable 5とMythos 5システムカードを公開 — 詳細なサイバー能力評価、デュアルコンフィグセーフティアーキテクチャ、およびエージェントプロンプトインジェクションベンチマーク結果

ガイドラインHigh 影響度Global
2026年6月9日、Anthropicは一般向けにClaude Fable 5を、制限されたサイバーディフェンダーグループ向けにClaude Mythos 5を詳細なシステムカードとともにリリースしました。主な知見:Mythos 5は現在までに評価された最も能力の高いサイバーモデルであり、エクスプロイト開発においてOpus 4.8をはるかに上回るスコアを獲得しています;Fable 5はサイバーセキュリティ分類器を使用し、サイバー関連クエリが検出された場合、約5%のセッションをOpus 4.8にルーティングしています;Mythos 5は外部のGray Swanプロンプトインジェクションベンチマークで最低(最良)の結果を達成しました;サイバーセキュリティセーフガードの破損は「極めて困難だが不可能ではない」と評価されています;セーフガードなしのMythos 5は化学および生物学研究において「十分なリソースを持つ脅威アクター」を「著しく向上させることができます」。Fable 5の価格は$10/1M入力トークン / $50/1M出力トークン — Mythos Previewの価格の半分以下です。
これは、Mythosスケールでデュアルユース型サイバーリスクを定量化し、それを管理するために使用される特定のセーフガードアーキテクチャを文書化した最初のTier 2システムカードです。分類器を使用した場合であっても、Mythosクラスの能力レベルでのFable 5の公開リリースは、AI支援サイバー攻撃の脅威モデルが根本的に変化したことを意味します:ディフェンダーは現在、敵対者が同等の能力を持つモデルにアクセスしている、またはアクセスするであろうことを想定する必要があります。Gray Swanプロンプトインジェクションベンチマークスコアは、エージェントセーフティ評価フレームワークのための有用な外部参照ポイントです。
Fable 5/Mythos 5システムカードを読んで、組織のAI脅威モデルを更新してください;特に、Gray SwanベンチマークとMETR評価結果を独自のレッドティーミングスコープの参照ポイントとして使用し、Mythosクラスモデルが現在Fable 5経由で一般向けにアクセス可能であることの影響についてクライアントに説明してください。
出典
Anthropic: Claude Fable 5 and Mythos 5 AnnouncementAnthropic System Card PDF: Claude Fable 5 & Claude Mythos 5
ライブフィードで見る AIセキュリティとガバナンスの関連情報をさらに見る — 毎朝更新。
フィードを開く →