何が起きたか
英国AI Security Institute (AISI)は、英国政府を代表して展開前評価を実施し、2026年5月13日に、AnthropicのClaude Mythos PreviewとOpenAIのGPT-5.5が、自律型サイバータスク完了に関する全ての過去の予測トレンドを大幅に超えたことを示す独立した研究を公表した。AISIは以前、Frontier Modelsの80%信頼度サイバータイム地平線が約5ヶ月ごとに2倍になると推定していた(2025年11月は8ヶ月ごとの2倍化から低下)。Mythos PreviewとGPT-5.5は現在、測定されたすべてのトレンドラインを上回っている。Mythosは両方のAISIサイバーレンジを完了した最初のモデルとなった(「The Last Ones」の32ステップ攻撃を10回中6回で解く、および以前未解決の「Cooling Tower」を10回中3回で完了)。METRからの独立した研究は、2024年後半以降、約4ヶ月の2倍化時間を裏付けた。
なぜ重要か
AISI報告書は、Frontier AI機能が過去のモデルが予測したより速く加速していることの定量的で政府支援を受けた証拠を提供する。5ヶ月から4ヶ月の2倍化への転換(およびClaude MythosとGPT-5.5の両方のサイバーレンジでの上振れ)は、機能スケーリングの不連続性を示唆している。これは、Palo Altoと議会議員が引用した3~5ヶ月のウィンドウを直接支える。自律型サイバータスクの複雑性が4~5ヶ月ごとに2倍になっている場合、組織は現世代のモデルが多段階攻撃を自律的に実行できるようになる前に、防御を強化するための約1つの2倍化サイクルを持つ。AISIは、実世界の状況を反映した、より要求の厳しい評価(新しいサイバーレンジ、アクティブなサイバー防御)を開発しており、将来の機能ベンチマーキングのためのベースラインを確立している。
必要な対応
CISOは、脆弱性検出とパッチ加速プログラムの計画地平線として、3~5ヶ月のウィンドウを使用すべきである。内部脆弱性トリアージとパッチデプロイメント速度を、Frontier Modelsが新しい欠陥を特定する速度に対してベンチマークする。現在のパッチング時間(しばしば30~60日)がAI支援の悪用速度を考慮した場合に十分であるかどうかを評価する。パッチが遅れている場合でも、露出を減らす「ゼロスタンディング特権」アーキテクチャと「侵害を想定する」姿勢の採用を検討する。