OpenAIのGPT-5.5サイバー機能の評価

何が起きたか

英国AI安全研究所は、OpenAIのGPT-5.5をキャプチャ・ザ・フラッグ形式の演習を使用してサイバー機能タスクで評価し、脆弱性研究と悪用スキルを評価するように設計されました。GPT-5.5は、AISIの企業ネットワーク攻撃シミュレーション全体を完了した2番目のモデル（AnthropicのClaude Mythos Previewの後）であり、人間が約20時間かかると推定される複数ステップの演習です。初期チェックポイントからの結果は、GPT-5.5がClaude Mythosと同様レベルのサイバーパフォーマンスに達していることを示唆しており、複数のフロンティア開発者が高度な攻撃的サイバー機能に収束していることを示しています。

なぜ重要か

異なる開発者からの2つの独立したフロンティアモデルが、構造化されたテストにおいてエンドツーエンドの自律型サイバー侵入機能を実証しています。これは、高度な攻撃的サイバーAIがもはや一度限りの機能ではなく、フロンティアラボエコシステム全体で再現可能な成果であること、および防御組織がAI増強攻撃に備える時間を圧縮していることを示しています。

必要な対応

レッドチームとサイバー防御リーダーを招集して、AISIが公開した評価方法論を確認し、組織の脅威モデルが複数ステップの自律型侵入を考慮しているかどうかを評価してください。インシデント対応プレイブックを更新して、攻撃者が機械速度で偵察、横展開、および悪用のためにAIを活用するシナリオを含めてください。