戦略レポート  ·  2026-05-06

OpenAIのGPT-5.5サイバー機能の評価

戦略レポートHigh 影響度United Kingdom
英国AI安全研究所は、OpenAIのGPT-5.5をキャプチャ・ザ・フラッグ形式の演習を使用してサイバー機能タスクで評価し、脆弱性研究と悪用スキルを評価するように設計されました。GPT-5.5は、AISIの企業ネットワーク攻撃シミュレーション全体を完了した2番目のモデル(AnthropicのClaude Mythos Previewの後)であり、人間が約20時間かかると推定される複数ステップの演習です。初期チェックポイントからの結果は、GPT-5.5がClaude Mythosと同様レベルのサイバーパフォーマンスに達していることを示唆しており、複数のフロンティア開発者が高度な攻撃的サイバー機能に収束していることを示しています。
異なる開発者からの2つの独立したフロンティアモデルが、構造化されたテストにおいてエンドツーエンドの自律型サイバー侵入機能を実証しています。これは、高度な攻撃的サイバーAIがもはや一度限りの機能ではなく、フロンティアラボエコシステム全体で再現可能な成果であること、および防御組織がAI増強攻撃に備える時間を圧縮していることを示しています。
レッドチームとサイバー防御リーダーを招集して、AISIが公開した評価方法論を確認し、組織の脅威モデルが複数ステップの自律型侵入を考慮しているかどうかを評価してください。インシデント対応プレイブックを更新して、攻撃者が機械速度で偵察、横展開、および悪用のためにAIを活用するシナリオを含めてください。
出典
UK AI Safety Institute
ライブフィードで見る AIセキュリティとガバナンスの関連情報をさらに見る — 毎朝更新。
フィードを開く →