Attack  ·  用語集

Policy Bypass (AI Agent Trust Policies)

攻撃者が可変的な身元データ(表示名、送信者メタデータ、連絡先情報)を操作して、AIエージェントを呼び出すことができるユーザーまたはサービスを制御する認可ポリシーをバイパスする攻撃。例えば、Discord の表示名を管理者名と一致するように変更して「allowFrom」ポリシーをバイパスする場合などが挙げられます。
AI エージェント認可ポリシーは、認証なしで変更できるユーザー身元メタデータに依存することが多くあります。ポリシーバイパスを発見したユーザーは、権限を昇格させたり、認可されていないエージェントアクションをトリガーしたり、監査トレースを残さずに悪意のあるプロンプトを挿入したりできます。
参考資料
OWASP: Broken Access Control
ライブフィードで追跡 この概念が実際のAIセキュリティ・ガバナンスの動向でどう現れるかを確認。
フィードを開く →