Attack  ·  用語集

Agentjacking

AIエージェントの動作または意思決定をハイジャックする攻撃。悪意のある命令をエージェントが消費するデータストリームに注入することで実行されます。例えば、AIコーディングエージェントに送信された偽のエラーレポートは、攻撃者が提供するコードを実行させるようにだますことができます。また、悪意のあるSentry通知はエージェントの意図されたワークフローをオーバーライドする可能性があります。
Agentjackingは、エージェントが消費するデータソースに対して暗黙的に信頼することを悪用します。プロンプトインジェクション(LLMを直接攻撃する)とは異なり、agentjackingはエージェントの運用コンテキストを破損させ、正当なエラー信号または命令に従っていると信じながらエージェントが誤動作するようにします。
参考資料
MITRE ATLAS — Adversarial Threat Landscape for AI SystemsOWASP LLM Top 10
ライブフィードで追跡 この概念が実際のAIセキュリティ・ガバナンスの動向でどう現れるかを確認。
フィードを開く →