定義
AIエージェントの動作または意思決定をハイジャックする攻撃。悪意のある命令をエージェントが消費するデータストリームに注入することで実行されます。例えば、AIコーディングエージェントに送信された偽のエラーレポートは、攻撃者が提供するコードを実行させるようにだますことができます。また、悪意のあるSentry通知はエージェントの意図されたワークフローをオーバーライドする可能性があります。
なぜ重要か
Agentjackingは、エージェントが消費するデータソースに対して暗黙的に信頼することを悪用します。プロンプトインジェクション(LLMを直接攻撃する)とは異なり、agentjackingはエージェントの運用コンテキストを破損させ、正当なエラー信号または命令に従っていると信じながらエージェントが誤動作するようにします。