定義 攻撃者がAIエージェントの動作、目標、および制約を定義するコア命令(システムプロンプト)を置き換えたり、修正したりする攻撃。システムプロンプトがオーバーライドされると、エージェントは正当なオペレーターの指示ではなく、攻撃者の指示に従う。 なぜ重要かシステムプロンプトは、エージェントが何であるか、何ができるか、どのルールに従わなければならないかを伝える権限である。攻撃者がそれをオーバーライドできれば、他の防御に関係なく、エージェントの動作を完全にコントロールすることができる。