Indirect prompt injection — AI Security Glossary

定義

ユーザーが直接入力するのではなく、悪意のある指示がAIが自ら取得して読み込む外部コンテンツ内に隠されているプロンプトインジェクションの特定の形式。例えば、ウェブページ、共有ドキュメント、またはカレンダー招待に埋め込まれた見えない指示などです。攻撃者はAIと直接やり取りせず、代わりにAIが最終的に遭遇するデータ内に指示を仕込みます。

なぜ重要か

これは、ウェブを閲覧したり、メールを読んだり、ドキュメントを処理したりするAIアシスタントに特に危険です。なぜなら、攻撃対象領域はインターネット上のどこでもあり得るため、自社システムだけに限定されないからです。研究により、実際のエンタープライズデプロイメント環境における今日の主要なAIツールに対して機能することが確認されています。