Attack  ·  用語集

Indirect prompt injection

ユーザーが直接入力するのではなく、悪意のある指示がAIが自ら取得して読み込む外部コンテンツ内に隠されているプロンプトインジェクションの特定の形式。例えば、ウェブページ、共有ドキュメント、またはカレンダー招待に埋め込まれた見えない指示などです。攻撃者はAIと直接やり取りせず、代わりにAIが最終的に遭遇するデータ内に指示を仕込みます。
これは、ウェブを閲覧したり、メールを読んだり、ドキュメントを処理したりするAIアシスタントに特に危険です。なぜなら、攻撃対象領域はインターネット上のどこでもあり得るため、自社システムだけに限定されないからです。研究により、実際のエンタープライズデプロイメント環境における今日の主要なAIツールに対して機能することが確認されています。
参考資料
OWASP Top 10 for LLM Applications — LLM01: Prompt Injection
ライブフィードで追跡 この概念が実際のAIセキュリティ・ガバナンスの動向でどう現れるかを確認。
フィードを開く →