Attack  ·  术语库

Indirect Prompt Injection via Workspace Artifacts

一种攻击方式,其中恶意指令被嵌入到开发者工作区内的文件或工件中(如README、配置文件或项目目录名称),随后AI代理会使用并执行这些指令。开发者可能没有意识到克隆恶意仓库已经污染了AI的上下文和指令。
与直接提示注入不同(直接提示注入需要与聊天界面交互),间接注入通过仓库克隆和共享代码库传播。单个恶意仓库可以静默地危害打开它的每个开发者的AI代理,从而实现代码注入或数据泄露。
参考资料
OWASP LLM Top 10
在实时动态中跟踪 了解这一概念在真实 AI 安全与治理事件中的体现。
打开动态 →