定义 一种利用AI护栏的攻击,通过注入经过精心设计的有毒数据来困住基于推理的安全系统在扩展思维循环中,消耗大量计算资源并饥饿共享基础设施中的其他代理。单个有毒文档可以将系统速度降低148倍。 影响分析随着企业依赖推理密集型安全控制来管理AI代理,这些护栏本身就成为了一个漏洞;攻击者可以将安全机制武器化以实现企业规模的拒绝服务。