Attack  ·  용어집

Indirect Prompt Injection via Workspace Artifacts

개발자의 작업 공간(README, 설정 파일 또는 프로젝트 디렉토리 이름)의 파일이나 아티팩트에 악의적인 지시사항이 포함되어 있어 AI 에이전트가 이를 소비하고 실행하는 공격입니다. 개발자는 악의적인 저장소를 복제하면서 AI의 컨텍스트와 지시사항이 오염되었다는 사실을 인식하지 못할 수 있습니다.
직접 프롬프트 주입(채팅 인터페이스와의 상호 작용이 필요함)과 달리, 간접 주입은 저장소 복제 및 공유 코드베이스를 통해 퍼집니다. 단일 악의적 저장소는 이를 열어본 모든 개발자의 AI 에이전트를 조용히 손상시켜 코드 주입 또는 데이터 유출을 가능하게 합니다.
참고 자료
OWASP LLM Top 10
라이브 피드에서 추적 이 개념이 실제 AI 보안·거버넌스 동향에서 어떻게 나타나는지 확인하세요.
피드 열기 →