정의
사용자가 악의적인 지시문을 직접 입력하지 않고, AI가 스스로 검색하고 읽는 외부 콘텐츠 내에 숨겨져 있는 프롬프트 주입의 특정 형태입니다. 예를 들어, 웹 페이지, 공유 문서, 또는 캘린더 초대장에 숨겨진 지시문이 포함될 수 있습니다. 공격자는 AI와 직접 상호작용하지 않고, AI가 결국 접하게 될 데이터에 자신의 지시문을 심어놓습니다.
왜 중요한가
이는 웹을 탐색하거나 이메일을 읽거나 문서를 처리하는 AI 어시스턴트에 특히 위험합니다. 왜냐하면 공격 표면이 자신의 시스템에만 국한되지 않고 인터넷의 어느 곳이든 될 수 있기 때문입니다. 연구에 따르면 오늘날 주요 AI 도구들의 실제 엔터프라이즈 배포에서 작동하는 것으로 확인되었습니다.