Attack  ·  Glosarium

Indirect Prompt Injection via Workspace Artifacts

Serangan di mana instruksi berbahaya disematkan dalam file atau artefak dalam ruang kerja pengembang (README, file konfigurasi, atau nama direktori proyek), yang kemudian dikonsumsi dan dieksekusi oleh agen AI. Pengembang mungkin tidak menyadari bahwa mengkloning repositori berbahaya telah meracuni konteks dan instruksi AI.
Tidak seperti injeksi prompt langsung (yang memerlukan interaksi dengan antarmuka obrolan), injeksi tidak langsung menyebar melalui kloning repositori dan basis kode bersama. Satu repositori berbahaya dapat secara diam-diam mengompromikan agen AI setiap pengembang yang membukanya, memungkinkan injeksi kode atau ekfiltrasi data.
Referensi
OWASP LLM Top 10
Pantau di umpan langsung Lihat bagaimana hal ini terwujud dalam perkembangan keamanan dan tata kelola AI nyata.
Buka umpan →