Attack  ·  Glosarium

Prompt injection

Serangan di mana instruksi berbahaya disembunyikan di dalam teks yang dibaca AI — seperti dokumen, email, atau halaman web — menipu AI agar mengabaikan instruksi aslinya dan melakukan apa yang diinginkan penyerang. Anggaplah itu sebagai setara AI dari memalsukan memo dari CEO dan menyelipkannya ke dalam inbox karyawan. AI tidak dapat secara andal membedakan antara instruksi sah dari operatornya dan instruksi palsu dari penyerang.
Setiap AI yang membaca atau merangkum konten eksternal — email pelanggan, halaman web, dokumen yang diunggah — adalah target potensial. Serangan yang berhasil dapat menyebabkan AI untuk membocorkan data rahasia, melakukan tindakan tidak sah, atau menyebarkan informasi keliru, semuanya tanpa disadari pengguna atau operator.
Referensi
OWASP Top 10 for LLM Applications — LLM01: Prompt InjectionNIST CSRC Glossary: Prompt Injection
Pantau di umpan langsung Lihat bagaimana hal ini terwujud dalam perkembangan keamanan dan tata kelola AI nyata.
Buka umpan →