Prompt injection — AI Security Glossary | eyeon.ai

Definisi

Serangan di mana instruksi berbahaya disembunyikan di dalam teks yang dibaca AI — seperti dokumen, email, atau halaman web — menipu AI agar mengabaikan instruksi aslinya dan melakukan apa yang diinginkan penyerang. Anggaplah itu sebagai setara AI dari memalsukan memo dari CEO dan menyelipkannya ke dalam inbox karyawan. AI tidak dapat secara andal membedakan antara instruksi sah dari operatornya dan instruksi palsu dari penyerang.

Mengapa penting

Setiap AI yang membaca atau merangkum konten eksternal — email pelanggan, halaman web, dokumen yang diunggah — adalah target potensial. Serangan yang berhasil dapat menyebabkan AI untuk membocorkan data rahasia, melakukan tindakan tidak sah, atau menyebarkan informasi keliru, semuanya tanpa disadari pengguna atau operator.

Temuan tentang topik ini (55)

Agentjacking: AI Coding Agents Hijacked via Sentry MCP Prompt Injection Bypass Autentikasi Host-Header BadHost Starlette — Mempengaruhi vLLM dan Alat Berbasis FastAPI Eclipse Theia AI Chat — Markdown Image Tags Enable Prompt-Injection-Driven Data Exfiltration (CVE-2026-22551)Eclipse Theia AI Chat — Nama File/Direktori Workspace Disuntikkan ke dalam System Prompt AI (CVE-2026-44688)Worm Supply-Chain Shai-Hulud/Hades PyPI Menargetkan Paket AI/ML dengan LLM Scanner Evasion dan Credential-Wiper Daemon Rantai Eskalasi Privilese LiteLLM Low-Privilege → Admin → RCE (CVSS 9.9, Obsidian Security)Panduan Bersama CISA + G7: "Software Bill of Materials untuk AI – Elemen Minimum"Varonis SearchLeak (CVE-2026-42824) — One-Click Data Exfiltration Chain dalam Microsoft 365 Copilot Enterprise Search, Patched OpenClaw Zalo allowFrom Policy Bypass via Mutable Contact Display Metadata (CVE-2026-53857)TrueFoundry AI Gateway — Integrasi Lasso Security untuk Perlindungan GenAI Terpusat Spring AI Vector Stores — Injeksi Karakter Khusus Memungkinkan Eksekusi Query Arbitrer di Elasticsearch, OpenSearch, dan GemFire Kampanye Shai-Hulud/Hades: PyPI Supply-Chain Worm Menyuntikkan Prompt Evasion AI Scanner dan Backdoor Konfigurasi AI Coding Agent Rantai RCE LangGraph: SQL Injection + Deserialisasi msgpack dalam Stateful Agent Checkpointer (CVE-2025-67644 + CVE-2026-28277)Google Menerbitkan Panduan Keamanan Agen WebMCP — Manifes Berbahaya dan Output Alat Terkontaminasi sebagai Vektor Serangan Utama dengan Tindakan Balasan Deterministik dan Probabilistik Anthropic Menerbitkan Kartu Sistem Claude Fable 5 dan Mythos 5 — Evaluasi Kemampuan Siber Terperinci, Arsitektur Keamanan Dual-Config, dan Hasil Benchmark Prompt-Injection Agentic Laporan CSA / Adversa AI AIRQ: 98% Agen AI Produksi Membawa Trifecta Mematikan — Hanya 11% Terlindungi dengan Memadai Worm Miasma Meningkat ke Peretasan AI Coding Agent — 73 Repositori GitHub Microsoft Dinonaktifkan Setelah Injeksi Payload SessionStart Hook CSA Labs: AI Agent Lethal Trifecta — 98% dari Agen Produksi Secara Simultan Menggabungkan Akses Data Sensitif, Input Tidak Terpercaya, dan Kemampuan Tindakan Keluar Blog Keamanan Microsoft: Bypass Izin CI/CD dalam Claude Code GitHub Actions Memungkinkan Kompromi Rantai Pasokan — Panduan Remediasi Dipublikasikan OpenAI Merilis Mode Lockdown ChatGPT — Kontrol Produksi Built-In Pertama yang Menargetkan Prompt-Injection Data Exfiltration Penelitian Keamanan Microsoft: Mengamankan Saluran CI/CD Terhadap Ancaman AI Agentic — Studi Kasus Claude Code GitHub Action Noma Meluncurkan Agentic Access Control — Dynamic Registry, Identity, dan Policy Enforcement untuk AI Agents dan MCP Servers CVE-2026-42074 (CVSS 9.3): OpenClaude Coding-Agent CLI — LLM Dapat Menonaktifkan Sandboxnya Sendiri melalui Parameter Schema yang Terbuka OWASP Agent Memory Guard Dirilis — Pertahanan Runtime Open-Source untuk Agentic Memory Poisoning (ASI06)Microsoft Meluncurkan MXC — Sandbox Berlapis Kernel OS untuk AI Agents, dengan OpenAI dan Nvidia sebagai Launch Partners Cyberhaven Menerbitkan Panduan Keamanan MCP Enterprise — Tool Poisoning, Indirect Prompt Injection, dan Shadow MCP sebagai Kategori Risiko Utama Palo Alto Networks Menyelesaikan Akuisisi Portkey, Meluncurkan Prisma AIRS AI Gateway sebagai Agentic Control Plane arXiv: 'Plant, Persist, Trigger' — Sleeper Attack Research Formalises Cross-Interaction Agent Memory Poisoning sebagai Distinct Threat Class Kerentanan Deserialisasi LangChain Memungkinkan Eksekusi Kode Jarak Jauh melalui Daftar Izin Objek yang Terlalu Luas — CVE-2026-44843 (CVSS 8.2)CVE-2026-41863: Nama File yang Dipengaruhi LLM Mencapai Path.resolve Sebelum File Write dalam Spring AI Anthropic Skills API — Path Traversal Workflow Agentic Sandbox AI Agents Pemerintah Singapura: Indirect Prompt Injection yang Memungkinkan RCE Dikonfirmasi sebagai Vektor Serangan Agentic Produksi Teratas Sandbox AI Agents Pemerintah Singapore–Google: Indirect Prompt Injection Diidentifikasi sebagai Risiko Keamanan Siber Utama dalam Agentic Deployments Produksi Memperkenalkan RAMPART dan Clarity: Alat Open Source untuk Membawa Keamanan ke dalam Alur Kerja Pengembangan Agent Anthropic Diam-diam Menambal Celah Bypass Sandbox Kode Claude; Bypass Kedua dalam Lima Bulan, Tidak Ada CVE yang Dikeluarkan CVE-2026-45244: Ringkasan Ekstensi Browser dengan Otorisasi yang Hilang Memungkinkan Pembajakan Otomasi Agentic melalui Konten Berbahaya Model Pertahanan WARD Melindungi Web Agent Terhadap Prompt Injection dengan Recall Hampir Sempurna Ancaman AI Memperluas Permukaan Serangan di Pasar Berkembang — Vektor Serangan Baru Melampaui Deteksi Tanda Tangan Lyrie.ai Merilis Agent Trust Protocol (ATP)—Standar Terbuka Pertama untuk Verifikasi Kriptografi AI Agent Kerangka Kerja Heimdallr Mendeteksi Risiko Keamanan yang Diinduksi LLM dalam Alur Kerja GitHub CI Laporan Pentesting Cobalt: Sistem AI Menunjukkan Kepadatan Cacat Parah 2.5x Lebih Tinggi Daripada Aplikasi Legacy Injeksi Prompt Tidak Langsung Gemini CLI Memungkinkan Kompromi Rantai Pasokan (CVSS 10.0)Kerentanan Batas Filesystem NanoClaw Container Agent Memungkinkan Pembacaan/Penulisan Host CISA dan Mitra Internasional Menerbitkan Penasihat Bersama tentang Penyebaran Agentic AI yang Aman Kelemahan Eksekusi Perintah Sistemik dalam Transportasi STDIO Model Context Protocol Mempengaruhi 200.000 Server Agen AI Forcepoint Mengungkap 10 Muatan Indirect Prompt Injection In-the-Wild yang Menargetkan AI Agents OpenAI Merilis Model Privacy Filter untuk Deteksi dan Redaksi PII Kerentanan Sandbox Escape pada Google Antigravity AI Agent Manager 'Comment and Control': Injeksi Prompt melalui Komentar GitHub Membahayakan Claude Code, Gemini CLI, dan GitHub Copilot ShareLeak / PipeLeak: Microsoft Copilot Studio dan Salesforce Agentforce yang Sudah Dipatch Masih Melakukan Exfiltrasi Data melalui Prompt Injection Prompt Injection: OWASP #1 LLM Risk Terus Meningkat di 2026 Google DeepMind Memetakan Enam Kategori Perangkap AI Agent Berbasis Web Google DeepMind Menerbitkan Taksonomi 'AI Agent Traps': Enam Kategori Serangan terhadap Agen Otonom Inisiatif Standar AI Agent NIST Dimulai dengan Sesi Mendengarkan April Laporan CIS: Prompt Injections — Ancaman Inheren terhadap Generative AI Keracunan Alat Protokol MCP melalui Pendaftaran Server Berbahaya

Referensi

OWASP Top 10 for LLM Applications — LLM01: Prompt Injection NIST CSRC Glossary: Prompt Injection

Pantau di umpan langsung Lihat bagaimana hal ini terwujud dalam perkembangan keamanan dan tata kelola AI nyata.