Sandbox AI Agents Pemerintah Singapore–Google: Indirect Prompt Injection Diidentifikasi sebagai Risiko Keamanan Siber Utama dalam Agentic Deployments Produksi

Apa yang terjadi

Pada 20 Mei 2026, Cyber Security Agency (CSA) Singapore, GovTech Singapore, IMDA, dan Google menerbitkan temuan dari Sandbox AI Agents yang pertama di dunia yang dilakukan selama sekitar empat bulan dari Agustus 2025. Sandbox menguji computer-use agents di tiga use case sektor publik yang nyata: automated quality assurance dari layanan digital pemerintah, AI safety testing dari chatbots yang di-deploy, dan social assistance application guidance. Di semua use case, risiko keamanan siber paling menonjol yang diidentifikasi adalah indirect prompt injection — khususnya, risiko bahwa sebuah agent dapat ditipu untuk melakukan tindakan yang tidak diinginkan termasuk remote code execution (RCE) melalui konten berbahaya yang dihadapinya di lingkungannya. Laporan juga mengidentifikasi human oversight calibration, data protection selama agent-data interaction, dan third-party agent customisation sebagai tema risiko utama. Laporan merekomendasikan risk-based human oversight (pre-approval untuk high-risk, post-hoc review untuk reversible low-risk), distributed safeguards di seluruh platform, organisation, dan user layers, dan controlled incremental deployment.

Mengapa penting

Ini adalah studi empiris yang disponsori pemerintah pertama yang mengkonfirmasi bahwa indirect prompt injection → RCE adalah risiko produksi real-world dalam sistem agentic, bukan hanya kekhawatiran teoretis. Temuan tersebut memiliki bobot praktis yang kuat: ini bukan latihan red-team terhadap sistem yang terharden tetapi alur kerja sektor publik nyata yang menjalankan computer-use agents. Imprimatur multi-agensi Singapore (CSA + GovTech + IMDA) menandakan bahwa prompt-injection defences akan menjadi baseline yang diharapkan dalam pengadaan AI pemerintah Singapore dan, sebagai perpanjangan, sertifikasi vendor seperti framework AI Verify.

Tindakan yang diperlukan

Perlakukan indirect prompt injection sebagai test case wajib untuk setiap agentic deployment — khususnya computer-use agents yang menjelajahi web, membaca email, atau memproses dokumen dari sumber eksternal. Tambahkan RCE-path prompt injection tests ke pre-deployment security review checklists. Evaluasi apakah lapisan agent orchestration Anda memisahkan instructional content dari retrieved/external content, dan apakah tool-call outputs diperlakukan sebagai untrusted input.