Apa yang terjadi
Tim Red AI Microsoft menerbitkan taksonomi yang diperbarui atas mode kegagalan dalam sistem AI agentic pada 4 Juni, menambahkan tujuh kategori baru yang berasal dari setahun keterlibatan red-team terhadap deployment produksi termasuk Microsoft Security Copilot dan ekosistem MCP. Kategori baru tersebut adalah: agentic supply-chain compromise, goal hijacking, inter-agent trust escalation, computer-use agent visual attacks, session context contamination, MCP/plugin abuse, dan capability/architecture disclosure. Postingan tersebut menjelaskan bagaimana kerangka kerja agentic open-source (OpenClaw) dengan cepat mengumpulkan ribuan deployment sambil menyimpan 336 plugin berbahaya yang terkonfirmasi — menggambarkan bagaimana ekosistem agent dapat berkembang lebih cepat daripada tinjauan keamanan.
Mengapa penting
Berbeda dengan edisi pertama 2025 (yang bersifat forward-looking), pembaruan ini didasarkan pada confirmed exploit chains dalam produksi: zero-click data exfiltration dan lateral movement didokumentasikan dari external-origin inputs saja, tanpa interaksi pengguna di luar deployment agent awal. Human-in-the-loop bypass diidentifikasi sebagai mode kegagalan yang paling banyak dieksploitasi, secara langsung menantang asumsi bahwa approval prompts memberikan keamanan yang bermakna. Microsoft merekomendasikan agent SBOM generation, identity verification per-task, dan least-privilege scoping per tool call.
Tindakan yang diperlukan
Petakan tujuh mode kegagalan baru ke arsitektur agent yang Anda deploy; secara khusus audit apakah human-approval prompts dapat dilewati dan apakah registri MCP/plugin telah ditinjau untuk entri berbahaya.