Pedoman  ·  2026-06-06

Pembaruan Tim Red Microsoft tentang Taksonomi Mode Kegagalan AI Agentic — 7 Mode Baru dari 12 Bulan Red Teaming Produksi

PedomanHigh dampakGlobal
Tim Red AI Microsoft menerbitkan taksonomi yang diperbarui atas mode kegagalan dalam sistem AI agentic pada 4 Juni, menambahkan tujuh kategori baru yang berasal dari setahun keterlibatan red-team terhadap deployment produksi termasuk Microsoft Security Copilot dan ekosistem MCP. Kategori baru tersebut adalah: agentic supply-chain compromise, goal hijacking, inter-agent trust escalation, computer-use agent visual attacks, session context contamination, MCP/plugin abuse, dan capability/architecture disclosure. Postingan tersebut menjelaskan bagaimana kerangka kerja agentic open-source (OpenClaw) dengan cepat mengumpulkan ribuan deployment sambil menyimpan 336 plugin berbahaya yang terkonfirmasi — menggambarkan bagaimana ekosistem agent dapat berkembang lebih cepat daripada tinjauan keamanan.
Berbeda dengan edisi pertama 2025 (yang bersifat forward-looking), pembaruan ini didasarkan pada confirmed exploit chains dalam produksi: zero-click data exfiltration dan lateral movement didokumentasikan dari external-origin inputs saja, tanpa interaksi pengguna di luar deployment agent awal. Human-in-the-loop bypass diidentifikasi sebagai mode kegagalan yang paling banyak dieksploitasi, secara langsung menantang asumsi bahwa approval prompts memberikan keamanan yang bermakna. Microsoft merekomendasikan agent SBOM generation, identity verification per-task, dan least-privilege scoping per tool call.
Petakan tujuh mode kegagalan baru ke arsitektur agent yang Anda deploy; secara khusus audit apakah human-approval prompts dapat dilewati dan apakah registri MCP/plugin telah ditinjau untuk entri berbahaya.
Sumber
Microsoft Security Blog — Updating the Taxonomy of Failure Modes in Agentic AI Systems
Lihat di umpan langsung Jelajahi temuan keamanan dan tata kelola AI terkait — diperbarui setiap pagi.
Buka umpan →