Pembaruan Tim Red Microsoft tentang Taksonomi Mode Kegagalan AI Agentic — 7 Mode Baru dari 12 Bulan Red Teaming Produksi

Apa yang terjadi

Tim Red AI Microsoft menerbitkan taksonomi yang diperbarui atas mode kegagalan dalam sistem AI agentic pada 4 Juni, menambahkan tujuh kategori baru yang berasal dari setahun keterlibatan red-team terhadap deployment produksi termasuk Microsoft Security Copilot dan ekosistem MCP. Kategori baru tersebut adalah: agentic supply-chain compromise, goal hijacking, inter-agent trust escalation, computer-use agent visual attacks, session context contamination, MCP/plugin abuse, dan capability/architecture disclosure. Postingan tersebut menjelaskan bagaimana kerangka kerja agentic open-source (OpenClaw) dengan cepat mengumpulkan ribuan deployment sambil menyimpan 336 plugin berbahaya yang terkonfirmasi — menggambarkan bagaimana ekosistem agent dapat berkembang lebih cepat daripada tinjauan keamanan.

Mengapa penting

Berbeda dengan edisi pertama 2025 (yang bersifat forward-looking), pembaruan ini didasarkan pada confirmed exploit chains dalam produksi: zero-click data exfiltration dan lateral movement didokumentasikan dari external-origin inputs saja, tanpa interaksi pengguna di luar deployment agent awal. Human-in-the-loop bypass diidentifikasi sebagai mode kegagalan yang paling banyak dieksploitasi, secara langsung menantang asumsi bahwa approval prompts memberikan keamanan yang bermakna. Microsoft merekomendasikan agent SBOM generation, identity verification per-task, dan least-privilege scoping per tool call.

Tindakan yang diperlukan

Petakan tujuh mode kegagalan baru ke arsitektur agent yang Anda deploy; secara khusus audit apakah human-approval prompts dapat dilewati dan apakah registri MCP/plugin telah ditinjau untuk entri berbahaya.