Definisi
Serangan yang mengeksploitasi guardrail AI dengan menyuntikkan data beracun yang dirancang untuk menjebak sistem keselamatan berbasis penalaran dalam loop pemikiran yang diperpanjang, mengonsumsi sumber daya komputasi yang masif dan mengasingkan agen lain di infrastruktur bersama. Satu dokumen beracun dapat memperlambat sistem hingga 148×.
Mengapa penting
Karena perusahaan mengandalkan kontrol keselamatan yang intensif penalaran untuk mengatur agen AI, guardrail tersebut sendiri menjadi kerentanan; penyerang dapat memvajibkan mekanisme keselamatan untuk mencapai penolakan layanan skala perusahaan.