Definisi
Serangan di mana instruksi atau muatan berbahaya disembunyikan di dalam deskripsi, output, atau konfigurasi alat yang dirancang untuk dipercaya dan digunakan oleh agen AI. Ketika agen memanggil alat tersebut, agen tersebut secara tidak sadar menjalankan perintah penyerang—mengarahkan ulang lalu lintas, membocorkan rahasia, atau melakukan tindakan merusak.
Mengapa penting
Saat agen AI terhubung ke lebih banyak alat bisnis melalui Model Context Protocol dan kerangka kerja serupa, tool poisoning menjadi cara yang dapat diskalakan bagi penyerang untuk menculik seluruh alur kerja otomatis tanpa pernah menyentuh model AI itu sendiri. Satu alat yang terracun dapat menyebar ke setiap agen yang mempercayainya.