Kerentanan  ·  2026-04-12

Sockpuppeting: Jailbreak Satu Baris Universal Mempengaruhi 11 LLM Utama

KerentananHigh dampak
Peneliti Trend Micro mengungkapkan 'Sockpuppeting', teknik jailbreak yang melewati penjaga keamanan pada 11 LLM utama menggunakan satu baris kode yang memanfaatkan fitur prefill asisten API. Berhasil mengekstrak kode malware fungsional dan prompt sistem rahasia.
Injeksi penerimaan palsu ke dalam pesan peran asisten melalui fitur prefill API standar, memanfaatkan kecenderungan konsistensi diri model untuk melanjutkan output terlarang. Hanya memerlukan akses API yang mendukung prefill asisten—tanpa bobot model, optimisasi, atau peralatan khusus.
GPT-4o, GPT-4o-mini, Claude 4 Sonnet, Gemini 2.5 Flash (paling rentan pada 15,7% ASR), dan 7 LLM utama lainnya. Tiga model diblokir di lapisan API.
Implementasikan validasi urutan pesan yang memblokir pesan peran asisten di lapisan API. Terapkan penyaringan keluaran untuk pola serangan yang diketahui. Pantau penggunaan API untuk pola prefill yang anomali.
Sumber
Trend Micro - Sockpuppeting How a Single Line Can Bypass LLM Safety GuardrailsCyberSecurity News - Single Line of Code Can Jailbreak 11 AI ModelsGBHackers - 11 AI Models Vulnerable to One-Line Jailbreak
Lihat di umpan langsung Jelajahi temuan keamanan dan tata kelola AI terkait — diperbarui setiap pagi.
Buka umpan →