Penjelasan teknis
Kerentanan denial-of-service mempengaruhi jalur serving yang kompatibel dengan OpenAI di vLLM 0.19.0. Exploit tersedia secara publik dan dapat diluncurkan dari jarak jauh. Sebagai server inferensi LLM open-source yang paling banyak digunakan — digunakan dalam produksi oleh perusahaan, platform AI, dan penyedia cloud — gangguan ketersediaan di vLLM secara langsung berdampak pada pengiriman layanan AI dan pipeline inferensi model.
Vektor serangan
Remote, tidak ada autentikasi yang dicatat dalam deskripsi NVD. Exploit tersedia secara publik, menurunkan hambatan untuk serangan oportunistik terhadap endpoint API OpenAI-compatible vLLM yang terekspos.
Sistem yang terdampak
vLLM 0.19.0, jalur serving yang kompatibel dengan OpenAI. vLLM banyak digunakan sebagai server inferensi LLM dalam penyebaran AI perusahaan dan cloud.
Mitigasi
Periksa rilis vLLM yang sudah diperbaiki yang mengatasi CVE-2026-9540 dan tingkatkan dari 0.19.0. Sebagai kontrol interim, batasi akses jaringan ke endpoint API vLLM ke rentang IP terpercaya dan terapkan rate limiting pada jalur serving yang kompatibel dengan OpenAI. Pantau volume permintaan anomali yang menargetkan endpoint inferensi.