Penjelasan teknis
Tiga kerentanan unsafe deserialization dalam NVIDIA TensorRT-LLM (TRT-LLM) dipublikasikan ke NVD pada 20 Mei 2026. CVE-2025-33255 (CVSS 7.5 High) mempengaruhi komponen server MPI; CVE-2026-24163 (CVSS 7.5 High) mempengaruhi pengujian RPC; CVE-2026-24142 (CVSS 6.3 Medium) melibatkan deserialization dan unsafe serialized handles. Ketiga kerentanan ini memungkinkan penyerang menyebabkan unsafe deserialization, yang berpotensi mengakibatkan eksekusi kode, denial of service, manipulasi data, dan pengungkapan informasi. TRT-LLM adalah library NVIDIA yang luas digunakan untuk optimized large language model inference, digunakan dalam lingkungan produksi LLM serving. Kerentanan-kerentanan ini mempengaruhi 'any platform' menurut deskripsi NVD.
Vektor serangan
Penyerang yang dapat menjangkau server TRT-LLM MPI atau interface pengujian RPC dapat mengirimkan data serialized yang dirancang berbahaya untuk memicu unsafe deserialization. Eksploitasi yang berhasil dapat mengeksekusi kode arbitrer dalam konteks proses TRT-LLM, memanipulasi output model atau konfigurasi, menyebabkan denial of service, atau mengungkapkan informasi sensitif (bobot model, data inference, kredensial). Permukaan serangan tergantung pada cara TRT-LLM dikerahkan: cloud-hosted LLM serving endpoints, inference servers on-premises, edge AI deployments, atau research clusters. Jika layanan TRT-LLM terekspos ke jaringan yang tidak dipercaya atau menerima input serialized yang disediakan pengguna, risiko eksploitasi meningkat.
Sistem yang terdampak
Setiap deployment yang menggunakan NVIDIA TensorRT-LLM untuk LLM inference, termasuk cloud LLM serving platforms, infrastruktur AI on-premises, edge AI deployments, dan lingkungan penelitian. Organisasi yang menggunakan TRT-LLM untuk production model serving (misalnya, chatbots yang menghadap pelanggan, AI agents internal, layanan code-generation) harus menganggap ini sebagai kerentanan kritis. Tim infrastruktur AI harus mengaudit apakah layanan TRT-LLM dapat diakses dari jaringan, apakah mereka menerima input serialized dari sumber yang tidak dipercaya, dan pada level privilege berapa proses TRT-LLM berjalan.
Mitigasi
NVIDIA belum mempublikasikan detail patch dalam catatan NVD per tanggal 20 Mei 2026. Organisasi harus memantau bulletin keamanan NVIDIA untuk patch dan workarounds. Mitigasi interim: batasi akses jaringan ke interface TRT-LLM MPI dan RPC (aturan firewall, segmentasi jaringan), validasi dan sanitasi setiap input serialized sebelum diteruskan ke TRT-LLM, jalankan proses TRT-LLM dengan service accounts least-privilege, dan implementasikan monitoring runtime untuk mendeteksi perilaku deserialization yang anomali. Untuk production LLM serving, pertimbangkan untuk menempatkan TRT-LLM di belakang API gateways yang memvalidasi dan memfilter permintaan sebelum mencapai inference layer.