技術的な説明
NVIDIA TensorRT-LLM (TRT-LLM) の3つの安全でないデシリアライゼーション脆弱性が2026年5月20日に NVD に公開されました。CVE-2025-33255 (CVSS 7.5 高) は MPI サーバーコンポーネントに影響し、CVE-2026-24163 (CVSS 7.5 高) は RPC テストに影響し、CVE-2026-24142 (CVSS 6.3 中) はデシリアライゼーションと安全でないシリアライズされたハンドルに関与します。3つすべてにより、攻撃者は安全でないデシリアライゼーションを引き起こす可能性があり、コード実行、サービス拒否、データ改ざん、および情報開示につながる可能性があります。TRT-LLM は NVIDIA の広く展開されている大規模言語モデル推論用最適化ライブラリであり、本番環境 LLM サービング環境で使用されています。これらの脆弱性は NVD 説明によると「任意のプラットフォーム」に影響します。
攻撃経路
TRT-LLM MPI サーバーまたは RPC テストインターフェースに到達できる攻撃者は、悪意のある細工されたシリアライズされたデータを送信して、安全でないデシリアライゼーションをトリガーできます。エクスプロイトが成功すると、TRT-LLM プロセスのコンテキストで任意のコードを実行したり、モデルの出力または設定を改ざんしたり、サービス拒否を引き起こしたり、機密情報 (モデルの重み、推論データ、認証情報) を開示したりできます。攻撃表面は TRT-LLM の展開方法に依存します: クラウドホスト型 LLM サービングエンドポイント、オンプレミス推論サーバー、エッジ AI デプロイメント、または研究クラスター。TRT-LLM サービスが信頼されていないネットワークに公開されている、またはユーザー提供のシリアライズされた入力を受け入れている場合、エクスプロイト リスクは高くなります。
影響を受けるシステム
クラウド LLM サービングプラットフォーム、オンプレミス AI インフラストラクチャ、エッジ AI デプロイメント、および研究環境を含む LLM 推論に NVIDIA TensorRT-LLM を使用しているすべてのデプロイメント。TRT-LLM を本番環境モデル サービング (例: 顧客向けチャットボット、内部 AI エージェント、コード生成サービス) に使用している組織は、これらを重大な脆弱性として扱う必要があります。AI インフラストラクチャチームは、TRT-LLM サービスがネットワークアクセス可能かどうか、信頼されていないソースからシリアライズされた入力を受け入れるかどうか、および TRT-LLM プロセスがどの権限レベルで実行されるかを監査する必要があります。
緩和策
2026年5月20日時点で、NVIDIA は NVD レコードにパッチの詳細をまだ公開していません。組織は NVIDIA セキュリティ情報誌でパッチとワークアラウンドを監視する必要があります。暫定的な軽減策: TRT-LLM MPI および RPC インターフェースへのネットワークアクセスを制限 (ファイアウォールルール、ネットワークセグメンテーション)、TRT-LLM に渡される前にシリアライズされた入力を検証およびサニタイズ、最小権限サービスアカウントで TRT-LLM プロセスを実行、および異常なデシリアライゼーション動作を検出するためのランタイム監視を実装します。本番環境 LLM サービングの場合、TRT-LLM を、推論レイヤーに到達する前にリクエストを検証およびフィルタリングする API ゲートウェイの背後に配置することを検討します。