Laporan Strategis  ·  2026-06-04

Penyulingan Adversarial: Kampanye China untuk Mengekstraksi Kemampuan AI Amerika

Laporan StrategisHigh dampakGlobal
Peneliti CNAS Daniel Remler dan Ben Hayum memperkenalkan dan mendefinisikan 'penyulingan adversarial' sebagai kategori ancaman keamanan nasional yang berbeda: ekstraksi kemampuan model AI dalam skala besar melalui akses tidak sah ke sistem AI A.S. untuk mengembangkan model bagi lawan asing. Makalah ini mendokumentasikan bahwa Anthropic, OpenAI, dan Google semuanya telah mengidentifikasi entitas China bernama dan tidak bernama yang melakukan aktivitas ini dalam skala besar, dan bahwa aparatur keamanan China telah memasukkan kemampuan yang disaring — melalui model seperti DeepSeek — ke dalam modernisasi militer dan pengawasan massa. Laporan ini berpendapat bahwa 'jika dibiarkan, penyulingan adversarial merepresentasikan kerentanan strategis bagi ekosistem AI A.S.' karena melewati pertahanan pencurian bobot dengan mengeksploitasi respons model daripada bobot model, dan karena setiap generasi kemampuan A.S. yang disaring memadukan keuntungan China. Para penulis menempatkan ancaman dalam persaingan AI A.S.–China yang lebih luas dan menganalisis NSTM-4 (April 2026) sebagai pengakuan pemerintah pertama, kemudian mengusulkan serangkaian tindakan perlawanan kebijakan dan industri termasuk verifikasi identitas, kontrol geografis, dan pemantauan akses API.
Makalah ini menyediakan definisi dan analisis yang menghadap kebijakan pertama kali secara sistematis tentang penyulingan adversarial sebagai kategori ancaman; ini memiliki implikasi langsung untuk tata kelola API AI perusahaan, kontrol akses, dan postur keamanan korporat, serta untuk strategi pengendalian ekspor dan regulasi.
Tinjau kontrol akses API organisasi Anda, praktik verifikasi identitas pelanggan, dan mekanisme penegakan layanan di light dari model ancaman penyulingan adversarial; tim hukum dan keamanan harus menilai eksposur dan tandai kepada urusan pemerintah jika layanan AI Anda dapat dieksploitasi di bawah pola yang didokumentasikan di sini.
Sumber
CNAS — Adversarial Distillation: China's Campaign to Extract American AI Capabilities
Lihat di umpan langsung Jelajahi temuan keamanan dan tata kelola AI terkait — diperbarui setiap pagi.
Buka umpan →