적대적 증류: 미국 AI 역량 추출을 위한 중국의 캠페인

무슨 일이 있었나

CNAS 연구원 Daniel Remler과 Ben Hayum은 '적대적 증류'를 국가 안보 위협의 별개 범주로 소개하고 정의합니다: 미국 AI 시스템에 대한 무단 접근을 통해 AI 모델 역량을 대규모로 추출하여 외국 적대국을 위한 모델을 개발하는 것. 본 논문은 Anthropic, OpenAI, Google이 모두 이러한 활동을 대규모로 수행하는 명시된 및 미명시된 중국 기관들을 식별했으며, 중국 보안 기구가 이미 DeepSeek과 같은 모델을 통해 증류된 역량을 군사 현대화 및 대량 감시에 통합했음을 기록합니다. 본 보고서는 '해결되지 않으면 적대적 증류는 미국 AI 생태계에 대한 전략적 취약점을 나타낸다'고 주장합니다. 이는 모델 가중치가 아닌 모델 응답을 이용하여 가중치 탈취 방어를 회피하고, 증류된 미국 역량의 각 세대가 중국의 이득을 복합적으로 증가시키기 때문입니다. 저자들은 더 넓은 미국-중국 AI 경쟁 내에서 위협을 위치시키고 NSTM-4(2026년 4월)를 첫 번째 정부 인정으로 분석한 후, 신원 확인, 지리적 통제, API 접근 모니터링을 포함한 정책 및 산업 대응 조치 세트를 제안합니다.

왜 중요한가

본 논문은 위협 범주로서 적대적 증류의 첫 번째 체계적인 정책 중심 정의 및 분석을 제공하며, 엔터프라이즈 AI API 거버넌스, 접근 통제, 기업 보안 태세뿐만 아니라 수출 통제 및 규제 전략에 직접적인 영향을 미칩니다.

필요한 조치

적대적 증류 위협 모델을 고려하여 귀사의 API 접근 통제, 고객 신원 확인 관행, 서비스 약관 시행 메커니즘을 검토하시기 바랍니다. 법무 및 보안 팀은 노출을 평가하고 여기에 문서화된 패턴에 따라 귀사의 AI 서비스가 악용될 수 있는 경우 정부 관계 부서에 보고해야 합니다.