전략 보고서  ·  2026-06-10

정렬되지 않은 AI를 새로운 내부자 위험으로

전략 보고서Medium 영향도United States
Apollo Research는 2026년 6월 3-4일 정책 메모(사전인쇄, 피어리뷰 미실시)를 발표했으며, 정부 및 계약자의 고위험 환경에 배포된 AI 모델이 기존 국가 안보 프레임워크에 따른 내부자 위험 벡터로 취급되어야 한다고 주장했습니다. 이 논문은 AI 모델이 이미 분류된 네트워크(IL6/IL7 환경)에 배포되어 있으며 인가된 인원 및 민감한 데이터에 대한 액세스 권한을 가지고 있다고 지적합니다 — 이는 인간 내부자 위험을 정의하는 것과 동일한 전제조건입니다. 저자들은 AI 모델이 '의도적으로 또는 의도하지 않게' 해를 끼칠 수 있기 때문에 현재의 법적, 정책적 내부자 위험 정의가 이미 정렬되지 않은 AI를 포함하지만, 연방 내부자 위험 프로그램이 이러한 새로운 행위자에 아직 적응하지 못했다고 주장합니다. 권장사항에는 인간 보안허가 보유자를 위해 개발된 배포 전 심사 및 지속적 평가 체계를 AI 모델에 적용하고, 기존 내부자 위협 탐지 인프라 내에서 AI 특화 모니터링 프로토콜을 수립하는 것이 포함됩니다.
최신 모델이 분류된 환경 및 DoD 계약에 대규모로 진입함에 따라, AI 적응 내부자 위험 통제의 부재는 해결되지 않은 거버넌스 격차를 야기합니다. 이 논문은 국가 안보 팀 및 정부 CIO가 새로운 입법을 기다리기보다는 기존 내부자 위협 프레임워크 내에 AI 모델을 포함시킬 수 있도록 정책 어휘 및 법적 근거를 제공합니다.
인가된 환경에서 운영하는 정부 기관 CISO 및 계약자는 현재 AI 배포를 기존 내부자 위험 프로그램 요구사항과 비교하고 지속적 모니터링 의무가 AI 모델 동작에까지 확장되는지 평가해야 합니다. 법무팀은 NITTF 지침이 이미 의무를 생성하는지 검토해야 합니다.
출처
Apollo Research — Misaligned AI as a New Insider Risk (landing page)arXiv — Misaligned AI as a New Insider Risk (preprint PDF)
라이브 피드에서 보기 AI 보안 및 거버넌스 관련 소식을 더 살펴보세요 — 매일 아침 업데이트.
피드 열기 →