Black Hat Asia 기조연설, 에이전틱 오펜시브 보안 자동화의 실제 한계 평가

기술 설명

2026년 4월 27일 싱가포르에서 열린 Black Hat Asia에서 RunSybil CEO Ari Herbert-Voss는 Anthropic의 Mythos 및 OpenAI의 GPT-5.5와 같은 최첨단 LLM이 오펜시브 보안에 미치는 실제 영향을 검토하는 기조연설을 발표했다. Herbert-Voss는 자율 익스플로잇 능력의 상한선이 빠르게 상승하고 있음을 인정하면서도, 발견사항을 검증하고 운영화하는 능력인 능력 하한선이 그 속도를 따라가지 못하고 있다고 주장했다. UK AI Security Institute의 Mythos 평가에 따르면 모델은 통제된 환경에서 공격 체인의 상당 부분을 완료할 수 있지만, 실제 대상에 대한 일관성은 제한적이다. Herbert-Voss는 2000년대의 퍼징과 유사점을 제시했다: 자동화된 도구는 대규모 데이터셋과 가능한 버그를 생성하지만, 필터링, 익스플로잇 가능성 검증, 근본 원인 파악에는 여전히 인간 전문성이 필요하다.

공격 경로

LLM은 낮은 심각도의 '얕은 버그' 발견 및 익스플로잇에서 '대규모 향상', 중간급 취약점에서는 적당한 향상, 가장 심각한 결함에서는 극소수의 향상을 보여준다. 공격 벡터는 특정 익스플로잇이 아니라 버그 발견 및 다단계 공격 실행을 가속화하기 위한 AI의 체계적 활용이다. 조직은 익스플로잇 시간 단축에 대비해야 한다: 2023년과 2026년 사이, 버그 발견부터 익스플로잇까지의 평균 시간이 전문 CTF 환경에서 5개월에서 10시간으로 단축되었다. 하지만 실제 배포에는 여전히 인간 오케스트레이션이 필요하며, 특히 복잡하고 영향력이 큰 취약점의 경우 더욱 그렇다.

영향받는 시스템

모든 소프트웨어 시스템은 이론상 LLM 기반 퍼징 및 익스플로잇 생성을 통한 가속화된 버그 발견에 노출되어 있다. 소프트웨어를 배포하는 조직이 가장 위험하며, 익스플로잇 전에 취약점을 패치할 수 있는 시간 창이 빠르게 축소되고 있다. AI 인프라 자체(모델 추론 서버, 에이전트 오케스트레이션 플랫폼, MCP 서버)도 공격 대상이다.

완화 방안

Herbert-Voss는 '왼쪽으로 이동(shifting left)'이 그 어느 때보다 중요하다고 강조했으며, 조직은 버그 도입부터 익스플로잇까지의 시간 창이 붕괴하고 있으므로 개발 생명주기 초기에 보안 테스트를 통합해야 한다고 주장했다. AI가 생성한 버그 보고서를 분류하고 익스플로잇 가능한 발견사항을 우선순위로 지정할 수 있는 자동화된 검증 파이프라인에 투자하라. 보안 팀은 공격자와의 동등성을 유지하기 위해 AI 기반 도구 자체를 채택해야 한다. 고위험 시스템의 경우 외부 적대자보다 먼저 방어를 스트레스 테스트하기 위해 내부적으로 AI 레드팀 배포를 고려하라. 마지막으로, 에이전틱 오펜시브 보안이 교육 기회라는 점을 인식하라: 능력과 운영화 사이의 격차가 인간 전문성이 여전히 불가결한 영역이므로, 자동화된 발견사항을 검증하고 맥락화할 수 있는 숙련된 보안 엔지니어를 고용하고 유지하라.