무슨 일이 있었나
2026년 6월 8일, Anthropic의 레드 팀은 red.anthropic.com에서 'LLM의 N-day 익스플로잇에 대한 영향 측정'을 발표했으며, Claude Mythos Preview를 Mozilla Firefox 및 Microsoft Windows 커널의 알려진(하지만 최근 공개된) 취약점에 대해 평가했습니다. 21개의 Windows 커널 버그에서 Mythos는 18건의 '블루 스크린'을 발생시켰고 8개의 서로 다른 익스플로잇을 생성했습니다. 가장 빠른 익스플로잇은 31분 이내에 완성되었고, 가장 느린 것은 5.7시간이 걸렸습니다. Windows 권한 상승 익스플로잇당 비용: API 크레딧으로 약 $2,000. 연구원들은 모델의 지식 기한 이후에 공개된 버그만 평가하여 메모리화에서 AI 향상을 분리했습니다.
왜 중요한가
이것은 엔터프라이즈급 취약점에 대한 N-day 익스플로잇 개발 타임라인의 붕괴를 정량화하는 첫 번째 Tier-2 실증 연구입니다. 이전에 보안 팀들은 패치 릴리스 후 공격자의 체류 시간을 수주로 가정했습니다. Mythos 데이터는 고급 모델 접근 권한이 있는 숙련된 공격자가 공개된 결함을 몇 시간 내에 무기화할 수 있음을 시사합니다. 이 발견은 논문에서 언급한 유사한 능력 수준에 도달하고 있는 오픈소스 모델에도 동일하게 적용됩니다. 주간 이상의 패칭 주기를 운영하는 조직은 이제 공개 CVE 공개 순간부터 운영상 노출되어 있습니다.
적용 범위
중요 또는 높은 CVE에 대해 24–48시간보다 긴 패치 갭을 보유한 모든 조직은 SLA 목표를 즉시 재검토해야 합니다. 취약점 관리 팀은 나이 기반 큐보다 CISA KEV 및 EPSS 점수 항목을 우선순위로 지정해야 합니다. CISO는 '패치 윈도우' ≠ '안전 윈도우'인 새로운 위협 모델에 대해 이사회에 보고해야 합니다.