지침  ·  2026-05-14

UK AI Security Institute: Frontier Models Have Broken All Prior Trend Lines for Autonomous Cyber Capability 영국 AI Security Institute(AISI)는 영국 정부를 대신하여 배포 전 평가를 수행하고 있으며, 2026년 5월 13일 독립 연구를 발표했습니다. 해당 연구는 Anthropic의 Claude Mythos Preview와 OpenAI의 GPT-5.5가 자율 사이버 작업 완료에 대한 모든 기존 예측 추세를 크게 초과했음을 보여줍니다. AISI는 이전에 frontier models의 80% 신뢰도 사이버 시간 지평선이 약 5개월마다 두 배로 증가하고 있다고 추정했습니다(2025년 11월의 8개월 두배 증가에서 하락). Mythos Preview와 GPT-5.5는 이제 모든 측정된 추세선을 능가했습니다: Mythos는 AISI 사이버 범위 둘 다를 완료한 첫 번째 모델이 되었습니다('The Last Ones' 32단계 공격을 6/10 시도에서 해결하고 이전에 미해결이었던 'Cooling Tower'를 3/10 시도에서 완료). METR의 독립 연구는 2024년 말 이후 약 4개월의 두배 증가 시간을 확인했습니다.

지침High 영향도United Kingdom
AISI 보고서는 frontier AI 능력이 이전 모델들이 예측한 것보다 더 빠르게 가속화되고 있다는 정량적인 정부 지원 증거를 제공합니다. 5개월에서 4개월 두배 증가로의 전환(그리고 Claude Mythos와 GPT-5.5 모두의 사이버 범위에서의 성능 초과)은 능력 확장의 불연속성을 나타냅니다. 이는 Palo Alto와 의회 의원들이 인용한 3-5개월 윈도우를 직접 뒷받침합니다: 자율 사이버 작업 복잡성이 4-5개월마다 두 배로 증가하고 있다면, 조직은 현세대 모델이 다단계 공격을 자율적으로 실행할 수 있게 되기 전에 방어를 강화하기 위해 약 1개의 두배 증가 주기를 가지고 있습니다. AISI는 실제 환경 조건을 반영하기 위해 더 많은 요구 평가(새로운 사이버 범위, 활성 사이버 방어)를 개발하고 있으며, 향후 능력 벤치마킹을 위한 기준선을 설정하고 있습니다.
CISO는 3-5개월 윈도우를 취약점 탐지 및 패치 가속화 프로그램을 위한 계획 지평선으로 사용해야 합니다. 내부 취약점 심사 및 패치 배포 속도를 frontier models이 새로운 결함을 식별하는 속도에 대해 벤치마킹합니다. AI 지원 공격 속도를 고려할 때 현재 패치 타임라인(종종 30-60일)이 충분한지 평가합니다. AI 지원 공격 속도를 고려하여 패치가 지연될 때에도 노출을 줄이는 '제로 스탠딩 권한' 아키텍처 및 '침해 가정' 태세 채택을 고려합니다.
CISOs should use the 3–5 month window as a planning horizon for vulnerability detection and patch acceleration programs. Benchmark internal vulnerability triage and patch deployment velocity against the rate at which frontier models are identifying new flaws. Evaluate whether current patching timelines (often 30–60 days) are sufficient given AI-assisted exploitation velocity. Consider adopting 'zero standing privilege' architectures and 'assume breach' postures that reduce exposure even when patches lag.
출처
Researchers say AI just broke every benchmark for autonomous cyber capability
라이브 피드에서 보기 AI 보안 및 거버넌스 관련 소식을 더 살펴보세요 — 매일 아침 업데이트.
피드 열기 →