지침  ·  2026-06-11

Anthropic는 Claude Fable 5와 Mythos 5 System Card를 발행합니다 — 상세한 사이버 기능 평가, 이중 구성 안전 아키텍처, 및 에이전트 프롬프트 인젝션 벤치마크 결과

지침High 영향도Global
2026년 6월 9일, Anthropic은 Claude Fable 5를 일반 사용자를 위해 출시했고 Claude Mythos 5를 제한된 사이버 방어 전문가 그룹을 위해 출시했으며, 상세한 시스템 카드를 함께 제공했습니다. 주요 결과: Mythos 5는 지금까지 평가된 가장 능력 있는 사이버 모델이며, 익스플로잇 개발에서 Opus 4.8을 훨씬 앞서 점수를 기록했습니다; Fable 5는 사이버 관련 쿼리가 감지될 때 약 5%의 세션을 Opus 4.8로 라우팅하는 사이버보안 분류자를 사용합니다; Mythos 5는 외부 Gray Swan 프롬프트 인젝션 벤치마크에서 최저(최고) 결과를 달성했습니다; 사이버보안 보안 조치를 깨뜨리는 것은 '극도로 어렵지만 불가능하지는 않은' 것으로 평가됩니다; 그리고 보안 조치가 없는 Mythos 5는 화학 및 생물 연구에서 '충분한 자원을 갖춘 위협 행위자들을 상당히 강화할 수 있습니다'. Fable 5는 입력 토큰당 $10/1M, 출력 토큰당 $50/1M의 가격으로 책정되어 있습니다 — Mythos Preview의 절반 이하입니다.
이것은 Mythos 규모에서 이중용도 사이버 위험을 수량화하고 이를 관리하는 데 사용되는 특정 보안 조치 아키텍처를 문서화하는 첫 번째 Tier 2 시스템 카드입니다. 분류자를 사용하더라도 Mythos 급 기능 수준에서 Fable 5의 공개 출시는 AI 지원 사이버 공격의 위협 모델이 실질적으로 변했다는 것을 의미합니다: 방어자들은 이제 적대자들이 비슷한 기능 수준의 모델에 접근하고 있거나 접근할 것이라고 가정해야 합니다. Gray Swan 프롬프트 인젝션 벤치마크 점수는 에이전트 안전 평가 프레임워크를 위한 유용한 외부 참고점입니다.
Fable 5/Mythos 5 시스템 카드를 읽고 조직의 AI 위협 모델을 업데이트하세요; 특히 Gray Swan 벤치마크와 METR 평가 결과를 자신의 레드 팀 범위에 대한 참고점으로 사용하고, Mythos 급 모델이 이제 Fable 5를 통해 일반 대중이 접근할 수 있게 되었다는 의미에 대해 클라이언트에게 설명하세요.
출처
Anthropic: Claude Fable 5 and Mythos 5 AnnouncementAnthropic System Card PDF: Claude Fable 5 & Claude Mythos 5
라이브 피드에서 보기 AI 보안 및 거버넌스 관련 소식을 더 살펴보세요 — 매일 아침 업데이트.
피드 열기 →