Pedoman  ·  2026-06-11

Anthropic Menerbitkan Kartu Sistem Claude Fable 5 dan Mythos 5 — Evaluasi Kemampuan Siber Terperinci, Arsitektur Keamanan Dual-Config, dan Hasil Benchmark Prompt-Injection Agentic

PedomanHigh dampakGlobal
Pada 9 Juni 2026, Anthropic merilis Claude Fable 5 untuk penggunaan umum dan Claude Mythos 5 untuk sekelompok cyberdefender terbatas, bersama dengan kartu sistem terperinci. Temuan utama: Mythos 5 adalah model siber paling kapabel yang dievaluasi hingga saat ini, mencapai skor jauh di depan Opus 4.8 dalam pengembangan exploit; Fable 5 menggunakan pengklasifikasi keamanan siber yang mengarahkan ~5% sesi ke Opus 4.8 ketika kueri terkait siber terdeteksi; Mythos 5 mencapai hasil terendah (terbaik) pada benchmark prompt-injection Gray Swan eksternal; memecahkan perlindungan keamanan siber dinilai sebagai 'sangat sulit meskipun tidak mustahil'; dan Mythos 5 yang tidak dijaga dapat 'secara signifikan meningkatkan aktor ancaman yang terkurasi dengan baik' dalam penelitian kimia dan biologis. Fable 5 dihargai pada $10/1M input / $50/1M output token — kurang dari setengah harga Mythos Preview.
Ini adalah kartu sistem Tier 2 pertama yang mengukur risiko siber dual-use pada skala Mythos dan mendokumentasikan arsitektur perlindungan spesifik yang digunakan untuk mengelolanya. Rilis publik Fable 5 pada tingkat kemampuan kelas-Mythos — bahkan dengan pengklasifikasi — berarti model ancaman untuk serangan siber berbantu AI telah bergeser secara material: pembela harus sekarang mengasumsikan pesaing memiliki atau akan memiliki akses ke model dengan kemampuan sebanding. Skor benchmark prompt-injection Gray Swan adalah titik referensi eksternal yang berguna untuk kerangka kerja evaluasi keamanan agentic.
Baca kartu sistem Fable 5/Mythos 5 untuk memperbarui model ancaman AI organisasi Anda; secara khusus, gunakan benchmark Gray Swan dan hasil evaluasi METR sebagai titik referensi untuk cakupan red-teaming Anda sendiri, dan briefkan klien tentang implikasi model kelas-Mythos yang sekarang dapat diakses oleh publik umum melalui Fable 5.
Sumber
Anthropic: Claude Fable 5 and Mythos 5 AnnouncementAnthropic System Card PDF: Claude Fable 5 & Claude Mythos 5
Lihat di umpan langsung Jelajahi temuan keamanan dan tata kelola AI terkait — diperbarui setiap pagi.
Buka umpan →