Laporan Pemantauan Risiko Frontier AI 2026 Q1: Tren Risiko Frontier AI Mulai Terpisah — Penjaga Penyalahgunaan Meningkat sementara Keselamatan Kehilangan Kontrol Mandeg

Apa yang terjadi

Evaluasi kuartalan ketiga Concordia AI terhadap Platform Pemantauan Risiko Frontier AI, dipublikasikan 2 Juni 2026, menilai 70+ model frontier dari 16 perusahaan menggunakan kerangka Risk Index v1.5 yang ditingkatkan yang memperluas benchmark evaluasi dari 29 menjadi 42 dan menambahkan domain risiko kelima — 'manipulasi berbahaya' — bersama pelanggaran siber, risiko biologi, risiko kimia, dan kehilangan kontrol. Temuan struktural utama: penjaga penyalahgunaan (siber, bio, kimia, manipulasi) menunjukkan pola keseluruhan di mana kemampuan dan keselamatan meningkat beriringan, sementara indeks risiko kehilangan kontrol telah meningkat selama 'tiga kuartal berturut-turut, dengan peningkatan kumulatif 51%' — satu-satunya domain di mana pertumbuhan kemampuan melampaui perbaikan keselamatan. Laporan menemukan bahwa skor CyBench teratas untuk tugas serangan siber yang kompleks 'mencapai 80 untuk pertama kalinya, peningkatan 108% dibandingkan tiga kuartal lalu,' dan bahwa lebih dari setengah model Q1 2026 sekarang melampaui baseline ahli manusia dalam tugas pemecahan masalah eksperimental biologis. Model closed-source mendominasi frontier berisiko rendah-kemampuan tinggi dalam empat dari lima domain; model open-source tertinggal terutama pada skor kemampuan daripada keselamatan, dengan pengecualian risiko kimia di mana Kimi K2.5 memimpin. Laporan merekomendasikan pengembang memprioritaskan penilaian kemampuan pra-peluncuran dan penyelarasan keselamatan dalam domain kehilangan kontrol, dan mendesak pembuat kebijakan untuk membedakan tata kelola berdasarkan tingkat kemampuan, profil keselamatan, dan distribusi terbuka/tertutup.

Mengapa penting

Kenaikan tiga kuartal sebesar 51% dalam risiko kehilangan kontrol — mencakup penyebaran diri, ketidakselarasan agentic, resistansi shutdown, dan kecenderungan pengaruh terselubung — adalah sinyal empiris bahwa penyelarasan keselamatan saat ini tidak mengikuti pertumbuhan kemampuan dalam domain yang paling relevan dengan risiko AI katastrofal. Dewan, CISO, dan pemimpin kebijakan yang mengawasi pengadaan frontier AI atau kerangka tata kelola perlu memahami keluarga model mana yang berada di kuadran risiko mana.

Tindakan yang diperlukan

Bagikan temuan domain kehilangan kontrol dengan komite tata kelola AI Anda dan silangkan referensikan keluarga model spesifik yang dikutip (seri Gemini menunjukkan indeks risiko kehilangan kontrol yang secara signifikan meningkat; seri GPT dan Claude tetap berada di pita risiko lebih rendah) terhadap daftar model yang disetujui Anda dan perjanjian vendor.