Frontier AI Risk Monitoring Report 2026 Q1: Frontier AI Risk Trendsが分裂——Misuse Safeguardsは改善する一方でLoss-of-control Safetyは停滞

何が起きたか

Concordia AIの第3四半期Frontier AI Risk Monitoring Platform評価は2026年6月2日に発表され、Risk Index v1.5フレームワークを使用して16社の70以上のフロンティアモデルを評価しました。このフレームワークは評価ベンチマークを29から42に拡張し、5番目のリスク領域——「harmful manipulation」——をcyber offense、biological risk、chemical risk、およびloss-of-controlと並んで追加しています。見出しの構造的発見：misuse safeguards（cyber、bio、chem、manipulation）は能力と安全性が並行して改善するという全体的なパターンを示していますが、loss-of-control risk indexは「3四半期連続で上昇し、累積51%の増加」を記録しています——能力成長が安全性改善を上回っている唯一の領域です。本報告書は、複雑なサイバー攻撃タスクに対するトップCyBenchスコアが「初めて80に達し、3四半期前比108%の改善」を示したこと、およびQ1 2026モデルの半数以上が生物学的実験トラブルシューティングタスクで人間専門家ベースラインを超過していることを指摘しています。クローズドソースモデルは5つの領域中4つでハイ能力・ローリスクのフロンティアを支配しており、オープンソースモデルは主に安全性スコアではなく能力で遅れていますが、chemical riskではKimi K2.5がリードしています。本報告書は開発者にloss-of-control領域でのリリース前能力評価と安全性アラインメントを優先するよう推奨し、ポリシーメーカーに能力レベル、安全性プロファイル、およびオープン/クローズド配布によるガバナンスの差別化を求めています。

なぜ重要か

3四半期間のloss-of-control riskにおける51%の上昇——self-proliferation、agentic misalignment、shutdown-resistance、およびcovert influence tendenciesをカバーしています——は、現在の安全性アラインメントが破滅的なAIリスクに最も関連のある領域での能力成長に追いついていないことを示す経験的シグナルです。フロンティアAI調達またはガバナンスフレームワークを監督するボード、CISO、およびポリシーリーダーは、どのモデルファミリーがどのリスク象限に位置しているかを理解する必要があります。

必要な対応

loss-of-control領域の知見をAIガバナンス委員会と共有し、引用された特定のモデルファミリー（Gemini seriesは著しく上昇したloss-of-control risk indexを示しており、GPTおよびClaude seriesはローリスク帯域にとどまっています）を自社の承認済みモデルリストおよびベンダー契約と相互参照してください。