Solusi  ·  2026-06-15

Microsoft ASSERT: Framework Open-Source Spec-to-Evals untuk AI Agents

SolusiMedium dampakGlobal
Microsoft merilis ASSERT (Adaptive Spec-driven Scoring for Evaluation and Regression Testing) sebagai framework open-source berlisensi MIT (diumumkan 10 Juni, dipublikasikan ~2 Juni). Ini mengonversi spesifikasi perilaku bahasa alami, persyaratan produk, dan dokumen tata kelola menjadi skenario evaluasi yang dapat dieksekusi, dataset, metrik, dan scorecard untuk model dan agent AI.
Secara langsung mengatasi kesenjangan enterprise di mana perilaku AI agent dievaluasi secara tidak konsisten sebelum produksi. Menurunkan hambatan untuk pengujian perilaku formal — memperlakukan eval sebagai production gate daripada pemikiran akhir — yang kritis untuk industri yang diatur menerapkan agent.
Tim AI/ML engineering dan AppSec yang membangun atau menerapkan AI agent; adopsi sebagai bagian dari pipeline CI/CD untuk behavioral regression testing. Tersedia sekarang.
Sumber
Microsoft Command Line Blog (June 10 2026)InfoWorld CoverageMicrosoft Command Line Blog: ASSERT Framework
Lihat di umpan langsung Jelajahi temuan keamanan dan tata kelola AI terkait — diperbarui setiap pagi.
Buka umpan →