Definisi
Sebuah teknik di mana organisasi menguji model AI terhadap pola penggunaan dunia nyata (diambil dari log produksi) sebelum peluncuran, memprediksi bagaimana model akan berperilaku di lapangan. Simulasi menjembatani celah antara pengujian keselamatan lab dan penerapan dunia nyata.
Mengapa penting
Evaluasi keselamatan yang dilakukan di lingkungan lab sering kali menyimpang dari perilaku dunia nyata; simulasi mengurangi risiko kegagalan model yang tidak terduga, jailbreak, atau keluaran berbahaya mencapai pelanggan.