ThaiSafetyBench: Assessing Language Model Safety in Thai Cultural Contexts
Die Studie stellt ThaiSafetyBench vor, ein Open-Source-Benchmark mit 1.954 thailändischen Prompts zur Bewertung der Sicherheit von Sprachmodellen in kulturellen Kontexten, der zeigt, dass kulturell spezifische Angriffe erfolgreicher sind als allgemeine und dass geschlossene Modelle sicherer sind als offene.