Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models
Die Studie stellt einen dynamischen, automatisierten und systematischen Red-Teaming-Rahmen (DAS) vor, der zeigt, dass medizinische Sprachmodelle trotz hoher Ergebnisse in statischen Benchmarks erhebliche Sicherheitslücken aufweisen und somit durch kontinuierliche Stress-Tests auf Robustheit, Datenschutz, Fairness und Halluzinationen überprüft werden müssen, bevor sie sicher in der klinischen Praxis eingesetzt werden können.
Jiazhen Pan (Cherise), Bailiang Jian (Cherise), Paul Hager (Cherise), Yundi Zhang (Cherise), Che Liu (Cherise), Friedrike Jungmann (Cherise), Hongwei Bran Li (Cherise), Chenyu You (Cherise), Junde Wu (Cherise), Jiayuan Zhu (Cherise), Fenglin Liu (Cherise), Yuyuan Liu (Cherise), Niklas Bubeck (Cherise), Christian Wachinger (Cherise), Chen (Cherise), Chen (Cherise), Zhenyu Gong, Cheng Ouyang, Georgios Kaissis, Benedikt Wiestler, Daniel Rueckert2026-03-10🤖 cs.LG