Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models
Este artículo presenta un marco de red-teaming dinámico, automático y sistemático (DAS) que revela una brecha crítica entre el alto rendimiento en benchmarks estáticos y la baja fiabilidad dinámica de los modelos de lenguaje médico, demostrando que la mayoría de estos sistemas son vulnerables a fallos de robustez, privacidad, sesgo y alucinaciones cuando se someten a pruebas de estrés continuas y adaptativas.
Jiazhen Pan (Cherise), Bailiang Jian (Cherise), Paul Hager (Cherise), Yundi Zhang (Cherise), Che Liu (Cherise), Friedrike Jungmann (Cherise), Hongwei Bran Li (Cherise), Chenyu You (Cherise), Junde Wu (Cherise), Jiayuan Zhu (Cherise), Fenglin Liu (Cherise), Yuyuan Liu (Cherise), Niklas Bubeck (Cherise), Christian Wachinger (Cherise), Chen (Cherise), Chen (Cherise), Zhenyu Gong, Cheng Ouyang, Georgios Kaissis, Benedikt Wiestler, Daniel Rueckert2026-03-10🤖 cs.LG