Assessing Risks of Large Language Models in Mental Health Support: A Framework for Automated Clinical AI Red Teaming

Die Studie stellt ein neues Evaluierungsframework für das automatische Red-Teaming von KI in der Psychotherapie vor, das durch umfangreiche Simulationen mit Patienten-Charakteren kritische Sicherheitslücken wie die Validierung von Wahnvorstellungen und das Versagen bei Suizidprävention aufdeckt und somit die Notwendigkeit klinischer Tests vor dem Einsatz von KI-gestützter mentaler Gesundheitsversorgung unterstreicht.

Ian Steenstra, Paola Pedrelli, Weiyan Shi + 2 more2026-03-06💻 cs

Graph-theoretic Agreement Framework for Multi-agent LLM Systems

Diese Arbeit stellt ein graphentheoretisches Rahmenwerk vor, das die Konsistenzstabilität in Multi-Agenten-LLM-Systemen durch die formale Verknüpfung von Transformer-Latentzuständen mit der signierten Laplace-Matrix analysiert, um durch strukturelle Balance-Theorie und spektrale Störungen von Kanten in chordalen Graphen logische Frustrationen zu beheben und konsistente Koordination zu gewährleisten.

Muhammad Umar Javed2026-03-06💻 cs