MHDash: An Online Platform for Benchmarking Mental Health-Aware AI Assistants
Ce papier présente MHDash, une plateforme open-source conçue pour évaluer et auditer les assistants IA en santé mentale, révélant que les métriques d'agrégation masquent des défaillances critiques sur les cas à haut risque et les interactions multi-tours, ce qui rend nécessaire une analyse plus fine pour garantir la sécurité.