Language Shapes Mental Health Evaluations in Large Language Models
Este estudio demuestra que los modelos de lenguaje grandes (GPT-4o y Qwen3) generan evaluaciones de salud mental con mayor estigma y subestiman la gravedad de la depresión cuando se les solicita en chino en comparación con el inglés, revelando un sesgo sistemático dependiente del idioma.