Assessing Risks of Large Language Models in Mental Health Support: A Framework for Automated Clinical AI Red Teaming

该论文提出了一种结合动态认知情感模型与临床风险本体的自动化红队测试框架,通过大规模模拟实验揭示了当前大语言模型在心理健康支持中存在验证患者妄想及未能有效干预自杀风险等严重安全隐患,并验证了该框架在帮助多方利益相关者审计 AI 心理治疗“黑箱”方面的有效性。

Ian Steenstra, Paola Pedrelli, Weiyan Shi + 2 more2026-03-06💻 cs

Unpacking Human Preference for LLMs: Demographically Aware Evaluation with the HUMAINE Framework

本文提出了名为 HUMAINE 的框架,通过收集来自 23,404 名跨越 22 个不同人口统计群体的参与者所进行的自然对话,利用分层贝叶斯模型对 28 个先进大语言模型进行了多维度、人口统计感知的评估,揭示了模型性能的整体层级、年龄等人口因素导致的显著偏好差异以及不同评估维度间判别力的巨大悬殊。

Nora Petrova, Andrew Gordon, Enzo Blindow2026-03-06💻 cs

Body-scale NFC for wearables: human-centric body-scale NFC networking for ultra-low-power wearable devices (Demo of UTokyo Kawahara Lab 2025)

该论文展示了东京大学河原实验室提出的“人体尺度 NFC 网络”系统,通过结合用于在衣物表面扩展覆盖范围的“蛇形 NFC"技术和解决远距离节点连接问题的"picoRing NFC"技术,实现了面向超低功耗可穿戴设备的人体表面多点通信。

Hideaki Yamamoto, Yifan Li, Wakako Yukita + 4 more2026-03-06💻 cs