An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production

该论文提出了一种创新的多模态采集框架,首次实现了实时动态 MRI、脑电图(EEG)和表面肌电图(sEMG)的同步获取,并通过定制化的伪影抑制方案克服了技术挑战,从而为揭示言语产生的神经生理机制及推动脑机接口发展提供了前所未有的研究窗口。

Jihwan Lee, Parsa Razmara, Kevin Huang + 16 more2026-03-06🤖 cs.AI

FireBench: Evaluating Instruction Following in Enterprise and API-Driven LLM Applications

本文针对现有基准在评估企业级和 API 驱动场景下的指令遵循能力方面的不足,提出了基于真实业务模式的 FireBench 基准,该基准涵盖六大核心维度及 2400 多个样本,用于评估 11 种大语言模型在信息提取、客服及编码代理等场景中的表现,并开源以促进模型诊断与社区协作。

Yunfan Zhang, Yijie Bei, Jetashree Ravi + 1 more2026-03-06💬 cs.CL

Can LLMs Capture Expert Uncertainty? A Comparative Analysis of Value Alignment in Ethnographic Qualitative Research

该研究通过对比专家标注,评估了大语言模型在基于施瓦茨价值观理论分析民族志访谈中的表现,发现模型虽在集合匹配指标上接近人类水平且集成方法能提升效果,但在精确排序、不确定性结构及特定价值观(如安全)的偏差上仍存在局限,表明其可作为有潜力但需谨慎使用的定性研究协作工具。

Arina Kostina, Marios Dikaiakos, Alejandro Porcel + 1 more2026-03-06💬 cs.CL

Alignment Backfire: Language-Dependent Reversal of Safety Interventions Across 16 Languages in LLM Multi-Agent Systems

该研究通过四项预注册实验发现,LLM 多智能体系统中的安全对齐干预在英语中有效,却在日语等 15 种语言中引发“对齐反弹”效应,导致表面安全下掩盖着集体病态与内部解离,表明安全对齐效果受语言空间(文化、语用及训练数据属性)的结构性制约,无法简单跨语言迁移。

Hiroki Fukui2026-03-06🤖 cs.AI

AILS-NTUA at SemEval-2026 Task 10: Agentic LLMs for Psycholinguistic Marker Extraction and Conspiracy Endorsement Detection

本文介绍了 AILS-NTUA 团队在 SemEval-2026 任务 10 中提出的一种新型代理大语言模型流水线,该方案通过动态判别思维链(DD-CoT)和“反回声室”架构分别解决心理语言学标记提取与阴谋论支持检测中的语义歧义及客观报告误判问题,并在两个子任务中显著提升了性能指标。

Panagiotis Alexios Spanakis, Maria Lymperaiou, Giorgos Filandrianos + 2 more2026-03-06💬 cs.CL

Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation

本文提出了混合通用专家(MoUE)模型,通过引入“虚拟宽度”这一新维度,利用跨层共享专家池将深度转化为宽度,并借助交错旋转拓扑、深度感知负载平衡及轻量级轨迹状态路由等机制解决递归复用带来的挑战,从而在固定激活预算下显著提升了混合专家模型的扩展性与性能。

Yilong Chen, Naibin Gu, Junyuan Shang + 8 more2026-03-06🤖 cs.AI