cs.CL 篇论文 | Gist.Science

An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production

该论文提出了一种创新的多模态采集框架，首次实现了实时动态 MRI、脑电图（EEG）和表面肌电图（sEMG）的同步获取，并通过定制化的伪影抑制方案克服了技术挑战，从而为揭示言语产生的神经生理机制及推动脑机接口发展提供了前所未有的研究窗口。

Jihwan Lee, Parsa Razmara, Kevin Huang + 16 more2026-03-06🤖 cs.AI

Why Is RLHF Alignment Shallow? A Gradient Analysis

该论文通过梯度分析证明，基于梯度的对齐方法因在危害被确定后的位置梯度消失而本质上是浅层的，并据此提出了基于恢复惩罚的新目标以解决这一问题。

Robin Young2026-03-06🤖 cs.LG

SinhaLegal: A Benchmark Corpus for Information Extraction and Analysis in Sinhala Legislative Texts

本文介绍了名为 SinhaLegal 的斯里兰卡立法文本语料库，该语料库包含约 200 万词的 1206 份法律文件，经过 OCR 提取与人工清洗，并通过词汇分析、命名实体识别及语言模型困惑度评估等综合实验，为 Sinhala 法律领域的信息抽取与分析研究提供了关键资源。

Minduli Lasandi, Nevidu Jayatilleke2026-03-06💬 cs.CL

HACHIMI: Scalable and Controllable Student Persona Generation via Orchestrated Agents

本文提出了 HACHIMI 框架，通过多智能体协作与神经符号验证机制，生成了包含 100 万条数据、符合教育理论且分布可控的学生人格（HACHIMI-1M）语料库，为教育大模型提供了标准化的合成学生群体基准。

Yilin Jiang, Fei Tan, Xuanyu Yin + 2 more2026-03-06💬 cs.CL

FireBench: Evaluating Instruction Following in Enterprise and API-Driven LLM Applications

本文针对现有基准在评估企业级和 API 驱动场景下的指令遵循能力方面的不足，提出了基于真实业务模式的 FireBench 基准，该基准涵盖六大核心维度及 2400 多个样本，用于评估 11 种大语言模型在信息提取、客服及编码代理等场景中的表现，并开源以促进模型诊断与社区协作。

Yunfan Zhang, Yijie Bei, Jetashree Ravi + 1 more2026-03-06💬 cs.CL

Free Lunch for Pass@ $k$ ? Low Cost Diverse Sampling for Diffusion Language Models

该论文提出了一种无需训练且计算成本极低的干预方法，通过在扩散语言模型的采样过程中顺序修改中间样本以排斥冗余特征，从而显著提升了生成多样性及 Pass@ $k$ 性能。

Sean Lamont, Christian Walder, Paul Montague + 2 more2026-03-06🤖 cs.AI

Can LLMs Capture Expert Uncertainty? A Comparative Analysis of Value Alignment in Ethnographic Qualitative Research

该研究通过对比专家标注，评估了大语言模型在基于施瓦茨价值观理论分析民族志访谈中的表现，发现模型虽在集合匹配指标上接近人类水平且集成方法能提升效果，但在精确排序、不确定性结构及特定价值观（如安全）的偏差上仍存在局限，表明其可作为有潜力但需谨慎使用的定性研究协作工具。

Arina Kostina, Marios Dikaiakos, Alejandro Porcel + 1 more2026-03-06💬 cs.CL

Alignment Backfire: Language-Dependent Reversal of Safety Interventions Across 16 Languages in LLM Multi-Agent Systems

该研究通过四项预注册实验发现，LLM 多智能体系统中的安全对齐干预在英语中有效，却在日语等 15 种语言中引发“对齐反弹”效应，导致表面安全下掩盖着集体病态与内部解离，表明安全对齐效果受语言空间（文化、语用及训练数据属性）的结构性制约，无法简单跨语言迁移。

Hiroki Fukui2026-03-06🤖 cs.AI

AILS-NTUA at SemEval-2026 Task 10: Agentic LLMs for Psycholinguistic Marker Extraction and Conspiracy Endorsement Detection

本文介绍了 AILS-NTUA 团队在 SemEval-2026 任务 10 中提出的一种新型代理大语言模型流水线，该方案通过动态判别思维链（DD-CoT）和“反回声室”架构分别解决心理语言学标记提取与阴谋论支持检测中的语义歧义及客观报告误判问题，并在两个子任务中显著提升了性能指标。

Panagiotis Alexios Spanakis, Maria Lymperaiou, Giorgos Filandrianos + 2 more2026-03-06💬 cs.CL

AILS-NTUA at SemEval-2026 Task 3: Efficient Dimensional Aspect-Based Sentiment Analysis

本文介绍了 AILS-NTUA 团队在 SemEval-2026 任务 3 中提出的系统，该系统通过结合针对连续情感预测的编码器微调与基于 LoRA 的大语言模型指令微调，实现了跨语言和多领域下高效且性能优越的维度方面级情感分析。

Stavros Gazetas, Giorgos Filandrianos, Maria Lymperaiou + 3 more2026-03-06💬 cs.CL

Federated Heterogeneous Language Model Optimization for Hybrid Automatic Speech Recognition

本文针对混合自动语音识别中语言模型异构性带来的联邦学习合并难题，提出了包含遗传算法与强化学习算法的“匹配 - 合并”范式，实验表明其强化学习算法在七组数据集上不仅收敛速度显著快于遗传算法，还实现了更低的字符错误率和更强的泛化能力。

Mengze Hong, Yi Gu, Di Jiang + 4 more2026-03-06💬 cs.CL

LocalSUG: Geography-Aware LLM for Query Suggestion in Local-Life Services

本文提出了面向本地生活服务的地理感知查询建议框架 LocalSUG，通过引入城市感知候选挖掘、基于束搜索的 GRPO 训练算法以及质量感知的加速技术，有效解决了地理缺失、暴露偏差和推理延迟三大挑战，显著提升了点击率并降低了无结果率。

Jinwen Chen, Shuai Gong, Shiwen Zhang + 7 more2026-03-06💬 cs.CL

TimeWarp: Evaluating Web Agents by Revisiting the Past

本文提出了名为 TimeWarp 的基准测试，通过模拟网页 UI 和布局的演变来评估 Web 智能体的泛化能力，并进一步提出了利用多版本轨迹蒸馏的 TimeTraj 算法，显著提升了智能体在动态网页环境中的鲁棒性。

Md Farhan Ishmam, Kenneth Marino2026-03-06🤖 cs.AI

VisionPangu: A Compact and Fine-Grained Multimodal Assistant with 1.7B Parameters

本文提出了 VisionPangu，一款仅含 1.7B 参数的紧凑多模态模型，它通过结合 InternVL 视觉编码器、OpenPangu 语言骨干网络以及基于 DOCCI 数据集的细粒度指令微调，在无需大规模参数扩展的情况下实现了高质量且结构化的图像描述生成。

Jiaxin Fan, Wenpo Song2026-03-06💬 cs.CL

Replaying pre-training data improves fine-tuning

该研究发现，在针对特定领域（如数学）的微调过程中，有策略地回放预训练阶段的通用数据，不仅能防止遗忘，还能显著提升模型在目标任务上的表现和数据效率。

Suhas Kotha, Percy Liang2026-03-06🤖 cs.LG

When Weak LLMs Speak with Confidence, Preference Alignment Gets Stronger

该论文提出了一种名为置信度加权偏好优化（CW-PO）的通用框架，利用弱大语言模型的高置信度样本对训练数据进行重加权，结果显示仅需 20% 的人类标注数据即可超越使用 100% 人类标注的标准 DPO 方法，从而显著降低了偏好对齐的成本并提升了性能。

Amirabbas Afzali, Myeongho Jeon, Maria Brbic2026-03-06🤖 cs.AI

MPCEval: A Benchmark for Multi-Party Conversation Generation

本文针对多轮对话生成评估的瓶颈问题，提出了名为 MPCEval 的基准评测套件，该套件通过分解说话人建模、内容质量及一致性等维度，提供了一套新颖的、无参考的量化指标，以揭示不同评估目标下模型在多轮对话行为中的系统性差异。

Minxing Zhang, Yi Yang, Zhuofan Jia + 5 more2026-03-06🤖 cs.AI

Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation

本文提出了混合通用专家（MoUE）模型，通过引入“虚拟宽度”这一新维度，利用跨层共享专家池将深度转化为宽度，并借助交错旋转拓扑、深度感知负载平衡及轻量级轨迹状态路由等机制解决递归复用带来的挑战，从而在固定激活预算下显著提升了混合专家模型的扩展性与性能。

Yilong Chen, Naibin Gu, Junyuan Shang + 8 more2026-03-06🤖 cs.AI

Functionality-Oriented LLM Merging on the Fisher--Rao Manifold

该论文提出了一种基于 Fisher-Rao 流形加权 Karcher 均值的模型合并方法，通过将合并目标从欧几里得参数空间转向预测分布的功能性距离，有效解决了多模型合并中的表示崩溃问题并显著提升了性能。

Jiayu Wang, Zuojun Ye, Wenpeng Yin2026-03-06🤖 cs.LG

VRM: Teaching Reward Models to Understand Authentic Human Preferences

本文提出了名为 VRM（变分奖励模型）的新框架，通过引入变分推断技术将高维目标权重与低维语义特征作为潜在变量来显式模拟人类偏好评估过程，从而有效解决传统奖励模型的奖励黑客问题并显著提升对齐效果。

Biao Liu, Ning Xu, Junming Yang + 2 more2026-03-06💬 cs.CL

cs.CL