Embedding interpretable 1\ell_1-regression into neural networks for uncovering temporal structure in cell imaging

该论文提出了一种将可解释的1\ell_1正则化向量自回归模型嵌入卷积自编码器的方法,通过区分稀疏动态与静态空间信息,从双光子钙成像数据中有效提取稀疏时间结构并实现动态驱动因素的可视化。

Fabian Kabus, Maren Hackenberg, Julia Hindel, Thibault Cholvin, Antje Kilias, Thomas Brox, Abhinav Valada, Marlene Bartos, Harald Binder2026-03-10🤖 cs.LG

CGL: Advancing Continual GUI Learning via Reinforcement Fine-Tuning

本文提出了名为 CGL 的持续 GUI 学习框架,通过基于策略熵动态调整监督微调与强化学习的比例,并采用将 SFT 梯度投影到 GRPO 锚点梯度上的梯度手术策略,有效解决了 GUI 智能体在适应新任务时遗忘旧知识的难题,同时发布了 AndroidControl-CL 基准以评估该性能。

Zhenquan Yao, Zitong Huang, Yihan Zeng, Jianhua Han, Hang Xu, Chun-Mei Feng, Jianwei Ma, Wangmeng Zuo2026-03-10🤖 cs.LG

Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement

该论文提出了组分探针分解(CPD)方法,揭示了在原子基础模型中,任务对齐度是决定几何与组分信息能否线性解耦的主导因素,并发现不同架构模型间存在显著的线性可及性梯度,且信息在特定对称性通道(如向量通道编码偶极矩、标量通道编码能隙)中按对称类型路由。

Joshua Steier2026-03-10🤖 cs.LG

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

本文提出了 XInsight,一个受心理咨询启发的多智能体框架,通过模拟“探索 - 洞察 - 行动”范式及“推理 - 干预 - 反思”循环,将开放式网络对话转化为标准化的心理治疗记录,并引入 XInsight-Bench 评估基准,从而为数字健康应用提供了更具可解释性、连贯性和临床一致性的心理支持解决方案。

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng Wang2026-03-10🤖 cs.LG

How Attention Sinks Emerge in Large Language Models: An Interpretability Perspective

该论文从可解释性视角揭示了大语言模型中“注意力汇聚”现象的成因,提出了一种不依赖语义信息的"P0 汇聚电路”机制,解释了模型如何在输入序列首个令牌处形成注意力汇聚,并发现该机制在训练早期出现且随训练进程逐渐集中,可作为预训练收敛状态的潜在指标。

Runyu Peng, Ruixiao Li, Mingshu Chen, Yunhua Zhou, Qipeng Guo, Xipeng Qiu2026-03-10🤖 cs.LG

Know When You're Wrong: Aligning Confidence with Correctness for LLM Error Detection

该论文提出了一种基于输出锚点概率的归一化置信度评分框架,用于在无需外部验证的情况下检测大语言模型的错误与幻觉,并通过理论分析与实验证实了监督微调能提升置信度校准性而强化学习易导致过度自信,进而提出后强化学习微调方案以恢复模型可靠性,最终实现了在自适应检索增强生成中仅用 58% 的检索操作即可恢复 95% 最大精度增益的高效应用。

Xie Xiaohu, Liu Xiaohu, Yao Benjamin2026-03-10🤖 cs.LG

Structure-Aware Set Transformers: Temporal and Variable-Type Attention Biases for Asynchronous Clinical Time Series

本文提出了结构感知集合变换器(STAR-Set),通过引入可学习的软注意力偏置(时间局部性惩罚和变量类型亲和力)来恢复电子健康记录中异步多变量时间序列的轨迹与上下文结构,从而在 ICU 预测任务中显著优于现有的网格化及集合基线模型。

Joohyung Lee, Kwanhyung Lee, Changhun Kim, Eunho Yang2026-03-10🤖 cs.LG