Overcoming Visual Clutter in Vision Language Action Models via Concept-Gated Visual Distillation

本文提出了一种无需训练且模型无关的推理框架“概念门控视觉蒸馏”(CGVD),通过指令解析、目标细化及基于傅里叶变换的图像修复技术,有效抑制视觉噪声并保留关键几何信息,从而显著提升了视觉 - 语言 - 动作模型在高度杂乱环境中的操作成功率。

Sangmim Song, Sarath Kodagoda, Marc Carmichael, Karthick Thiyagarajan2026-03-12⚡ eess

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

本文针对联邦主动学习在极端非独立同分布和全局类别不平衡场景下的性能退化问题,提出了一种名为 FairFAL 的自适应框架,通过轻量级预测差异自适应选择查询模型、利用全局特征进行原型引导的伪标签生成以及两阶段不确定性 - 多样性平衡采样策略,显著提升了长尾和非独立同分布设置下的最终性能。

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

本文提出了名为 HEAL 的无强化学习框架,通过结合引导熵辅助修复、困惑度 - 不确定性比率估计及渐进式答案引导课程演化三大核心模块,有效突破了传统知识蒸馏中教师模型能力上限的制约,显著提升了小型模型从大型推理模型中学习复杂推理能力的水准。

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Few-Shot Adaptation to Non-Stationary Environments via Latent Trend Embedding for Robotics

该论文提出了一种基于潜在趋势标识(Trend ID)的框架,通过在保持模型参数固定的情况下估计低维环境状态并引入时间正则化,实现了机器人在非平稳环境中无需更新权重的少样本适应,从而有效解决了概念漂移问题并避免了灾难性遗忘。

Yasuyuki Fujii (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan), Emika Kameda (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan), Hiroki Fukada (Production and Technology Department, NIPPN CORPORATION, Tokyo, Japan), Yoshiki Mori (University of Osaka, Osaka, Japan), Tadashi Matsuo (National Institute of Technology, Ichinoseki College, Iwate, Japan), Nobutaka Shimada (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan)2026-03-12🤖 cs.AI

Verbalizing LLM's Higher-order Uncertainty via Imprecise Probabilities

该论文针对大语言模型在模糊问答等场景下传统概率框架无法准确捕捉其不确定性行为的局限,提出了一种基于不精确概率的新型提示与后处理方法,旨在通过量化一阶(响应不确定性)和二阶(模型本身的不确定性)不确定性,实现更可信的模型不确定性表达并辅助下游决策。

Anita Yang, Krikamol Muandet, Michele Caprio, Siu Lun Chau, Masaki Adachi2026-03-12🤖 cs.AI

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

该论文通过理论分析与实验验证,揭示了标签噪声 SGD 在两层过参数化线性网络中通过驱动模型从“懒惰”区域向“丰富”区域转变并增强权重与真实插值器的对齐,从而解释了其提升泛化能力的内在机制,并将该发现推广至锐度感知最小化(SAM)等更广泛的优化算法。

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG