HALyPO: Heterogeneous-Agent Lyapunov Policy Optimization for Human-Robot Collaboration

本文提出了异构智能体李雅普诺夫策略优化(HALyPO)方法,通过在策略参数空间强制实施李雅普诺夫下降条件来消除人机协作中的理性差距,从而在无需状态约束的情况下实现去中心化策略学习的形式化稳定性,显著提升了机器人在复杂人机协作场景中的泛化能力与鲁棒性。

Hao Zhang, Yaru Niu, Yikai Wang + 2 more2026-03-05🤖 cs.AI

Cognition to Control - Multi-Agent Learning for Human-Humanoid Collaborative Transport

该论文提出了“认知到控制”(C2C)三层分层架构,通过结合视觉语言模型 grounding、基于多智能体强化学习的系统 2 式 deliberative 协调以及全身控制层,有效解决了人机协作搬运任务中从高层意图到接触稳定全身运动的转化难题,实现了比端到端基线更鲁棒的协作与涌现式领导 - 跟随行为。

Hao Zhang, Ding Zhao, H. Eric Tseng2026-03-05🤖 cs.AI

Pretrained Vision-Language-Action Models are Surprisingly Resistant to Forgetting in Continual Learning

本文发现,相较于从头训练的小型策略模型,预训练的大规模视觉 - 语言 - 动作(VLA)模型在持续学习中表现出惊人的抗遗忘能力,仅需简单的经验回放即可在保持新技能学习能力的同时实现零遗忘,且即使性能暂时下降,其保留的潜在知识也能通过微调快速恢复旧技能。

Huihan Liu, Changyeon Kim, Bo Liu + 2 more2026-03-05🤖 cs.AI

DISC: Dense Integrated Semantic Context for Large-Scale Open-Set Semantic Mapping

本文提出了 DISC(密集集成语义上下文)框架,通过利用视觉 Transformer 中间层直接提取距离加权的单遍 CLIP 嵌入,并结合全 GPU 加速的体素级在线更新机制,有效解决了现有开放集语义映射方法在上下文缺失和计算效率方面的瓶颈,从而在大规模复杂场景中实现了显著优于现有零样本方法的实时语义精度与检索性能。

Felix Igelbrink, Lennart Niecksch, Martin Atzmueller + 1 more2026-03-05💻 cs

RVN-Bench: A Benchmark for Reactive Visual Navigation

本文提出了 RVN-Bench,这是一个基于 Habitat 2.0 和高保真 HM3D 场景构建的碰撞感知基准测试,旨在解决现有室内视觉导航基准缺乏碰撞考量或仅适用于室外场景的问题,通过提供多样化的无地图环境、标准化评估指标及支持在线与离线学习的工具,推动安全且鲁棒的室内移动机器人视觉导航研究。

Jaewon Lee, Jaeseok Heo, Gunmin Lee + 3 more2026-03-05🤖 cs.AI