RehearseVLA: Simulated Post-Training for VLAs with Physically-Consistent World Model

RehearseVLA 提出了一种基于物理一致世界模型的强化学习后训练框架,通过虚拟仿真替代高风险的实体交互,有效解决了视觉 - 语言 - 动作(VLA)模型在数据稀缺场景下的性能退化、任务终止检测缺失及执行效率低下等问题,仅需少量专家演示即可实现显著的性能提升。

Junjin Xiao, Yandan Yang, Xinyuan Chang + 5 more2026-03-05💻 cs

ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL Problems

本文提出了 ELMUR(具有更新/重写功能的外部层记忆),这是一种带有结构化外部记忆的 Transformer 架构,通过每层维护记忆嵌入并结合 LRU 机制进行更新,有效解决了长时程部分可观测强化学习中的依赖保持难题,在合成迷宫、POPGym 及 MIKASA-Robo 机器人操作等任务中显著超越了现有基线方法。

Egor Cherepanov, Alexey K. Kovalev, Aleksandr I. Panov2026-03-05🤖 cs.AI

CERNet: Class-Embedding Predictive-Coding RNN for Unified Robot Motion, Recognition, and Confidence Estimation

本文提出了一种名为 CERNet 的统一分层预测编码循环神经网络模型,通过动态更新的类嵌入向量,在单一框架内实现了机器人运动生成、实时意图识别及基于预测误差的内在置信度估计,并在人形机器人实验中显著降低了轨迹重演误差并验证了其在线识别与抗干扰能力。

Hiroki Sawada, Alexandre Pitti, Mathias Quoy2026-03-05💻 cs