NaviGait: Navigating Dynamically Feasible Gait Libraries using Deep Reinforcement Learning
NaviGait 提出了一种结合轨迹优化结构与强化学习适应性的分层框架,通过从离线步态库中选择、微调并稳定步态,实现了训练更快、奖励设计更直观且兼具高鲁棒性与参考运动保真度的双足机器人 locomotion 控制。
666 篇论文
NaviGait 提出了一种结合轨迹优化结构与强化学习适应性的分层框架,通过从离线步态库中选择、微调并稳定步态,实现了训练更快、奖励设计更直观且兼具高鲁棒性与参考运动保真度的双足机器人 locomotion 控制。
本文提出了名为 RL-100 的实世界机器人强化学习框架,该框架基于扩散视觉运动策略,通过统一模仿学习与强化学习并结合一致性蒸馏技术,在八个多样化的真实机器人任务中实现了 100% 的成功率,展现出卓越的零样本泛化能力、抗扰动鲁棒性及与人类专家相当甚至更优的操作效率。
本文提出了名为 FALCON 的新范式,通过利用空间基础模型从 RGB 图像中提取丰富的 3D 几何先验并注入动作头,有效弥补了现有视觉 - 语言 - 动作模型在空间推理上的不足,从而在仿真和真实世界任务中实现了超越基线的状态-of-the-art 性能。
该论文挑战了动态环境中增量规划必须复用旧有信息的传统假设,提出利用快速几乎必然渐近最优(ASAO)算法将增量规划问题转化为一系列独立求解任务,从而在无需显式复用计划的情况下更高效地应对环境变化并生成高质量路径。
本文提出了名为 SynHLMA 的新框架,利用离散的人机交互表示和语言模型,实现了根据自然语言指令生成可变形关节物体的手部操作序列,并在生成、预测及插值任务中展现出优于现有技术的性能,同时支持机器人模仿学习抓取应用。
本文提出了 EgoMI 框架,通过从第一人称视角捕捉同步的手部操作与主动头部运动轨迹,并结合记忆增强策略,有效解决了人形机器人模仿学习中因视角差异导致的分布偏移问题,显著提升了半人形机器人的操作性能。
该论文提出了一种名为 PACS 的路径一致性安全过滤方法,通过基于集合可达性分析对扩散策略生成的轨迹进行一致性制动,在动态环境中为机器人提供形式化安全保证的同时,有效避免了传统安全机制因偏离训练分布而导致的任务性能下降。
本文提出了名为 AFRO 的自监督框架,通过在不依赖动作或重建监督的情况下,利用生成扩散过程联合建模正向与逆向动力学,成功解决了现有 3D 视觉预训练方法在机器人操作任务中因缺乏状态 - 动作动态建模而表现不佳的问题,显著提升了多任务下的操作成功率并展现出良好的可扩展性。
本文提出了 UniBYD 统一框架,通过结合统一形态表示、动态 PPO 算法及混合马尔可夫影子引擎,实现了从模仿人类演示到适应多样化机器人形态的强化学习策略探索,并在首个跨本体操作基准 UniManip 上取得了显著性能提升。
本文介绍了一种针对模块化自重构机器人 SnailBot 的相对定位系统设计,该系统通过融合 ArUco 标记识别、光流分析与 IMU 数据处理,实现了动态场景下鲁棒且准确的实时相对定位。
本文提出了一种由三个磁性珠子和两个弹性连接组成的磁驱动弹性微游泳器,其利用外部振荡磁场诱导的滞后性非互易折叠与展开机制实现净推进,并通过优化几何结构与磁场参数实现了对不同微游泳器的独立控制,为靶向药物输送等微创医疗应用提供了可行方案。
本文介绍了一款名为 AirPulse 的 26 克蝴蝶仿生机器人,它通过模仿生物的低频拍翅与身体波动特性,并采用分层控制架构,首次实现了该尺度下尾翼缺失双翼平台的自主闭环飞行。
本文提出了一种结合混合触觉感知(压电与压阻传感器)与内部力优化的混合学习及模型驱动方法,通过实时检测滑移并在线调整零空间内力,实现了多指机器人夹持在 35-40 毫秒延迟内的快速闭环防滑稳定控制。
本文提出了一种名为 MAQP 的多模态对抗质量策略,通过异构双补丁优化方案(HDPOS)和梯度级模态平衡策略(GLMBS),有效解决了基于 RGB-D 模态的机器人抓取中因深度无关性导致的现有对抗补丁方法失效问题,从而提升了人机交互中的抓取安全性。
Pri4R 提出了一种简单有效的训练方法,通过利用特权 4D 信息(3D 点轨迹预测)作为辅助任务,使视觉 - 语言 - 动作(VLA)模型在无需增加推理开销的情况下,隐式地习得世界动力学规律,从而显著提升了其在复杂操作任务中的物理感知与控制能力。
该论文提出了一种名为 SPARC 的基于关系增强多头注意力(RMHA)的通信机制,通过将曼哈顿距离显式嵌入注意力权重计算,使机器人在去中心化多机器人路径规划中能够动态优先处理空间相关邻居的信息,从而在零样本泛化到大规模高密度场景时显著提升了任务成功率。
本文提出了 SPREAD 框架,通过利用奇异值分解在低秩子空间中对齐策略表示以保留任务几何结构,并结合基于置信度的蒸馏策略,有效解决了终身模仿学习中的灾难性遗忘问题,在 LIBERO 基准测试中实现了最先进的性能。
该研究探讨了社会机器人指向性凝视在辅助老年人日常任务中的作用,并分析了年龄差异如何影响不同人群对这种非语言线索的社会感知,旨在为设计适应年龄特征的人机交互非语言提示提供依据。
Scale-Plan 是一个可扩展的框架,它利用大语言模型从自然语言指令中提取紧凑的任务相关表示,通过构建动作图并引导结构化搜索来过滤无关信息,从而有效解决异构多机器人系统在复杂长时程任务规划中的可扩展性与可靠性问题,并在其提出的 MAT2-THOR 基准测试中显著优于现有方法。
该论文针对康复医疗中缺乏标准化评估和开源多模态数据集的痛点,构建了包含 1.2 万张图像和 17 万问答对的 MedMassage-12K 数据集,并提出了一种结合视觉语言模型进行穴位定位与轨迹规划的分层按摩机器人框架,通过物理实验验证了其在具身医疗中的有效性。