LAR-MoE: Latent-Aligned Routing for Mixture of Experts in Robotic Imitation Learning
本文提出了 LAR-MoE 框架,通过两阶段训练将无监督技能发现与策略学习解耦,利用潜在空间对齐路由机制在无需标注的情况下实现专家专业化,从而显著提升了机器人在异构任务中的模仿学习性能。
864 篇论文
本文提出了 LAR-MoE 框架,通过两阶段训练将无监督技能发现与策略学习解耦,利用潜在空间对齐路由机制在无需标注的情况下实现专家专业化,从而显著提升了机器人在异构任务中的模仿学习性能。
本文提出了 STRIDE 框架,通过联合训练拉格朗日神经网络以保留保守刚体力学结构,并利用条件流匹配建模非保守的随机交互残差,从而在不确定环境中显著降低了长时程预测误差和接触力预测误差。
本文提出了 3PoinTr 方法,利用 Transformer 架构从非约束的人类视频中预测 3D 点轨迹作为中间表征,从而仅需少量机器人演示即可实现高效预训练,有效克服了具身差距并提升了机器人操作策略的泛化能力。
本文提出了 ProReFF 模型,通过从无标签观测中隐式学习物体共现的相对特征分布,并利用该语义先验引导机器人搜索,使其在 Matterport3D 仿真环境中的搜索效率比最强基线提升 20%,达到人类性能的 80%。
本文提出了“交互式世界模拟器”(Interactive World Simulator)框架,利用一致性模型从中等规模数据集构建快速且物理一致的交互世界模型,不仅支持长达 10 分钟以上的稳定仿真,还证明了在此生成的数据训练出的机器人策略在真实世界中能达到与真实数据训练相当的性能,并实现了仿真与实机表现的高度相关性。
本文提出了一种名为 OA-Bug 的嗅觉 - 听觉增强型 Bug 算法,旨在解决 denied 环境下群机器人无法依赖 GNSS、建图及数据共享的难题,通过模拟动物利用嗅觉和听觉信号进行协作,显著提升了搜索覆盖率并经由仿真与实物实验验证了其有效性。
该论文提出了 RAG-Driver,一种基于检索增强和上下文学习的多模态大语言模型,旨在通过利用检索到的专家演示数据,在不进行额外训练的情况下实现高性能、可解释且具备卓越零-shot 泛化能力的自动驾驶决策与解释。
本文提出了 FALCON,一种针对无人机视频动作识别的统一自监督预训练方法,通过结合物体感知掩码自编码与物体中心的双视野未来重建,有效解决了航拍画面中背景杂乱导致的空间不平衡问题,显著提升了识别精度并实现了比传统监督方法快 2 至 5 倍的推理速度。
该论文提出了一种新颖高效的稀疏分层非线性规划框架,通过利用 范数和分层结构,将决策制定与逆运动学规划及控制紧密集成,从而解决了传统方法在计算效率或精度上的局限,实现了如从大量候选点中同步选择末端执行器位置等复杂非线性分层决策问题。
该论文提出了“生成式预测控制”框架,通过利用采样式预测控制与生成建模之间的紧密联系,解决了现有生成式控制策略依赖专家演示且难以应对快速动态任务的局限,实现了基于模拟数据训练、支持高频反馈且具备时间一致性的流匹配策略。
本文提出了一种名为 CAPS 的上下文感知优先级采样方法,该方法利用 VQ-VAE 提取结构化特征并聚类数据以解决模仿学习中的样本不平衡问题,从而在 CARLA 仿真中显著提升了自动驾驶模型在 Bench2Drive 场景下的泛化能力、驾驶得分及成功率。
该论文展示了结合 MuJoCo 动力学与有限差分导数的迭代 LQR(iLQR)算法,能够以极简方式在真实世界中实现四足及人形机器人的全身模型预测控制,并成功应用于多种动态运动任务,从而降低了相关研究的门槛。
该论文提出了一种基于多子图配准与姿态图优化的在线激光里程计方法,通过引入多地图注册机制及回溯式地图锚点优化,在保持实时性的同时显著提升了轨迹估计的短期一致性与长期精度。
本文提出了 FindAnything 框架,通过基于 eSAM 分割的物体级特征聚合,将视觉语言信息高效融入致密体素子地图,从而在显著降低计算与存储开销的同时,实现了适用于大型未知环境及资源受限设备(如微型飞行器)的实时开放词汇与物体中心建图。
本文提出了一种以能量为基础的鲁棒性度量方法,通过分层优化流程联合选择工具并规划接触丰富的操作轨迹,使机器人能够在外部干扰下实现鲁棒的工具使用与操作。
本文提出了一种基于 MeROS 元模型和 V 模型的结构化方法论,旨在通过模型系统工程(MBSE)解决 ROS 机器人系统在语义一致性和结构可追溯性方面的复杂性,从而实现从设计到验证的全生命周期协调管理。
该论文提出了一种基于师生框架的自动课程学习新方法,利用图结构多智能体强化学习作为教师自适应生成涵盖从常规到关键场景的多样化交通行为,从而有效训练出在复杂真实交通环境中更具鲁棒性、平衡性和进取性的自动驾驶智能体。
该论文提出了一种基于图形界面的无代码交互式框架,旨在通过简化的场景生成流程降低自动驾驶仿真验证的门槛,使非技术用户也能轻松创建、管理和执行多样化的测试场景。
本文提出了 VEGA,一种结合物理信息神经算子(PINO)进行车辆参数估计与近端策略优化(PPO)进行充电感知路径规划的电动汽车导航系统,该系统在跨大陆路线上实现了比传统启发式算法快 20 倍以上的推理速度,并展现出对法国和日本路网的零样本泛化能力。
该论文提出了一种融合自然语言理解与空间推理的多模态框架,通过利用飞行员语音指令来增强无塔台空域中航空器目标预测的准确性,从而提升自主飞行决策能力。