Expert Knowledge-driven Reinforcement Learning for Autonomous Racing via Trajectory Guidance and Dynamics Constraints
该论文提出了一种名为 TraD-RL 的强化学习方法,通过融合专家轨迹引导、基于控制障碍函数的动力学安全约束以及多阶段课程学习策略,有效解决了自动驾驶赛车在高动态非线性环境下的训练不稳定与安全性问题,实现了速度与稳定性的协同优化。
864 篇论文
该论文提出了一种名为 TraD-RL 的强化学习方法,通过融合专家轨迹引导、基于控制障碍函数的动力学安全约束以及多阶段课程学习策略,有效解决了自动驾驶赛车在高动态非线性环境下的训练不稳定与安全性问题,实现了速度与稳定性的协同优化。
本文提出了名为 DexEMG 的轻量级肌电遥操作系统,通过训练基于表面肌电信号的手势预测模型(EMG2Pose)并结合鲁棒的手部重定向算法,实现了无需频繁个体校准即可在复杂环境中高精度控制灵巧机械手的通用化目标。
本文提出了 AnyCamVLA,一种无需额外演示数据或微调即可通过实时虚拟视角合成来适应不同相机视角的零-shot 框架,显著提升了预训练视觉 - 语言 - 动作模型在机器人操作中的视角鲁棒性。
该论文利用五个公共视频地点识别数据库和七种图像相似度方法,系统评估了合成新视角对视频地点识别的影响,发现少量合成视角能提升识别效果,而在大规模添加时,视角变化的幅度不如添加视角的数量和数据集图像类型重要。
本文提出了一种基于弹簧质量模型的简单控制策略,通过调整触地角度和施加预补偿力矩,有效解决了小型跳跃机器人在斜坡上因倾斜地面导致的不稳定旋转问题,使其能在无需复杂传感与计算的情况下实现稳定跳跃。
本文提出了一种基于精确凸多面体最近点计算生成线性控制屏障函数约束的迭代凸优化框架,通过局部线性化实现了非线性系统在多面体障碍物环境下的实时安全轨迹规划。
FTSplat 提出了一种前馈三角形点阵网络,通过从多视图图像直接预测连续三角形表面,实现了无需单场景优化即可生成适用于机器人仿真的高保真、流形几何 3D 重建。
该论文提出了名为 Swooper 的基于深度强化学习的方法,通过两阶段训练策略使搭载简易夹爪的轻量级四旋翼无人机在零样本部署下实现了高达 1.5 米/秒的飞行速度与 84% 的实机抓取成功率。
本文针对 2025 年推出的 Crazyflie Brushless 无人机建立了精确的动力学模型,并通过仿真与硬件实验验证了其在强化学习控制及高难度特技动作(如后空翻)中的有效性,同时开源了该项目以助力相关研究。
本文提出了 PROBE,一种无需学习的 LiDAR 三维地点识别描述子,它通过将鸟瞰图(BEV)单元建模为伯努利随机变量并利用极坐标雅可比行列式解析地边缘化连续平移,实现了跨传感器泛化且无需针对特定数据集进行调优,在多个数据集上取得了优于现有手工描述子的性能。
本文提出了一种仅利用每根杆件相对于重力的倾角信息(通过 IMU 获取)来估计整个张拉整体机械臂形状的能量最小化方法,并在包含 20 根杆件的五层大型机械臂实验中验证了其在静态及受扰条件下均能实现高精度(误差为总长的 2.1%)的 proprioceptive 形状估计。
该论文提出了 HarvestFlex 系统,首次通过视觉 - 语言 - 动作(VLA)策略迁移,利用仅 3.71 小时的 VR 遥操作数据和多视角 RGB 感知,在无需深度云和显式几何校准的情况下,成功实现了温室草莓采摘任务中 74.0% 的成功率。
本文提出了 MagRobot,这是首个用于磁导航机器人研究、设计与基准测试的通用开源仿真平台,该平台具备直观的图形界面、支持软硬体机器人及可变形解剖结构的磁驱动与磁追踪任务模拟,并已通过多种实验验证其高保真度与在支气管镜、血管介入及胃肠内镜等场景中的广泛应用潜力。
该论文提出了名为“Moving Through Clutter"的开源虚拟现实框架,通过程序化生成杂乱场景并采集全身人体运动数据,构建了首个将全身人形机器人运动与场景几何约束系统性结合的 348 条轨迹数据集,旨在推动杂乱 3D 环境中场景感知的人形机器人 locomotion 研究。
本文提出了名为 TADPO 的新型策略梯度算法,通过结合离线轨迹的教师指导与在线轨迹的学生探索,成功构建了首个能在极端地形下实现高速驾驶并具备零样本仿真到现实迁移能力的端到端强化学习全尺寸越野车辆系统。
该论文针对视觉 - 语言 - 动作(VLA)模型在指令与场景冲突时表现出的“语言盲视”问题,提出了无需训练且即插即用的指令引导注意力重校准(IGAR)方法,通过重构注意力分布显著提升了模型在分布外矛盾指令下的可靠性,同时保持了基线任务性能。
该论文针对自动驾驶 VLA 模型中因模仿学习导致探索不足的问题,提出了名为 Curious-VLA 的两阶段框架,通过可行轨迹扩展策略和自适应多样性采样等创新方法有效平衡了利用与探索,从而在 Navsim 基准测试中取得了当前最优的性能表现。
本文提出了名为 RODEO 的基于区块链的去中心化组织框架,通过建立 ROS-ETH 桥接、提供组织集成模板及可审计的验证机制,实现了服务机器人自主执行任务、获取代币奖励并自动再投资以延长运行时间的闭环经济系统。
本文提出了一种将废弃的全向 RGB-LiDAR 日志转化为 3D 高斯泼溅(3DGS)鲁棒初始化资产的高效流水线,通过解决畸变校正、点云降采样及多模态配准等挑战,实现了从标准传感器数据到高质量数字孪生的确定性构建。
本文提出了名为 Uni-Walker 的终身具身导航学习框架,通过解耦任务共享与特定知识、结合知识继承、专家协同激活及正交约束等策略,有效解决了大语言模型驱动的智能体在连续多任务导航中面临的灾难性遗忘问题。