Learning Agile Gate Traversal via Analytical Optimal Policy Gradient
本文提出了一种结合离线训练神经网络与在线模型预测控制(MPC)的混合框架,通过解析策略梯度高效优化 MPC 参数及门框检测模块,实现了在极端加速度和强扰动下的高敏捷、高精度四旋翼无人机穿门飞行。
867 篇论文
本文提出了一种结合离线训练神经网络与在线模型预测控制(MPC)的混合框架,通过解析策略梯度高效优化 MPC 参数及门框检测模块,实现了在极端加速度和强扰动下的高敏捷、高精度四旋翼无人机穿门飞行。
本文提出了一种利用可微分仿真、时间到达图特权信息及偏航对齐损失函数的强化学习方法,使四旋翼无人机能够在包含大型障碍物的复杂环境中高效导航,并在真实户外场景中实现了无碰撞飞行。
本文通过引入时间归一化扩展了现有的责任度量框架,并提出了用于衡量冲突加剧程度的“参与度”指标,从而在多种社交机器人导航场景中实现了对冲突解决行为质量与前瞻性的有效评估。
本文提出了一种结合生成式建模与能量一致阻抗控制的“基于扩散的阻抗学习”框架,通过 Transformer 扩散模型重构零力轨迹并在线调节阻抗参数,使机器人在仅用少量样本训练后,能在实时力控下实现接触丰富任务的高精度操作与泛化。
本文提出了 GUIDE 框架,通过融合区域评估的全局图推理与扩散策略网络,有效解决了复杂室内环境中的未观测空间建模与全局路径规划难题,显著提升了探索效率并减少了冗余移动。
本文提出了一种利用多视图三角测量或粒子滤波处理含噪声图像分割序列以进行远距离物体定位的方法,该方法无需专用传感器或复杂三维重建,结合无人机机载计算资源即可实现可靠的无人机野火监测。
本文提出了一种结合仿真训练基策略与硬件演示驱动的传感器细化方法,通过跨注意力机制融合本体感知、触觉及力矩反馈,实现了灵巧手对剪刀、手术器械等复杂铰接工具在真实环境中的鲁棒在位操作与 Sim-to-Real 迁移。
本文提出了一种基于大语言模型与信号时序逻辑的机器人点对点协作协议,使机器人能够通过自然语言自主请求、推理并选择协助者,从而在无中心调度器的情况下高效解决异构机器人团队中的冲突并最小化任务完成时间。
本文提出了首个面向真实世界第一人称视角噪声观测的轨迹预测基准 EgoTraj-Bench,并设计了结合双流去噪与 EgoAnchor 机制的 BiFlow 模型,显著提升了机器人导航在感知受限环境下的轨迹预测鲁棒性与精度。
该论文提出将冲突搜索(CBS)作为一种通用协议,通过定义标准化的单智能体运动规划接口,实现了由不同制造商、采用多样化算法(如启发式搜索、采样、优化、扩散及强化学习等)的异构智能体在共享环境中高效协同完成独立任务。
本文提出了名为“看见更大图景”(SBP)的端到端移动操作策略学习方法,该方法通过构建并利用包含长程记忆与全局上下文信息的 3D 潜在特征地图,显著提升了机器人在复杂场景下的时空推理能力与任务成功率。
MachaGrasp 提出了一种基于形态感知和特征主成分(eigengrasp)的端到端框架,通过从手部形态描述中提取嵌入并预测低维关节系数,实现了跨不同灵巧手形态的泛化抓取生成,在仿真和真实世界实验中均取得了高成功率。
本文提出了 CBF-RL 框架,通过在训练阶段将控制障碍函数(CBF)安全过滤机制内化到强化学习策略中,使智能体在无需运行时安全过滤器的情况下即可实现安全探索、快速收敛及在真实机器人上的鲁棒安全部署。
本文提出了一种通过优化支撑超平面方向来寻找“最小限制超平面控制障碍函数”的方法,旨在解决传统距离基方法过于保守的问题,从而在确保动态系统安全的前提下,使其在复杂障碍物环境中能更灵活地执行期望控制。
本文提出了一种基于混合状态树、利用视觉语言模型(VLM)引导搜索与回溯、并结合物理仿真验证运动可行性的新型运动任务规划(TAMP)方法,显著提升了长程复杂问题的规划成功率与效率。
本文介绍了名为 SpikeATac 的多模态触觉手指,它通过结合压电动态传感与电容静态传感,并配合强化学习框架,成功实现了在灵巧手内对易碎物体的精细操作。
本文提出了一种基于经典龙格 - 库塔积分方法并结合李群理论的新型直接圆锥误差补偿算法,该算法不仅能退化为现有的主流补偿方案,还具备生成高阶补偿算法的清晰流程。
本文提出了一种名为 ROVER 的监管驱动方法,通过利用信号时序逻辑(STL)规范对黑盒机器人策略进行时序验证,并结合鲁棒性指标指导迭代重训练,从而在虚拟赛车和移动机器人导航等场景中显著提升了策略对时序安全要求的满足率与执行平滑度。
本文提出了名为 Observer-Actor (ObAct) 的新框架,该框架利用稀疏视角高斯泼溅(3DGS)技术,使双机械臂系统中的“观察者”臂主动移动至最佳视角以构建清晰场景并指导“执行者”臂,从而显著提升了在遮挡环境下基于轨迹迁移和行为克隆的模仿学习策略的鲁棒性与成功率。
本文提出了 MarketGen,这是一个具备自动场景生成功能的规模化仿真平台,旨在通过引入基于智能体的程序化内容生成框架、丰富的商品资产库以及针对收银和理货任务的基准测试,填补现有数据集在复杂商业环境(如超市)中缺乏长周期任务支持的空白,从而推动具身智能在商业领域的应用研究。