Lifelong Language-Conditioned Robotic Manipulation Learning
本文提出了名为 SkillsCrafter 的机器人操作框架,通过技能适应与技能专业化聚合机制,利用奇异值分解构建技能语义子空间,从而在持续学习新技能的同时有效避免灾难性遗忘并提升泛化能力。
867 篇论文
本文提出了名为 SkillsCrafter 的机器人操作框架,通过技能适应与技能专业化聚合机制,利用奇异值分解构建技能语义子空间,从而在持续学习新技能的同时有效避免灾难性遗忘并提升泛化能力。
本文提出了名为“闭环批评者”的自适应分层框架,通过结合负责全局推理的 VLM“大脑”、执行快速反应的 VLA“小脑”以及动态路由控制权的轻量级视觉“批评者”,在最小化高成本查询的同时显著提升了机器人长程操作任务在分布外场景下的鲁棒性与自主性。
本文提出了一种由数字孪生驱动的自动化纺织分拣系统,该系统通过融合多模态感知、双机械臂操作及视觉语言模型(VLM),实现了对变形纺织品和异物的实时分类与识别,并在实际工业场景中验证了其高准确率与可靠性。
本文主张拓展协作机器人在康复领域的应用范畴,使其在物理治疗师和患者的治疗前、中、后各阶段提供协助,以突破现有资源限制并推动基于能力的疗法设计,同时指出了实现这一愿景所需克服的技术与流程挑战。
本文提出了一种名为 CDSM 的实时框架,通过在黎曼流形和李群上构建切向驱动与法向吸引相结合的动态系统,实现了具有几何结构感知、稳定性及高适应性的机器人行为生成,并在 SE(3) 和 SPD(n) 等实际场景中验证了其优越性。
本文提出了一种结合车辆环(ViL)与数字孪生技术的测试框架,通过将物理车辆底盘与虚拟仿真环境同步耦合,在中央车载服务器上直接运行全栈自动驾驶软件,从而为自动驾驶算法提供了一种安全、可复现且无需单独测试各物理 ECU 的高效验证方案。
本文提出了 HD-ExpIt 框架,通过利用环境反馈构建自强化循环,对语言条件分层扩散策略进行迭代微调,从而在无需显式代理模型的情况下弥合规划器与控制器之间的能力差距,并在 CALVIN 基准测试中实现了从 scratch 训练的最先进性能。
本文提出了潜在策略引导(LPS)方法,通过利用可微分的单步 MeanFlow 策略将原始动作空间的 Q 梯度反向传播至潜在动作空间,从而在无需代理潜在评论家的情况下实现高保真度的策略优化,有效解决了离线强化学习中回报最大化与行为约束之间的权衡难题,并在多项基准测试中取得了最先进性能。
本文提出了一种基于几何精确配置且无约束的连续体并联机器人静力学建模方法,通过运动学嵌入消除连接约束并利用流形上的牛顿迭代求解,有效解决了大变形与大旋转条件下的非线性平衡问题,并经实验验证了其高精度。
本文提出了名为 UltraDexGrasp 的框架,通过结合优化与规划方法生成包含 2000 万帧数据的大规模合成数据集,训练出一种仅依赖合成数据即可在真实世界中实现高成功率零样本迁移的双手灵巧抓取策略。
本文提出了一种基于 CT 影像的患者特异性仿真与接触感知机器人规划统一流程,通过构建可微分的柯西杆模型及在线方向更新律,实现了 cochlear implant 插入过程中的接触力精确预测与调控,从而有效降低机械锁死与屈曲风险并提升手术安全性。
本文提出了 Omni-Manip,一种基于全向 LiDAR 感知的端到端人形机器人操作策略,通过时间感知注意力池化机制处理全景点云,使机器人能够在无需频繁移动底座的情况下,在超大工作空间及杂乱环境中实现鲁棒的灵巧操作。
OpenFrontier 提出了一种无需训练、不依赖稠密 3D 建图或策略微调的通用导航框架,通过利用视觉 - 语言先验模型将导航前沿作为语义锚点,实现了在开放世界环境中高效且具备强零样本泛化能力的机器人导航。
本文提出了一种名为 MPPI-DK 的模型预测路径积分控制框架,通过利用从交互数据中学习的深度 Koopman 算子替代非线性动力学进行轨迹传播,在显著降低计算成本的同时实现了与真实动力学模型相当的实时控制性能。
本文提出了一种名为 CliReg 的新型确定性算法,通过利用特征对应关系兼容性图上的最大团搜索来替代传统的 RANSAC 验证,从而在 3D LiDAR SLAM 中实现了比 RANSAC 更鲁棒、更准确的闭环检测与位姿估计。
ROScopter 是一款基于 ROSflight 2.0 和 ROS 2 构建的轻量级多旋翼飞控,旨在通过其模块化且易于修改的架构,加速研究人员在仿真与硬件环境下的代码测试,并在保持与先进飞控相当性能的同时显著简化代码库。
本文提出了一种名为 PhysiFlow 的基于多脑潜在流匹配与鲁棒跟踪的物理感知人形机器人全身 VLA 框架,通过语义运动意图引导有效解决了现有方法在动态肢体协调任务中推理效率低及控制不稳定的问题,实现了可靠的全身体协调控制。
该论文提出了 CompACT 离散分词器,将每个观测压缩至仅 8 个 token,从而在保留规划所需关键信息的同时,显著降低了基于世界模型的决策规划计算成本,使其更适用于实时控制场景。
本文提出了一种结合模型预测控制(MPC)与软演员 - 评论家(SAC)强化学习残差策略的混合控制器,通过在接触阶段施加有界速度修正,显著提升了磁滚动微机器人时变流场下细胞推运的鲁棒性、跟踪精度及轨迹泛化能力。
本文提出了特征可观测性与可控制性两个核心概念,通过线性分类器观测和基于最优控制的线性干预,实现了在不微调的情况下对视觉 - 语言 - 动作模型内部结构的实时解读与行为引导,使其能够灵活适应用户偏好与任务需求。