Open-World Task and Motion Planning via Vision-Language Model Genereated Constraints

该论文提出了一种名为 OWL-TAMP 的新方法,通过利用视觉语言模型生成离散的行动排序约束和连续的代码化约束,成功将大模型的常识推理能力与任务运动规划系统相结合,从而实现了在开放世界中直接根据自然语言指令解决复杂的长程机器人操作任务。

Nishanth Kumar, William Shen, Fabio Ramos, Dieter Fox, Tomás Lozano-Pérez, Leslie Pack Kaelbling, Caelan Reed GarrettWed, 11 Ma💻 cs

Image Compression Using Novel View Synthesis Priors

该论文提出了一种利用先验任务信息和训练好的新视图合成模型,通过梯度下降优化潜在表示来生成可压缩差异的基于模型的图像压缩技术,旨在解决水下遥控机器人实时视觉反馈的带宽受限问题,并在人工海洋盆地数据集上验证了其优于现有方法的压缩率、图像质量及对场景中新物体的鲁棒性。

Luyuan Peng, Mandar Chitre, Hari Vishnu, Yuen Min Too, Bharath Kalyan, Rajat Mishra, Soo Pieng TanWed, 11 Ma⚡ eess

Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics

该论文提出了一种名为 iMarkers 的创新型隐形基准标记,旨在解决传统可见标记破坏环境美观的问题,通过专为机器人和 AR 设备设计的硬件与开源算法,实现了在保持视觉隐蔽性的同时具备高灵活性、鲁棒性及广泛适用性的导航与识别功能。

Ali Tourani, Deniz Isinsu Avsar, Hriday Bavle, Jose Luis Sanchez-Lopez, Jan Lagerwall, Holger VoosWed, 11 Ma💻 cs

A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

本文提出了一种基于无似然推断的端到端 Real2Sim2Real 框架,通过利用视觉和本体感知数据估计可变形线性物体(DLO)物理参数的后验分布以进行域随机化训练,实现了无需微调即可将模拟中训练的策略零样本迁移至真实世界的 DLO 操控任务。

Georgios Kamaras, Subramanian RamamoorthyWed, 11 Ma🤖 cs.LG

Multi-Quadruped Cooperative Object Transport: Learning Decentralized Pinch-Lift-Move

该论文提出了一种基于分层策略和星座奖励机制的去中心化多足机器人协作搬运方法,使 N 台四足机器人在无通信、无刚性连接且仅靠物理接触的情况下,能够协同完成对不可抓取物体的夹取、提升与移动任务,并实现了从 2 到 10 台机器人的任意规模扩展及仿真到现实的迁移。

Bikram Pandit, Aayam Kumar Shrestha, Alan FernWed, 11 Ma💻 cs

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

本文介绍了机器人控制堆栈(RCS),这是一个专为支持大规模通用策略(如 VLA)研究而设计的轻量级生态系统,它通过模块化分层架构统一了仿真与物理机器人接口,有效解决了传统框架在机器人学习工作流中的瓶颈问题,并验证了其在提升策略性能及促进虚实迁移方面的有效性。

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian WalterWed, 11 Ma🤖 cs.LG

Automated Coral Spawn Monitoring for Reef Restoration: The Coral Spawn and Larvae Imaging Camera System (CSLICS)

本文提出了一种名为 CSLICS 的低成本模块化成像系统,利用人机协作训练的目标检测技术实现珊瑚产卵的自动化计数,在 Great Barrier Reef 的实验中不仅显著提升了不同发育阶段产卵检测的准确率(表面检测 F1 分数达 82.4%),还大幅减少了人工劳动时间,从而有效推动了珊瑚礁生态修复的规模化发展。

Dorian Tsai, Christopher A. Brunner, Riki Lamont, F. Mikaela Nordborg, Andrea Severati, Java Terry, Karen Jackel, Matthew Dunbabin, Tobias Fischer, Scarlett RaineWed, 11 Ma💻 cs

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

该论文提出了一种名为通用策略组合(GPC)的免训练方法,通过凸组合多个预训练扩散或流匹配策略的分布分数,在无需额外模型训练的情况下显著提升了机器人控制性能与适应性。

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. LuoWed, 11 Ma🤖 cs.LG

Connectivity Maintenance and Recovery for Multi-Robot Motion Planning

该论文提出了一种名为 MPC-CLF-CBF 的实时贝塞尔曲线约束运动规划算法,通过结合高阶控制障碍函数与控制李雅普诺夫函数,有效解决了多机器人集群在复杂障碍环境中维持连通性与导航成功率之间的矛盾,并实现了连接丢失后的自动恢复,且已在 8 架 Crazyflie 微型四旋翼飞行器的仿真与实物实验中得到验证。

Yutong Wang, Lishuo Pan, Yichun Qu, Tengxiang Wang, Nora AyanianWed, 11 Ma💻 cs

NavSpace: How Navigation Agents Follow Spatial Intelligence Instructions

本文提出了旨在评估导航智能体空间感知与推理能力的 NavSpace 基准及包含六个任务类别的 1,228 条轨迹 - 指令对,并通过该基准对 22 种现有模型进行了全面评估,同时推出了在 NavSpace 和真实机器人测试中均表现优异的新型空间智能导航模型 SNav。

Haolin Yang, Yuxing Long, Zhuoyuan Yu, Zihan Yang, Minghan Wang, Jiapeng Xu, Yihan Wang, Ziyan Yu, Wenzhe Cai, Lei Kang, Hao DongWed, 11 Ma🤖 cs.AI