cs.RO 篇论文 | Gist.Science

Dependent Reachable Sets for the Constant Bearing Pursuit Strategy

本文针对采用反馈策略的追逃场景，以常值方位（Constant Bearing）追击策略为例，提出了“依赖可达集”这一新概念，通过理论推导给出了其几何边界，并借助仿真验证了其形状特征。

Venkata Ramana Makkapati, Tulasi Ram Vechalapu, Vinodhini Comandur, Seth Hutchinson2026-03-09🔢 math

XR-DT: Extended Reality-Enhanced Digital Twin for Safe Motion Planning via Human-Aware Model Predictive Path Integral Control

本文提出了 XR-DT 框架，该框架结合扩展现实（XR）数字孪生技术与基于注意力机制的轨迹预测模型，通过新型的人类感知模型预测路径积分（HA-MPPI）控制器，实现了人机共享空间中安全、高效且可解释的机器人运动规划。

Tianyi Wang, Jiseop Byeon, Ahmad Yehia, Yiming Xu, Jihyung Park, Tianyi Zeng, Sikai Chen, Ziran Wang, Junfeng Jiao, Christian Claudel2026-03-09🤖 cs.AI

Safe Model Predictive Diffusion with Shielding

本文提出了一种名为“安全模型预测扩散（Safe MPD）”的免训练扩散规划器，通过将基于模型的扩散框架与安全屏蔽机制相结合，在去噪过程中直接确保轨迹的可行性与安全性，从而在复杂非凸规划问题中实现了优于现有策略的成功率、安全性及亚秒级计算效率。

Taekyung Kim, Keyvan Majd, Hideki Okamoto, Bardh Hoxha, Dimitra Panagou, Georgios Fainekos2026-03-09💻 cs

SORS: A Modular, High-Fidelity Simulator for Soft Robots

本文提出了 SORS（软体对刚性模拟器），这是一种基于有限元方法和约束非线性优化的模块化高保真仿真框架，能够准确模拟软体机器人的大变形、接触相互作用及驱动动力学，并通过多项真实实验验证了其在缩小仿真与现实差距方面的有效性。

Manuel Mekkattu, Mike Y. Michelis, Robert K. Katzschmann2026-03-09💻 cs

VISO: Robust Underwater Visual-Inertial-Sonar SLAM with Photometric Rendering for Dense 3D Reconstruction

本文提出了名为 VISO 的鲁棒水下视觉 - 惯性 - 声呐 SLAM 系统，通过融合立体相机、IMU 和 3D 声呐，结合外参在线标定与声呐点云的光度渲染策略，实现了高精度的 6-DoF 定位及具有视觉保真度的实时稠密 3D 重建。

Shu Pan, Simon Archieri, Ahmet Cinar, Jonatan Scharff Willners, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

InsSo3D: Inertial Navigation System and 3D Sonar SLAM for turbid environment inspection

本文提出了一种名为 InsSo3D 的鲁棒 SLAM 框架，通过融合 3D 声呐与惯性导航系统（INS），在浑浊水下环境中实现了高精度的大范围三维建图与定位，有效校正了里程计漂移并显著降低了轨迹与重建误差。

Simon Archieri, Ahmet Cinar, Shu Pan, Jonatan Scharff Willners, Michele Grimaldi, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

(MGS) $^2$ -Net: Unifying Micro-Geometric Scale and Macro-Geometric Structure for Cross-View Geo-Localization

该论文提出了(MGS) $^2$ -Net 框架，通过引入利用深度先验的微几何尺度适应模块和基于膨胀几何梯度的宏几何结构过滤模块，有效解决了跨视角地理定位中因视角差异导致的几何失配问题，从而在多个基准数据集上实现了最先进的性能。

Minglei Li, Mengfan He, Chunyu Li, Chao Chen, Xingyu Shao, Ziyang Meng2026-03-09💻 cs

APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots

本文提出了 APEX 系统，通过结合地形条件行为与通用“棘轮”进度奖励机制，训练出单一人形机器人策略，实现了在零样本条件下从仿真到现实的 0.8 米高平台（约腿长 114%）自主攀爬、行走及姿态重构的全流程稳定遍历。

Yikai Wang, Tingxuan Leng, Changyi Lin, Shiqi Liu, Shir Simon, Bingqing Chen, Jonathan Francis, Ding Zhao2026-03-09💻 cs

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

本文介绍了 MiDAS，这是一个开源且与平台无关的多模态数据采集系统，它能够在无需专有机器人接口的情况下，通过非侵入式方式实现手术机器人（如 Raven-II 和 da Vinci Xi）的时间同步多模态数据采集，并发布了包含疝修补缝合任务的首个多模态数据集。

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

Beyond Imitation: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

本文提出了一种基于强化学习的模拟 - 现实协同训练（RL-Co）框架，通过结合监督微调与模拟环境中的强化学习，并辅以真实数据辅助损失以缓解灾难性遗忘，显著提升了视觉 - 语言 - 动作（VLA）模型在真实世界机器人操作任务中的成功率、泛化能力及数据效率。

Liangzhi Shi, Shuaihang Chen, Feng Gao, Yinuo Chen, Kang Chen, Tonghe Zhang, Hongzhi Zang, Weinan Zhang, Chao Yu, Yu Wang2026-03-09💻 cs

Learning Robust Control Policies for Inverted Pose on Miniature Blimp Robots

本文提出了一种包含高保真仿真校准、改进的 TD3 算法结合域随机化训练以及映射层设计的三阶段框架，成功实现了微型飞艇机器人在真实世界中的鲁棒倒置姿态控制。

Yuanlin Yang, Lin Hong, Fumin Zhang2026-03-09💻 cs

ROSER: Few-Shot Robotic Sequence Retrieval for Scalable Robot Learning

该论文提出了 ROSER 框架，通过少样本检索技术从海量无标签机器人交互日志中高效提取任务相关片段，从而解决了机器人学习中标注数据稀缺的瓶颈问题。

Zillur Rahman, Eddison Pham, Alejandro Daniel Noel, Cristian Meo2026-03-09💻 cs

An Embodied Companion for Visual Storytelling

本文介绍了名为"Companion"的艺术装置，它通过结合绘图机器人与大语言模型，利用上下文学习和实时工具调用实现人机语音与绘画的双向互动，将机器人从被动执行者转变为能推动共同视觉叙事的创造性伙伴，并经专家评估证实了其作品具备独特的审美价值与专业展览潜力。

Patrick Tresset, Markus Wulfmeier2026-03-09🤖 cs.AI

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

RoboLayout 通过引入可微分的可达性约束和局部细化优化机制，扩展了 LayoutVLM 框架，使其能够生成既符合语义逻辑又适应不同具身智能体物理交互能力的 3D 室内场景布局。

Ali Shamsaddinlou2026-03-09🤖 cs.AI

ProFocus: Proactive Perception and Focused Reasoning in Vision-and-Language Navigation

ProFocus 是一种无需训练的渐进式框架，通过大语言模型与视觉语言模型的协作，利用主动感知生成针对性视觉查询并结合分支多样化蒙特卡洛树搜索实现聚焦推理，从而在无需微调的情况下显著提升了视觉语言导航任务的性能。

Wei Xue, Mingcheng Li, Xuecheng Wu, Jingqun Tang, Dingkang Yang, Lihua Zhang2026-03-09💻 cs

Digital-Twin Losses for Lane-Compliant Trajectory Prediction at Urban Intersections

本文提出了一种基于数字孪生的 V2X 轨迹预测框架，通过结合 Bi-LSTM 生成器与包含标准均方误差及新型“孪生损失”的联合训练目标，在确保预测精度的同时有效降低了交通违规和碰撞风险，从而提升了城市复杂路口多智能体交互场景下的安全性与合规性。

Kuo-Yi Chao, Erik Leo Haß, Melina Gegg, Jiajie Zhang, Ralph Raßhofer, Alois Christian Knoll2026-03-09💻 cs

TEGA: A Tactile-Enhanced Grasping Assistant for Assistive Robotics via Sensor Fusion and Closed-Loop Haptic Feedback

本文提出了 TEGA 系统，这是一种通过融合肌电信号意图识别与视觉触觉感知、并利用可穿戴振动背心提供实时闭环力反馈的辅助遥操作框架，旨在帮助上肢残疾用户更直观、稳定地调节抓取力度，从而显著提升任务成功率。

Hengxu You, Tianyu Zhou, Fang Xu, Kaleb Smith, Eric Jing Du2026-03-09💻 cs

PRISM: Personalized Refinement of Imitation Skills for Manipulation via Human Instructions

PRISM 提出了一种结合模仿学习与强化学习的指令驱动方法，通过大语言模型生成奖励函数并结合人类反馈对策略进行迭代优化，从而在无需大量新数据的情况下高效提升机器人操作策略的泛化能力与鲁棒性。

Arnau Boix-Granell, Alberto San-Miguel-Tello, Magí Dalmau-Moreno, Néstor García2026-03-09🤖 cs.AI

Task Parameter Extrapolation via Learning Inverse Tasks from Forward Demonstrations

该论文提出了一种基于任务逆学习的新颖联合学习方法，通过构建正向与逆向任务的通用表征并利用辅助正向演示，实现了机器人技能策略在未见条件下的准确且高效的外推，在复杂操作任务中表现优于扩散模型。

Serdar Bahar, Fatih Dogangun, Matteo Saveriano, Yukie Nagai, Emre Ugur2026-03-09💻 cs

From Decoupled to Coupled: Robustness Verification for Learning-based Keypoint Detection with Joint Specifications

该论文提出了首个针对基于热力图的关键点检测器的耦合鲁棒性验证框架，通过混合整数线性规划将验证问题转化为联合偏差约束下的反例搜索，从而克服了传统解耦方法在连续坐标输出和高维输入下的局限性，实现了对关键点间依赖关系及下游任务需求的更紧确且有效的鲁棒性证明。

Xusheng Luo, Changliu Liu2026-03-09🤖 cs.LG

cs.RO