cs.RO 篇论文 | Gist.Science

A Robust Antenna Provides Tactile Feedback in a Multi-legged Robot

该研究为多足机器人开发了一种具有梯度柔顺性的仿生触觉天线，通过实时感知接触力与形变来推断碰撞状态并调整步态，从而在无需全局信息或视觉的情况下，显著提升了机器人在复杂受限环境中的自主导航与脱困能力。

Zhaochen J. Xu, Juntao He, Delfin Aydan, Malaika Taylor, Tianyu Wang, Jianfeng Lin, Wesley Dyer, Daniel I. GoldmanTue, 10 Ma💻 cs

Inverse Resistive Force Theory (I-RFT): Learning granular properties through robot-terrain physical interactions

本文提出了一种名为“逆阻力力理论”（I-RFT）的物理信息机器学习框架，该框架通过将颗粒阻力力理论模型与高斯过程相结合，使机器人能够利用任意步态轨迹下的本体感知接触力来准确推断松软颗粒地形的机械特性，并量化不确定性以优化足部设计与运动策略。

Shipeng Liu, Feng Xue, Yifeng Zhang, Tarunika Ponnusamy, Feifei QianTue, 10 Ma💻 cs

Toward Global Intent Inference for Human Motion by Inverse Reinforcement Learning

该论文利用最小观测逆强化学习（MO-IRL）算法，通过引入时变权重证明了单一且通用的代价函数能够高精度地预测人类到达运动轨迹，从而支持了支配此类运动的统一最优性原理的存在。

Sarmad Mehrdad, Maxime Sabbah, Vincent Bonnet, Ludovic RighettiTue, 10 Ma🤖 cs.LG

MWM: Mobile World Models for Action-Conditioned Consistent Prediction

该论文提出了 MWM（移动世界模型），通过引入动作条件一致性后训练和推理一致性状态蒸馏技术，解决了现有导航世界模型在多步预测中视觉漂移及训练与推理不一致的问题，从而显著提升了基于规划的图像目标导航任务的视觉保真度、轨迹精度和推理效率。

Han Yan, Zishang Xiang, Zeyu Zhang, Hao TangTue, 10 Ma💻 cs

Preference-Conditioned Reinforcement Learning for Space-Time Efficient Online 3D Bin Packing

该论文提出了一种名为 STEP 的基于偏好条件的 Transformer 强化学习方法，通过让机器人在每个步骤中权衡放置收益与操作时间，实现了在保持装箱密度的同时将操作时间减少 44% 的时空高效在线三维装箱。

Nikita Sarawgi, Omey M. Manyar, Fan Wang, Thinh H. Nguyen, Daniel Seita, Satyandra K. GuptaTue, 10 Ma💻 cs

Uncertainty Mitigation and Intent Inference: A Dual-Mode Human-Machine Joint Planning System

该论文提出了一种双模态人机联合规划系统，通过结合基于大语言模型的主动消歧机制与基于时空线索的意图推断模块，有效解决了开放环境中任务知识缺失与人类意图隐含带来的双重不确定性，显著降低了交互成本并提升了任务执行效率。

Zeyu Fang, Yuxin Lin, Cheng Liu, Beomyeol Yu, Zeyuan Yang, Rongqian Chen, Taeyoung Lee, Mahdi Imani, Tian LanTue, 10 Ma💻 cs

Reasoning Knowledge-Gap in Drone Planning via LLM-based Active Elicitation

该论文提出了一种基于大语言模型的主动信息 elicitation 框架，通过最小信息神经符号树（MINT）将无人机规划中的知识差距转化为最优二元查询，从而在复杂搜索救援任务中显著提升了成功率并减少了人工干预频率。

Zeyu Fang, Beomyeol Yu, Cheng Liu, Zeyuan Yang, Rongqian Chen, Yuxin Lin, Mahdi Imani, Tian LanTue, 10 Ma💻 cs

Physics-infused Learning for Aerial Manipulator in Winds and Near-Wall Environments

该论文提出了一种融合物理模型与学习残差估计的混合控制框架，通过结合叶片元模型与在线自适应机制，显著提升了空中机械臂在强风及近墙复杂气动环境下的扰动估计能力与轨迹跟踪精度。

Yiming Zhang, Junyi GengTue, 10 Ma💻 cs

Relating Reinforcement Learning to Dynamic Programming-Based Planning

本文通过开发去随机化强化学习算法、分析成本最小化与奖励最大化等关键条件的等价性，并倡导优化真实成本，从而弥合了基于动态规划的确定性规划与强化学习之间的理论与性能差距。

Filip V. Georgiev, Kalle G. Timperi, Basak Sakçak, Steven M. LaValleTue, 10 Ma💻 cs

Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations

该论文提出了一种面向移动腿式机械臂的视点无关抓取流程，通过结合视觉语言模型、深度补偿与点云补全技术，在遮挡和局部观测的复杂环境中实现了高达 90% 的语言引导抓取成功率。

Dilermando Almeida, Juliano Negri, Guilherme Lazzarini, Thiago H. Segreto, Ranulfo Bezerra, Ricardo V. Godoy, Marcelo BeckerTue, 10 Ma🤖 cs.LG

Choose What to Observe: Task-Aware Semantic-Geometric Representations for Visuomotor Policy

该论文提出了一种任务感知的语义 - 几何观察接口，利用 SAM3 和 Depth Anything 3 将原始 RGB 图像转换为包含语义分割与深度信息的标准化表示，从而在不修改策略模型的前提下显著提升了视觉运动控制在外观分布外变化下的鲁棒性。

Haoran Ding, Liang Ma, Yaxun Yang, Wen Yang, Tianyu Liu, Anqing Duan, Xiaodan Liang, Dezhen Song, Ivan Laptev, Yoshihiko NakamuraTue, 10 Ma💻 cs

Identifying Influential Actions in Human-Robot Interactions

该论文提出了一种基于传递熵的方法，用于分析远程机器人Avatar在对话中通过距离变化等动作对人类的非线性影响，从而识别出关键交互行为以优化机器人系统的设计与适应性。

Haoyang Jiang, Chenfei Xu, Yuya Okadome, Yukata NakamuraTue, 10 Ma💻 cs

RoboRouter: Training-Free Policy Routing for Robotic Manipulation

本文提出了 RoboRouter，一种无需训练的框架，通过智能路由机制从异构策略池中动态选择最佳策略，利用任务语义表示和历史反馈显著提升机器人操作的泛化能力与成功率。

Yiteng Chen, Zhe Cao, Hongjia Ren, Chenjie Yang, Wenbo Li, Shiyi Wang, Yemin Wang, Li Zhang, Yanming Shao, Zhenjun Zhao, Huiping Zhuang, Qingyao WuTue, 10 Ma💻 cs

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

NaviDriveVLM 提出了一种将大规模导航器（负责推理）与轻量级驾驶员（负责动作生成）解耦的框架，在保留大模型语义推理能力的同时降低了训练成本，并在 nuScenes 基准测试中实现了优于现有大模型基线的端到端运动规划性能。

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav PandeyTue, 10 Ma🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

本文提出了 DyQ-VLA 框架，通过利用实时运动学代理进行感知敏感的位宽切换与动态分配，解决了具身视觉 - 语言 - 动作模型在静态量化中面临的时序动态敏感性与实时分配难题，在显著降低内存占用的同时保持了高性能并提升了推理速度。

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang ChenTue, 10 Ma🤖 cs.LG

Long-Short Term Agents for Pure-Vision Bronchoscopy Robotic Autonomy

该论文提出了一种仅依赖视觉的自主支气管镜导航框架，通过长短期智能体协同与世界模型批判机制，在无外部追踪传感器的情况下实现了高精度的机器人自主导航，并在体内外实验中验证了其达到专家水平的可行性。

Junyang Wu, Mingyi Luo, Fangfang Xie, Minghui Zhang, Hanxiao Zhang, Chunxi Zhang, Junhao Wang, Jiayuan Sun, Yun Gu, Guang-Zhong YangTue, 10 Ma💻 cs

Omnidirectional Humanoid Locomotion on Stairs via Unsafe Stepping Penalty and Sparse LiDAR Elevation Mapping

该论文提出了一种结合连续不安全步态惩罚机制与稀疏激光雷达高程图优化（含时空置信度衰减及边缘引导 U-Net）的单阶段训练框架，实现了双足机器人在楼梯及复杂户外地形上的安全、全向稳定行走。

Yuzhi Jiang, Yujun Liang, Junhao Li, Han Ding, Lijun ZhuTue, 10 Ma💻 cs

Unified Structural-Hydrodynamic Modeling of Underwater Underactuated Mechanisms and Soft Robots

本文提出了一种基于轨迹驱动的全局优化框架，能够同时识别水下欠驱动机构与软体机器人的耦合内部结构及外部水动力参数，从而实现了高保真的统一建模，并在从单臂到整体制动机器人的多种场景下验证了其准确性与可扩展性。

Chenrui Zhang, Yiyuan Zhang, Yunfei Ye, Junkai Chen, Haozhe Wang, Cecilia LaschiTue, 10 Ma🔬 physics

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

针对现有边缘云协同推理框架在处理视觉语言动作（VLA）模型时易受视觉噪声干扰且忽视任务冗余导致运动不连续的问题，本文提出了名为 RAPID 的新框架，通过冗余感知与兼容性优化实现了最高 1.73 倍的推理加速，同时仅引入 5%~7% 的额外开销。

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

VORL-EXPLORE: A Hybrid Learning Planning Approach to Multi-Robot Exploration in Dynamic Environments

本文提出了 VORL-EXPLORE 框架，通过引入表征局部可导航性的“执行保真度”信号，将任务分配与运动执行紧密耦合，并结合 Voronoi 优化与风险自适应仲裁机制，有效解决了动态密集环境中多机器人探索易出现的拥塞、振荡及冗余覆盖问题。

Ning Liu, Sen Shen, Zheng Li, Sheng Liu, Dongkun Han, Shangke Lyu, Thomas BraunlTue, 10 Ma💻 cs