Inverse Resistive Force Theory (I-RFT): Learning granular properties through robot-terrain physical interactions

本文提出了一种名为“逆阻力力理论”(I-RFT)的物理信息机器学习框架,该框架通过将颗粒阻力力理论模型与高斯过程相结合,使机器人能够利用任意步态轨迹下的本体感知接触力来准确推断松软颗粒地形的机械特性,并量化不确定性以优化足部设计与运动策略。

Shipeng Liu, Feng Xue, Yifeng Zhang, Tarunika Ponnusamy, Feifei QianTue, 10 Ma💻 cs

Uncertainty Mitigation and Intent Inference: A Dual-Mode Human-Machine Joint Planning System

该论文提出了一种双模态人机联合规划系统,通过结合基于大语言模型的主动消歧机制与基于时空线索的意图推断模块,有效解决了开放环境中任务知识缺失与人类意图隐含带来的双重不确定性,显著降低了交互成本并提升了任务执行效率。

Zeyu Fang, Yuxin Lin, Cheng Liu, Beomyeol Yu, Zeyuan Yang, Rongqian Chen, Taeyoung Lee, Mahdi Imani, Tian LanTue, 10 Ma💻 cs

Choose What to Observe: Task-Aware Semantic-Geometric Representations for Visuomotor Policy

该论文提出了一种任务感知的语义 - 几何观察接口,利用 SAM3 和 Depth Anything 3 将原始 RGB 图像转换为包含语义分割与深度信息的标准化表示,从而在不修改策略模型的前提下显著提升了视觉运动控制在外观分布外变化下的鲁棒性。

Haoran Ding, Liang Ma, Yaxun Yang, Wen Yang, Tianyu Liu, Anqing Duan, Xiaodan Liang, Dezhen Song, Ivan Laptev, Yoshihiko NakamuraTue, 10 Ma💻 cs

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

本文提出了 DyQ-VLA 框架,通过利用实时运动学代理进行感知敏感的位宽切换与动态分配,解决了具身视觉 - 语言 - 动作模型在静态量化中面临的时序动态敏感性与实时分配难题,在显著降低内存占用的同时保持了高性能并提升了推理速度。

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang ChenTue, 10 Ma🤖 cs.LG

Long-Short Term Agents for Pure-Vision Bronchoscopy Robotic Autonomy

该论文提出了一种仅依赖视觉的自主支气管镜导航框架,通过长短期智能体协同与世界模型批判机制,在无外部追踪传感器的情况下实现了高精度的机器人自主导航,并在体内外实验中验证了其达到专家水平的可行性。

Junyang Wu, Mingyi Luo, Fangfang Xie, Minghui Zhang, Hanxiao Zhang, Chunxi Zhang, Junhao Wang, Jiayuan Sun, Yun Gu, Guang-Zhong YangTue, 10 Ma💻 cs

Unified Structural-Hydrodynamic Modeling of Underwater Underactuated Mechanisms and Soft Robots

本文提出了一种基于轨迹驱动的全局优化框架,能够同时识别水下欠驱动机构与软体机器人的耦合内部结构及外部水动力参数,从而实现了高保真的统一建模,并在从单臂到整体制动机器人的多种场景下验证了其准确性与可扩展性。

Chenrui Zhang, Yiyuan Zhang, Yunfei Ye, Junkai Chen, Haozhe Wang, Cecilia LaschiTue, 10 Ma🔬 physics

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

针对现有边缘云协同推理框架在处理视觉语言动作(VLA)模型时易受视觉噪声干扰且忽视任务冗余导致运动不连续的问题,本文提出了名为 RAPID 的新框架,通过冗余感知与兼容性优化实现了最高 1.73 倍的推理加速,同时仅引入 5%~7% 的额外开销。

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

VORL-EXPLORE: A Hybrid Learning Planning Approach to Multi-Robot Exploration in Dynamic Environments

本文提出了 VORL-EXPLORE 框架,通过引入表征局部可导航性的“执行保真度”信号,将任务分配与运动执行紧密耦合,并结合 Voronoi 优化与风险自适应仲裁机制,有效解决了动态密集环境中多机器人探索易出现的拥塞、振荡及冗余覆盖问题。

Ning Liu, Sen Shen, Zheng Li, Sheng Liu, Dongkun Han, Shangke Lyu, Thomas BraunlTue, 10 Ma💻 cs