cs.RO 篇论文 | Gist.Science

LAR-MoE: Latent-Aligned Routing for Mixture of Experts in Robotic Imitation Learning

本文提出了 LAR-MoE 框架，通过两阶段训练将无监督技能发现与策略学习解耦，利用潜在空间对齐路由机制在无需标注的情况下实现专家专业化，从而显著提升了机器人在异构任务中的模仿学习性能。

Ariel Rodriguez, Chenpan Li, Lorenzo Mazza, Rayan Younis, Ortrun Hellig, Sebastian Bodenstedt, Martin Wagner, Stefanie Speidel2026-03-10💻 cs

STRIDE: Structured Lagrangian and Stochastic Residual Dynamics via Flow Matching

本文提出了 STRIDE 框架，通过联合训练拉格朗日神经网络以保留保守刚体力学结构，并利用条件流匹配建模非保守的随机交互残差，从而在不确定环境中显著降低了长时程预测误差和接触力预测误差。

Prakrut Kotecha, Ganga Nair B, Shishir Kolathaya2026-03-10🤖 cs.LG

3PoinTr: 3D Point Tracks for Robot Manipulation Pretraining from Casual Videos

本文提出了 3PoinTr 方法，利用 Transformer 架构从非约束的人类视频中预测 3D 点轨迹作为中间表征，从而仅需少量机器人演示即可实现高效预训练，有效克服了具身差距并提升了机器人操作策略的泛化能力。

Adam Hung, Bardienus Pieter Duisterhof, Jeffrey Ichnowski2026-03-10💻 cs

The Neural Compass: Probabilistic Relative Feature Fields for Robotic Search

本文提出了 ProReFF 模型，通过从无标签观测中隐式学习物体共现的相对特征分布，并利用该语义先验引导机器人搜索，使其在 Matterport3D 仿真环境中的搜索效率比最强基线提升 20%，达到人类性能的 80%。

Gabriele Somaschini, Adrian Röfer, Abhinav Valada2026-03-10🤖 cs.LG

Interactive World Simulator for Robot Policy Training and Evaluation

本文提出了“交互式世界模拟器”（Interactive World Simulator）框架，利用一致性模型从中等规模数据集构建快速且物理一致的交互世界模型，不仅支持长达 10 分钟以上的稳定仿真，还证明了在此生成的数据训练出的机器人策略在真实世界中能达到与真实数据训练相当的性能，并实现了仿真与实机表现的高度相关性。

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

OA-Bug: An Olfactory-Auditory Augmented Bug Algorithm for Swarm Robots in a Denied Environment

本文提出了一种名为 OA-Bug 的嗅觉 - 听觉增强型 Bug 算法，旨在解决 denied 环境下群机器人无法依赖 GNSS、建图及数据共享的难题，通过模拟动物利用嗅觉和听觉信号进行协作，显著提升了搜索覆盖率并经由仿真与实物实验验证了其有效性。

Siqi Tan, Xiaoya Zhang, Jingyao Li, Ruitao Jing, Mufan Zhao, Yang Liu, Quan Quan2026-03-09💻 cs

RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model

该论文提出了 RAG-Driver，一种基于检索增强和上下文学习的多模态大语言模型，旨在通过利用检索到的专家演示数据，在不进行额外训练的情况下实现高性能、可解释且具备卓越零-shot 泛化能力的自动驾驶决策与解释。

Jianhao Yuan, Shuyang Sun, Daniel Omeiza, Bo Zhao, Paul Newman, Lars Kunze, Matthew Gadd2026-03-09🤖 cs.AI

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

本文提出了 FALCON，一种针对无人机视频动作识别的统一自监督预训练方法，通过结合物体感知掩码自编码与物体中心的双视野未来重建，有效解决了航拍画面中背景杂乱导致的空间不平衡问题，显著提升了识别精度并实现了比传统监督方法快 2 至 5 倍的推理速度。

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

Integrated Hierarchical Decision-Making in Inverse Kinematic Planning and Control

该论文提出了一种新颖高效的稀疏分层非线性规划框架，通过利用 $\ell_0$ 范数和分层结构，将决策制定与逆运动学规划及控制紧密集成，从而解决了传统方法在计算效率或精度上的局限，实现了如从大量候选点中同步选择末端执行器位置等复杂非线性分层决策问题。

Kai Pfeiffer, Quan Zhang, Yuqing Chen, Gordon Boateng, Yuquan Wang, Vincent Bonnet, Aberrahmane Kheddar2026-03-09💻 cs

Generative Predictive Control: Flow Matching Policies for Dynamic and Difficult-to-Demonstrate Tasks

该论文提出了“生成式预测控制”框架，通过利用采样式预测控制与生成建模之间的紧密联系，解决了现有生成式控制策略依赖专家演示且难以应对快速动态任务的局限，实现了基于模拟数据训练、支持高频反馈且具备时间一致性的流匹配策略。

Vince Kurtz, Joel W. Burdick2026-03-09🤖 cs.AI

CAPS: Context-Aware Priority Sampling for Enhanced Imitation Learning in Autonomous Driving

本文提出了一种名为 CAPS 的上下文感知优先级采样方法，该方法利用 VQ-VAE 提取结构化特征并聚类数据以解决模仿学习中的样本不平衡问题，从而在 CARLA 仿真中显著提升了自动驾驶模型在 Bench2Drive 场景下的泛化能力、驾驶得分及成功率。

Hamidreza Mirkhani, Behzad Khamidehi, Ehsan Ahmadi, Mohammed Elmahgiubi, Weize Zhang, Fazel Arasteh, Umar Rajguru, Kasra Rezaee, Dongfeng Bai2026-03-09🤖 cs.LG

Whole-Body Model-Predictive Control of Legged Robots with MuJoCo

该论文展示了结合 MuJoCo 动力学与有限差分导数的迭代 LQR（iLQR）算法，能够以极简方式在真实世界中实现四足及人形机器人的全身模型预测控制，并成功应用于多种动态运动任务，从而降低了相关研究的门槛。

John Z. Zhang, Taylor A. Howell, Zeji Yi, Chaoyi Pan, Guanya Shi, Guannan Qu, Tom Erez, Yuval Tassa, Zachary Manchester2026-03-09💻 cs

Graph-based Online Lidar Odometry with Retrospective Map Refinement

该论文提出了一种基于多子图配准与姿态图优化的在线激光里程计方法，通过引入多地图注册机制及回溯式地图锚点优化，在保持实时性的同时显著提升了轨迹估计的短期一致性与长期精度。

Aaron Kurda, Simon Steuernagel, Marcus Baum2026-03-09💻 cs

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

本文提出了 FindAnything 框架，通过基于 eSAM 分割的物体级特征聚合，将视觉语言信息高效融入致密体素子地图，从而在显著降低计算与存储开销的同时，实现了适用于大型未知环境及资源受限设备（如微型飞行器）的实时开放词汇与物体中心建图。

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI

Robustness-Aware Tool Selection and Manipulation Planning with Learned Energy-Informed Guidance

本文提出了一种以能量为基础的鲁棒性度量方法，通过分层优化流程联合选择工具并规划接触丰富的操作轨迹，使机器人能够在外部干扰下实现鲁棒的工具使用与操作。

Yifei Dong, Yan Zhang, Sylvain Calinon, Florian T. Pokorny2026-03-09💻 cs

ROS-related Robotic Systems Development with V-model-based Application of MeROS Metamodel

本文提出了一种基于 MeROS 元模型和 V 模型的结构化方法论，旨在通过模型系统工程（MBSE）解决 ROS 机器人系统在语义一致性和结构可追溯性方面的复杂性，从而实现从设计到验证的全生命周期协调管理。

Tomasz Winiarski, Jan Kaniuka, Daniel Giełdowski, Jakub Ostrysz, Krystian Radlak, Dmytro Kushnir2026-03-09💻 cs

Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL

该论文提出了一种基于师生框架的自动课程学习新方法，利用图结构多智能体强化学习作为教师自适应生成涵盖从常规到关键场景的多样化交通行为，从而有效训练出在复杂真实交通环境中更具鲁棒性、平衡性和进取性的自动驾驶智能体。

Ahmed Abouelazm, Johannes Ratz, Philip Schörner, J. Marius Zöllner2026-03-09🤖 cs.LG

Bridging Simulation and Usability: A User-Friendly Framework for Scenario Generation in CARLA

该论文提出了一种基于图形界面的无代码交互式框架，旨在通过简化的场景生成流程降低自动驾驶仿真验证的门槛，使非技术用户也能轻松创建、管理和执行多样化的测试场景。

Ahmed Abouelazm, Mohammad Mahmoud, Conrad Walter, Oleksandr Shchetsura, Erne Hussong, Helen Gremmelmaier, J. Marius Zöllner2026-03-09💻 cs

VEGA: Electric Vehicle Navigation Agent via Physics-Informed Neural Operator and Proximal Policy Optimization

本文提出了 VEGA，一种结合物理信息神经算子（PINO）进行车辆参数估计与近端策略优化（PPO）进行充电感知路径规划的电动汽车导航系统，该系统在跨大陆路线上实现了比传统启发式算法快 20 倍以上的推理速度，并展现出对法国和日本路网的零样本泛化能力。

Hansol Lim, Minhyeok Im, Jonathan Boyack, Jee Won Lee, Jongseong Brad Choi2026-03-09🤖 cs.LG

Language Conditioning Improves Accuracy of Aircraft Goal Prediction in Non-Towered Airspace

该论文提出了一种融合自然语言理解与空间推理的多模态框架，通过利用飞行员语音指令来增强无塔台空域中航空器目标预测的准确性，从而提升自主飞行决策能力。

Sundhar Vinodh Sangeetha, Chih-Yuan Chiu, Sarah H. Q. Li, Shreyas Kousik2026-03-09💻 cs