cs.RO 篇论文 | Gist.Science

LiteVLA-Edge: Quantized On-Device Multimodal Control for Embedded Robotics

本文提出了 LiteVLA-Edge，一种专为嵌入式机器人设计的量化多模态控制方案，通过结合监督微调、4 位 GGUF 量化及 GPU 加速推理，实现了在 Jetson Orin 硬件上完全离线的端到端实时控制（约 6.6 Hz），为资源受限设备上的 VLA 部署提供了实用的系统路径。

Justin Williams, Kishor Datta Gupta, Roy George + 1 more2026-03-05🤖 cs.AI

Multi-Agent-Based Simulation of Archaeological Mobility in Uneven Landscapes

本文提出了一种结合真实地形重建、异质智能体建模与强化学习自适应导航策略的多智能体模拟框架，用于在复杂起伏景观中高效模拟并分析考古学背景下人类群体及动物运输系统的移动行为与交互机制。

Chairi Kiourt, Vassilis Evangelidis, Dimitris Grigoropoulos2026-03-05🤖 cs.AI

Impact of Localization Errors on Label Quality for Online HD Map Construction

该论文通过引入三种定位误差模型并在 Argoverse 2 数据集上评估 MapTRv2 变体，揭示了定位误差（尤其是航向角误差）会显著扭曲在线 HD 地图构建的标签质量，导致模型性能呈非线性下降，并据此提出了一种基于距离的评估指标。

Alexander Blumberg, Jonas Merkert, Richard Fehler + 4 more2026-03-05💻 cs

Radar-based Pose Optimization for HD Map Generation from Noisy Multi-Drive Vehicle Fleet Data

该论文提出了一种基于雷达点云配准与位姿图优化的方法，通过消除多车采集数据中的定位噪声，显著提升了全球雷达占用栅格地图的清晰度及车道线地图的生成质量，从而降低了自动驾驶高精地图的构建与维护成本。

Alexander Blumberg, Jonas Merkert, Christoph Stiller2026-03-05💻 cs

Phys4D: Fine-Grained Physics-Consistent 4D Modeling from Video Diffusion

本文提出了 Phys4D，一种通过三阶段训练范式（包括大规模伪监督预训练、基于仿真的监督微调及强化学习）将视频扩散模型转化为物理一致 4D 世界表示的方法，显著提升了生成内容在细粒度时空动态与物理合理性方面的表现。

Haoran Lu, Shang Wu, Jianshu Zhang + 9 more2026-03-05🤖 cs.AI

Navigating in Uncertain Environments with Heterogeneous Visibility

本文提出了一种利用节点异质视野信息、通过平衡探测收益与路径成本来优化不确定环境中导航策略的新启发式算法，该方法在真实地形测试中相比传统最短路径基线显著降低了平均遍历成本，且计算开销远低于现有平衡观测与路径优化的方法。

Jongann Lee, Melkior Ornik2026-03-05💻 cs

Overlapping Domain Decomposition for Distributed Pose Graph Optimization

本文提出了 ROBO（黎曼重叠块优化）算法，这是一种基于重叠域分解的分布式多机器人位姿图优化方法，通过灵活调整机器人间共享的位姿信息量来平衡通信开销与计算效率，从而在少量通信数据下显著加快收敛速度，并具备应对网络延迟的异步变体以适应实际应用。

Aneesa Sonawalla, Yulun Tian, Jonathan P. How2026-03-05💻 cs

Sampling-Based Motion Planning with Scene Graphs Under Perception Constraints

本文提出了一种名为 MOPS-PRM 的基于路标的运动规划方法，该方法利用场景图将多对象感知成本嵌入高自由度机器人的规划过程，通过选择性采样配置来隐式满足感知约束，从而在仿真与真实实验中显著提升了多对象检测率和跟踪率。

Qingxi Meng, Emiliano Flores, Thai Duong + 2 more2026-03-05💻 cs

Passive Phase-Oriented Impedance Shaping for Rapid Acceleration in Soft Robotic Swimmers

本文提出了一种利用约束层阻尼（CLD）进行被动相位导向阻抗整形的方法，通过选择性地增强软体游泳机器人在高频驱动下的耗散阻抗分量以优化力 - 速相位对齐，从而在不依赖复杂控制的情况下显著提升了其瞬态推进性能，实现了峰值加速度和终端速度的数倍增长。

Qimin Feng, Orion A. Roberts, Qiang Zhong2026-03-05💻 cs

Real-time loosely coupled GNSS and IMU integration via Factor Graph Optimization

本文提出了一种基于因子图优化的实时松耦合 GNSS/IMU 融合架构，通过在城市峡谷等挑战性环境中的实验验证，分析了其在保证实时运行和服务可用性的同时，与批处理精度之间存在的权衡关系。

Radu-Andrei Cioaca, Cristian Rusu, Paul Irofti + 3 more2026-03-05🤖 cs.LG

Real-time tightly coupled GNSS and IMU integration via Factor Graph Optimization

本文提出了一种基于增量优化与固定滞后边缘化的实时紧耦合 GNSS-IMU 因子图优化方法，并在城市复杂环境下利用 UrbanNav 数据集验证了其在信号遮挡与多径干扰场景中的高精度定位性能。

Radu-Andrei Cioaca, Paul Irofti, Cristian Rusu + 3 more2026-03-05🤖 cs.LG

From Local Matches to Global Masks: Novel Instance Detection in Open-World Scenes

本文提出了 L2G-Det 框架，通过利用模板与查询图像间的密集局部匹配生成候选点，并以此引导增强版 Segment Anything Model（SAM）进行实例特定提示，从而在无需显式物体提议的情况下，实现了对开放世界场景中遮挡和杂乱背景下新颖物体实例的鲁棒检测与分割。

Qifan Zhang, Sai Haneesh Allu, Jikai Wang + 2 more2026-03-05💻 cs

MEM: Multi-Scale Embodied Memory for Vision Language Action Models

该论文提出了多尺度具身记忆（MEM）框架，通过结合视频编码的短期记忆与文本编码的长期记忆，使机器人策略能够处理长达 15 分钟的复杂长程任务并实现上下文自适应。

Marcel Torne, Karl Pertsch, Homer Walke + 14 more2026-03-05🤖 cs.LG

Touch2Insert: Zero-Shot Peg Insertion by Touching Intersections of Peg and Hole

本文提出了名为 Touch2Insert 的触觉感知框架，通过从零样本接触中重建截面几何并配准来估计孔位姿态，实现了无需特定任务训练即可在多种连接器上完成亚毫米级精度的插拔操作。

Masaru Yajima, Yuma Shin, Rei Kawakami + 2 more2026-03-05💻 cs

MistyPilot: An Agentic Fast-Slow Thinking LLM Framework for Misty Social Robots

本文提出了 MistyPilot，这是一个面向 Misty 社交机器人的智能体框架，它通过结合物理交互与社会智能代理、采用快慢思考范式以及提供五个基准数据集，有效解决了非专业用户在工具选择、编排及参数配置方面的挑战，显著提升了任务执行效率与情感交互能力。

Xiao Wang, Lu Dong, Jingchen Sun + 3 more2026-03-05💻 cs

TreeLoc++: Robust 6-DoF LiDAR Localization in Forests with a Compact Digital Forest Inventory

本文提出了 TreeLoc++ 框架，该框架利用紧凑的数字森林清单（DFI）直接进行全局定位，通过引入成对距离直方图、胸径过滤及几何约束优化等策略，在无需密集点云数据的情况下实现了森林环境中厘米级精度的鲁棒 6 自由度定位，并展现出优异的长期变化适应能力与数据压缩效率。

Minwoo Jung, Dongjae Lee, Nived Chebrolu + 3 more2026-03-05💻 cs

UrbanHuRo: A Two-Layer Human-Robot Collaboration Framework for the Joint Optimization of Heterogeneous Urban Services

本文提出了名为 UrbanHuRo 的双层人机协作框架，通过结合基于 K-次模最大化的分布式订单调度与深度次模奖励强化学习的路径规划算法，实现了城市配送与感知服务的联合优化，显著提升了感知覆盖率、快递员收入并减少了订单延误。

Tonmoy Dey, Lin Jiang, Zheng Dong + 1 more2026-03-05🤖 cs.AI

Large-Language-Model-Guided State Estimation for Partially Observable Task and Motion Planning

本文提出了 CoCo-TAMP 框架，利用大语言模型提供的常识推理（如物体位置偏好和共现规律）来指导部分可观测环境下的状态估计，从而显著提升了长程任务与运动规划的效率。

Yoonwoo Kim, Raghav Arora, Roberto Martín-Martín + 3 more2026-03-05🤖 cs.AI

Soft Semi-active Back Support Device with Adaptive Force Profiles using Variable-elastic Actuation and Weight Feedback

本文提出了一种结合可变刚度被动元件与人工肌肉的软体半主动背部支撑装置，该装置通过基于前臂肌电和背部惯性数据的重量自适应调节机制，在保持轻便紧凑的同时显著降低了用户在进行对称及非对称搬运任务时的背部肌肉活动。

Rohan Khatavkar, The Bach Nguyen, Inseung Kang + 2 more2026-03-05💻 cs

X-Loco: Towards Generalist Humanoid Locomotion Control via Synergetic Policy Distillation

本文提出了 X-Loco 框架，通过协同策略蒸馏与自适应专家选择机制，成功训练出首个仅依赖速度指令、无需参考运动即可同时实现直立行走、全身协调及跌倒恢复的视觉驱动通用型人形机器人 locomotion 策略。

Dewei Wang, Xinmiao Wang, Chenyun Zhang + 4 more2026-03-05💻 cs