cs.RO 篇论文 | Gist.Science

Environment-Aware Path Generation for Robotic Additive Manufacturing of Structures

该论文提出了一种环境感知的路径生成框架，通过结合四种路径规划算法在线生成适应动态障碍环境的机器人增材制造工具路径，并评估了不同规划器在复杂场景下的可行性及关键结构性能指标。

Mahsa Rabiei, Reza Moini2026-03-09💻 cs

Vision-Language System using Open-Source LLMs for Gestures in Medical Interpreter Robots

该论文提出了一种基于本地部署开源大语言模型的隐私保护视觉语言框架，用于医疗翻译机器人，通过新构建的临床对话手势数据集实现了对同意和指令等言语行为的高精度识别，并生成了比基线更具拟人化且恰当的机器人手势。

Thanh-Tung Ngo, Emma Murphy, Robert J. Ross2026-03-09💻 cs

Safe-Night VLA: Seeing the Unseen via Thermal-Perceptive Vision-Language-Action Models for Safety-Critical Manipulation

本文提出了 Safe-Night VLA 框架，通过融合长波红外热感知与语言模型实现语义推理，并结合控制障碍函数安全过滤器，使机器人在非结构化环境中能够“看见”不可见目标并安全执行热感知操作。

Dian Yu, Qingchuan Zhou, Bingkun Huang, Majid Khadiv, Zewen Yang2026-03-09💻 cs

EmboAlign: Aligning Video Generation with Compositional Constraints for Zero-Shot Manipulation

EmboAlign 提出了一种无需数据的框架，通过利用视觉语言模型提取的组合作为约束条件，在推理阶段对视频生成模型的输出进行筛选和轨迹优化，从而显著提升了零样本机器人操作的成功率。

Gehao Zhang, Zhenyang Ni, Payal Mohapatra, Han Liu, Ruohan Zhang, Qi Zhu2026-03-09💻 cs

Multi-Robot Trajectory Planning via Constrained Bayesian Optimization and Local Cost Map Learning with STL-Based Conflict Resolution

该论文提出了一种结合约束贝叶斯优化树搜索与 STL 增强冲突基搜索的两阶段框架，通过局部代价地图学习和形式化 STL 推理，在满足运动学动力学约束及信号时序逻辑规范的前提下，实现了多机器人轨迹规划的高效性、安全性与可扩展性。

Sourav Raxit, Abdullah Al Redwan Newaz, Jose Fuentes, Paulo Padrao, Ana Cavalcanti, Leonardo Bobadilla2026-03-09💻 cs

Task-Level Decisions to Gait Level Control: A Hierarchical Policy Approach for Quadruped Navigation

该论文提出了一种名为 TDGC 的分层策略架构，通过解耦高层任务决策与底层步态控制，利用强化学习训练的低层策略和基于稀疏语义或几何线索的高层策略，有效解决了四足机器人在非分布环境变化下的模拟到现实迁移难题，显著提升了复杂地形中的导航成功率与鲁棒性。

Sijia Li, Haoyu Wang, Shenghai Yuan, Yizhuo Yang, Thien-Minh Nguyen2026-03-09💻 cs

CDF-Glove: A Cable-Driven Force Feedback Glove for Dexterous Teleoperation

本文提出了一种名为 CDF-Glove 的轻量级、低成本（约 230 美元）缆索驱动力反馈手套，该设备通过提供实时触觉反馈显著提升了遥操作演示质量，使基于扩散策略的模仿学习在任务成功率上提高了 55%，并缩短了约 47.2% 的任务完成时间。

Huayue Liang, Ruochong Li, Yaodong Yang, Long Zeng, Yuanpei Chen, Xueqian Wang2026-03-09💻 cs

Hierarchical Latent Action Model

本文提出了 HiLAM，一种利用预训练模型提取底层动态并聚合为高层潜在技能的分层潜在动作模型，旨在从无动作视频中捕捉长时程时间结构并实现鲁棒的技能发现。

Hanjung Kim, Lerrel Pinto, Seon Joo Kim2026-03-09💻 cs

OpenHEART: Opening Heterogeneous Articulated Objects with a Legged Manipulator

本文提出了一种名为 OpenHEART 的鲁棒且样本高效的框架，通过引入基于采样的抽象特征提取（SAFE）和关节信息估计器（ArtIEst），使足式操作机器人能够成功应对门、抽屉等异构可动物体的多样化开启动作。

Seonghyeon Lim, Hyeonwoo Lee, Seunghyun Lee, I Made Aswin Nahrendra, Hyun Myung2026-03-09💻 cs

Terrain characterization and locomotion adaptation in a small-scale lizard-inspired robot

本文提出了一种名为 SILA Bot 的小型蜥蜴仿生机器人，通过建立步态参数与沙土深度的线性关系，并利用本体感知信号（如关节扭矩）结合 K 近邻分类器实现深度估计，最终设计了一种低计算复杂度的线性反馈控制器，使机器人能够在未知深度的复杂自然地形中实现高效的自适应运动。

Duncan Andrews, Landon Zimmerman, Evan Martin, Joe DiGennaro, Baxi Chong2026-03-09💻 cs

Expert Knowledge-driven Reinforcement Learning for Autonomous Racing via Trajectory Guidance and Dynamics Constraints

该论文提出了一种名为 TraD-RL 的强化学习方法，通过融合专家轨迹引导、基于控制障碍函数的动力学安全约束以及多阶段课程学习策略，有效解决了自动驾驶赛车在高动态非线性环境下的训练不稳定与安全性问题，实现了速度与稳定性的协同优化。

Bo Leng, Weiqi Zhang, Zhuoren Li, Lu Xiong, Guizhe Jin, Ran Yu, Chen Lv2026-03-09💻 cs

DexEMG: Towards Dexterous Teleoperation System via EMG2Pose Generalization

本文提出了名为 DexEMG 的轻量级肌电遥操作系统，通过训练基于表面肌电信号的手势预测模型（EMG2Pose）并结合鲁棒的手部重定向算法，实现了无需频繁个体校准即可在复杂环境中高精度控制灵巧机械手的通用化目标。

Qianyou Zhao, Wenqiao Li, Chiyu Wang, Kaifeng Zhang2026-03-09💻 cs

AnyCamVLA: Zero-Shot Camera Adaptation for Viewpoint Robust Vision-Language-Action Models

本文提出了 AnyCamVLA，一种无需额外演示数据或微调即可通过实时虚拟视角合成来适应不同相机视角的零-shot 框架，显著提升了预训练视觉 - 语言 - 动作模型在机器人操作中的视角鲁棒性。

Hyeongjun Heo, Seungyeon Woo, Sang Min Kim, Junho Kim, Junho Lee, Yonghyeon Lee, Young Min Kim2026-03-09💻 cs

Systematic Evaluation of Novel View Synthesis for Video Place Recognition

该论文利用五个公共视频地点识别数据库和七种图像相似度方法，系统评估了合成新视角对视频地点识别的影响，发现少量合成视角能提升识别效果，而在大规模添加时，视角变化的幅度不如添加视角的数量和数据集图像类型重要。

Muhammad Zawad Mahmud, Samiha Islam, Damian Lyons2026-03-09💻 cs

Improved hopping control on slopes for small robots using spring mass modeling

本文提出了一种基于弹簧质量模型的简单控制策略，通过调整触地角度和施加预补偿力矩，有效解决了小型跳跃机器人在斜坡上因倾斜地面导致的不稳定旋转问题，使其能在无需复杂传感与计算的情况下实现稳定跳跃。

Heston Roberts, Pronoy Sarker, Sm Ashikul Islam, Min Gyu Kim2026-03-09💻 cs

Iterative Convex Optimization with Control Barrier Functions for Obstacle Avoidance among Polytopes

本文提出了一种基于精确凸多面体最近点计算生成线性控制屏障函数约束的迭代凸优化框架，通过局部线性化实现了非线性系统在多面体障碍物环境下的实时安全轨迹规划。

Shuo Liu, Zhe Huang, Calin A. Belta2026-03-09💻 cs

FTSplat: Feed-forward Triangle Splatting Network

FTSplat 提出了一种前馈三角形点阵网络，通过从多视图图像直接预测连续三角形表面，实现了无需单场景优化即可生成适用于机器人仿真的高保真、流形几何 3D 重建。

Xiong Jinlin, Li Can, Shen Jiawei, Qi Zhigang, Sun Lei, Zhao Dongyang2026-03-09💻 cs

Swooper: Learning High-Speed Aerial Grasping With a Simple Gripper

该论文提出了名为 Swooper 的基于深度强化学习的方法，通过两阶段训练策略使搭载简易夹爪的轻量级四旋翼无人机在零样本部署下实现了高达 1.5 米/秒的飞行速度与 84% 的实机抓取成功率。

Ziken Huang, Xinze Niu, Bowen Chai, Renbiao Jin, Danping Zou2026-03-09💻 cs

How to Model Your Crazyflie Brushless

本文针对 2025 年推出的 Crazyflie Brushless 无人机建立了精确的动力学模型，并通过仿真与硬件实验验证了其在强化学习控制及高难度特技动作（如后空翻）中的有效性，同时开源了该项目以助力相关研究。

Alexander Gräfe, Christoph Scherer, Wolfgang Hönig, Sebastian Trimpe2026-03-09💻 cs

PROBE: Probabilistic Occupancy BEV Encoding with Analytical Translation Robustness for 3D Place Recognition

本文提出了 PROBE，一种无需学习的 LiDAR 三维地点识别描述子，它通过将鸟瞰图（BEV）单元建模为伯努利随机变量并利用极坐标雅可比行列式解析地边缘化连续平移，实现了跨传感器泛化且无需针对特定数据集进行调优，在多个数据集上取得了优于现有手工描述子的性能。

Jinseop Lee, Byoungho Lee, Gichul Yoo2026-03-09💻 cs