cs.RO 篇论文 | Gist.Science

Vision-Augmented On-Track System Identification for Autonomous Racing via Attention-Based Priors and Iterative Neural Correction

该论文提出了一种结合视觉注意力先验与迭代神经修正的自主赛车系统辨识框架，通过利用轻量级 CNN 从路面纹理生成摩擦先验以解决冷启动问题，并采用 S4 模型捕捉高频动态残差，显著提升了非线性轮胎动力学参数辨识的精度与收敛速度。

Zhiping Wu, Cheng Hu, Yiqin Wang, Lei Xie, Hongye SuWed, 11 Ma💻 cs

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

该论文提出了一种基于隐式最大似然估计（IMLE）的分布蒸馏框架，通过将条件流匹配（CFM）专家模型蒸馏为单步学生模型，在保留多模态动作分布的同时消除了迭代积分带来的延迟，实现了融合多模态感知的高频实时机器人轨迹控制。

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

该论文提出了“开放世界运动预测”这一新范式，通过构建首个端到端类增量运动预测框架，利用伪标签策略和基于查询特征方差的重放采样机制，在从相机图像直接预测轨迹的同时有效缓解了灾难性遗忘，实现了自动驾驶系统在动态变化环境中的持续适应与零样本迁移。

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

Stein Variational Ergodic Surface Coverage with SE(3) Constraints

该论文提出了一种结合流形感知采样、SE(3) 特定粒子更新及预条件技术的 Stein 变分梯度下降方法，有效解决了机器人复杂 3D 表面覆盖任务中非凸优化与 SE(3) 约束处理的难题，实现了优于现有方法的轨迹生成质量与收敛效率。

Jiayun Li, Yufeng Jin, Sangli Teng, Dejian Gong, Georgia ChalvatzakiWed, 11 Ma💻 cs

SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments

本文提出了 SEA-Nav 框架，通过结合微分控制障碍函数（CBF）安全屏蔽、自适应碰撞回放机制及运动学约束，实现了仅需分钟级训练即可在真实复杂密集障碍环境中进行安全且敏捷的四足机器人导航。

Shiyi Chen, Mingye Yang, Haiyan Mao, Jiaqi Zhang, Haiyi Liu, Shuheng He, Debing Zhang, Zihao Qiu, Chun ZhangWed, 11 Ma💻 cs

Receptogenesis in a Vascularized Robotic Embodiment

该研究提出并实现了一种受生物循环系统启发的血管化机器人复合体，通过流体输送前体与外部紫外光照射相结合的原位光聚合技术，使机器人能够根据环境需求从内部流体储备中“生长”出新的传感器硬件（即受体发生），从而在运行中实时扩展其物理感知与控制能力。

Kadri-Ann Pankratov, Leonid Zinatullin, Hans Priks, Adele Metsniit, Urmas Johanson, Tarmo Tamm, Alvo Aabloo, Edoardo Sinibaldi, Indrek MustWed, 11 Ma🔬 cond-mat.mtrl-sci

StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving

本文提出了 StyleVLA，一种基于 Qwen3-VL-4B 的驾驶风格感知视觉语言动作模型，通过引入物理约束混合损失和构建大规模多风格指令数据集，实现了在轨迹可行性、风格适应性及综合驾驶表现上超越现有闭源模型及最先进 VLA 模型的自动驾驶决策能力。

Yuan Gao, Dengyuan Hua, Mattia Piccinini, Finn Rasmus Schäfer, Korbinian Moller, Lin Li, Johannes BetzWed, 11 Ma💻 cs

Context-Nav: Context-Driven Exploration and Viewpoint-Aware 3D Spatial Reasoning for Instance Navigation

本文提出了 Context-Nav 方法，通过将长文本描述转化为引导探索的全局先验，并结合视点感知的 3D 空间推理来验证候选目标，从而在无任务特定训练的情况下实现了实例导航的先进性能。

Won Shik Jang, Ue-Hwan KimWed, 11 Ma💻 cs

Beyond Short-Horizon: VQ-Memory for Robust Long-Horizon Manipulation in Non-Markovian Simulation Benchmarks

该论文提出了基于 LLM 的 RuleSafe 基准测试以评估长程非马尔可夫操作任务，并设计了结合 VQ-VAE 的 VQ-Memory 模块，通过离散潜变量编码历史状态，显著提升了现有视觉 - 语言 - 动作模型在复杂长程操作中的规划能力、泛化性及计算效率。

Wang Honghui, Jing Zhi, Ao Jicong, Song Shiji, Li Xuelong, Huang Gao, Bai ChenjiaWed, 11 Ma💻 cs

NS-VLA: Towards Neuro-Symbolic Vision-Language-Action Models

该论文提出了一种名为 NS-VLA 的新型神经符号视觉 - 语言 - 动作框架，通过结合符号编码器、符号求解器和在线强化学习，有效解决了现有模型在数据效率、可复用原语学习以及探索能力方面的局限，并在机器人操作任务中展现出卓越的少样本训练、抗干扰及零样本泛化性能。

Ziyue Zhu, Shangyang Wu, Shuai Zhao, Zhiqiu Zhao, Shengjie Li, Yi Wang, Fang Li, Haoran LuoWed, 11 Ma💻 cs

On the Cost of Evolving Task Specialization in Multi-Robot Systems

该研究通过在有限评估预算下对多机器人觅食场景的进化优化表明，尽管通用行为控制器能被成功优化，但任务专用控制器因协作效率低下而表现更差，从而证明在资源受限条件下任务专业化并不必然提升系统效率。

Paolo Leopardi, Heiko Hamann, Jonas Kuckling, Tanja Katharina KaiserWed, 11 Ma💻 cs

Trajectory Optimization for Self-Wrap-Aware Cable-Towed Planar Object Manipulation under Implicit Tension Constraints

该论文提出了一种将自缠绕感知与隐式张力约束相结合的电缆牵引平面物体轨迹优化方法，通过构建包含三种松弛模式的优化框架，利用隐式模式松弛（IMR）在状态演化中主动利用自缠绕产生的力矩通道，从而避免了传统显式路由决策导致的保守解问题。

Yu Li, Amin Fakhari, Hamid SadeghianWed, 11 Ma💻 cs

ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly

本文提出了 ReTac-ACT，一种通过双向交叉注意力、本体感知门控网络及触觉重建目标来实现视觉 - 触觉特征融合与动态切换的模仿学习策略，在 NIST 精密装配基准测试中显著超越了纯视觉及通用基线方法，实现了高达 90% 的插孔成功率及在 0.1 毫米工业级间隙下的稳健表现。

Minchi Ruan, LiangQing Zhou, Hongtong Li, Zongtao Wang, ZhaoMing Lu, Jianwei Zhang, Bin FangWed, 11 Ma💻 cs

SCDP: Learning Humanoid Locomotion from Partial Observations via Mixed-Observation Distillation

本文提出了传感器条件扩散策略（SCDP），通过混合观测蒸馏技术，使双足机器人仅依靠机载传感器即可在无需显式状态估计的情况下，实现媲美全状态观测基线的鲁棒运动控制与真实部署。

Milo Carroll, Tianhu Peng, Lingfan Bao, Chengxu Zhou, Zhibin LiWed, 11 Ma🤖 cs.LG

Towards Terrain-Aware Safe Locomotion for Quadrupedal Robots Using Proprioceptive Sensing

本文提出了一种仅依赖本体感知传感器的四足机器人安全运动框架，通过构建融合地形估计与状态感知的闭环系统，并利用控制障碍函数实现全局避障与局部防碰撞的严格安全保证。

Peiyu Yang, Jiatao Ding, Wei Pan, Claudio Semini, Cosimo Della SantinaWed, 11 Ma💻 cs

A Generalized Voronoi Graph based Coverage Control Approach for Non-Convex Environment

本文提出了一种基于广义 Voronoi 图的多机器人非凸环境覆盖控制方法，通过结合考虑子区域质量差异的加权负载均衡算法与新型协同覆盖控制器，实现了多障碍物环境下的高效区域覆盖。

Zuyi Guo, Ronghao Zheng, Meiqin Liu, Senlin ZhangWed, 11 Ma💻 cs

OTPL-VIO: Robust Visual-Inertial Odometry with Optimal Transport Line Association and Adaptive Uncertainty

该论文提出了一种名为 OTPL-VIO 的鲁棒立体视觉惯性里程计系统，通过引入无需训练的线特征描述子与基于熵正则化最优传输的关联机制，结合自适应不确定性加权策略，有效解决了低纹理和光照剧烈变化场景下的特征稀疏与匹配歧义问题，实现了高精度且实时的状态估计。

Zikun Chen, Wentao Zhao, Yihe Niu, Tianchen Deng, Jingchuan WangWed, 11 Ma💻 cs

DRIFT: Dual-Representation Inter-Fusion Transformer for Automated Driving Perception with 4D Radar Point Clouds

本文提出了 DRIFT 模型，这是一种专为 4D 雷达点云设计的自动驾駛感知 Transformer，通过双路径架构（点路径与柱路径）及多阶段特征共享机制，有效融合局部细粒度与全局粗粒度上下文信息，从而在物体检测和自由道路估计任务中显著优于现有基线方法。

Siqi Pei, Andras Palffy, Dariu M. GavrilaWed, 11 Ma💻 cs

Robotic Scene Cloning:Advancing Zero-Shot Robotic Scene Adaptation in Manipulation via Visual Prompt Editing

本文提出了一种名为“机器人场景克隆”（RSC）的新方法，通过视觉提示编辑和条件注入模块对现有机器人操作轨迹进行场景特定的自适应调整，从而在无需现场数据采集的情况下显著提升了机器人在真实环境中的零样本泛化能力。

Binyuan Huang, Yuqing Wen, Yucheng Zhao, Yaosi Hu, Tiancai Wang, Chang Wen Chen, Haoqiang Fan, Zhenzhong ChenWed, 11 Ma💻 cs

Efficient and robust control with spikes that constrain free energy

该论文提出了一种新颖的脉冲控制框架，通过仅在降低内部表示自由能时触发神经元放电，实现了兼具高效稀疏性、优异性能及对外部与内部扰动高度鲁棒性的控制机制，为理解大脑认知及开发神经形态硬件算法提供了新的数学途径。

André Urbano, Pablo Lanillos, Sander KeeminkWed, 11 Ma🧬 q-bio

← 上一页下一页 →