Vision-Augmented On-Track System Identification for Autonomous Racing via Attention-Based Priors and Iterative Neural Correction

该论文提出了一种结合视觉注意力先验与迭代神经修正的自主赛车系统辨识框架,通过利用轻量级 CNN 从路面纹理生成摩擦先验以解决冷启动问题,并采用 S4 模型捕捉高频动态残差,显著提升了非线性轮胎动力学参数辨识的精度与收敛速度。

Zhiping Wu, Cheng Hu, Yiqin Wang, Lei Xie, Hongye SuWed, 11 Ma💻 cs

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

该论文提出了一种基于隐式最大似然估计(IMLE)的分布蒸馏框架,通过将条件流匹配(CFM)专家模型蒸馏为单步学生模型,在保留多模态动作分布的同时消除了迭代积分带来的延迟,实现了融合多模态感知的高频实时机器人轨迹控制。

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Receptogenesis in a Vascularized Robotic Embodiment

该研究提出并实现了一种受生物循环系统启发的血管化机器人复合体,通过流体输送前体与外部紫外光照射相结合的原位光聚合技术,使机器人能够根据环境需求从内部流体储备中“生长”出新的传感器硬件(即受体发生),从而在运行中实时扩展其物理感知与控制能力。

Kadri-Ann Pankratov, Leonid Zinatullin, Hans Priks, Adele Metsniit, Urmas Johanson, Tarmo Tamm, Alvo Aabloo, Edoardo Sinibaldi, Indrek MustWed, 11 Ma🔬 cond-mat.mtrl-sci

StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving

本文提出了 StyleVLA,一种基于 Qwen3-VL-4B 的驾驶风格感知视觉语言动作模型,通过引入物理约束混合损失和构建大规模多风格指令数据集,实现了在轨迹可行性、风格适应性及综合驾驶表现上超越现有闭源模型及最先进 VLA 模型的自动驾驶决策能力。

Yuan Gao, Dengyuan Hua, Mattia Piccinini, Finn Rasmus Schäfer, Korbinian Moller, Lin Li, Johannes BetzWed, 11 Ma💻 cs

Beyond Short-Horizon: VQ-Memory for Robust Long-Horizon Manipulation in Non-Markovian Simulation Benchmarks

该论文提出了基于 LLM 的 RuleSafe 基准测试以评估长程非马尔可夫操作任务,并设计了结合 VQ-VAE 的 VQ-Memory 模块,通过离散潜变量编码历史状态,显著提升了现有视觉 - 语言 - 动作模型在复杂长程操作中的规划能力、泛化性及计算效率。

Wang Honghui, Jing Zhi, Ao Jicong, Song Shiji, Li Xuelong, Huang Gao, Bai ChenjiaWed, 11 Ma💻 cs

NS-VLA: Towards Neuro-Symbolic Vision-Language-Action Models

该论文提出了一种名为 NS-VLA 的新型神经符号视觉 - 语言 - 动作框架,通过结合符号编码器、符号求解器和在线强化学习,有效解决了现有模型在数据效率、可复用原语学习以及探索能力方面的局限,并在机器人操作任务中展现出卓越的少样本训练、抗干扰及零样本泛化性能。

Ziyue Zhu, Shangyang Wu, Shuai Zhao, Zhiqiu Zhao, Shengjie Li, Yi Wang, Fang Li, Haoran LuoWed, 11 Ma💻 cs

Trajectory Optimization for Self-Wrap-Aware Cable-Towed Planar Object Manipulation under Implicit Tension Constraints

该论文提出了一种将自缠绕感知与隐式张力约束相结合的电缆牵引平面物体轨迹优化方法,通过构建包含三种松弛模式的优化框架,利用隐式模式松弛(IMR)在状态演化中主动利用自缠绕产生的力矩通道,从而避免了传统显式路由决策导致的保守解问题。

Yu Li, Amin Fakhari, Hamid SadeghianWed, 11 Ma💻 cs

ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly

本文提出了 ReTac-ACT,一种通过双向交叉注意力、本体感知门控网络及触觉重建目标来实现视觉 - 触觉特征融合与动态切换的模仿学习策略,在 NIST 精密装配基准测试中显著超越了纯视觉及通用基线方法,实现了高达 90% 的插孔成功率及在 0.1 毫米工业级间隙下的稳健表现。

Minchi Ruan, LiangQing Zhou, Hongtong Li, Zongtao Wang, ZhaoMing Lu, Jianwei Zhang, Bin FangWed, 11 Ma💻 cs

OTPL-VIO: Robust Visual-Inertial Odometry with Optimal Transport Line Association and Adaptive Uncertainty

该论文提出了一种名为 OTPL-VIO 的鲁棒立体视觉惯性里程计系统,通过引入无需训练的线特征描述子与基于熵正则化最优传输的关联机制,结合自适应不确定性加权策略,有效解决了低纹理和光照剧烈变化场景下的特征稀疏与匹配歧义问题,实现了高精度且实时的状态估计。

Zikun Chen, Wentao Zhao, Yihe Niu, Tianchen Deng, Jingchuan WangWed, 11 Ma💻 cs

DRIFT: Dual-Representation Inter-Fusion Transformer for Automated Driving Perception with 4D Radar Point Clouds

本文提出了 DRIFT 模型,这是一种专为 4D 雷达点云设计的自动驾駛感知 Transformer,通过双路径架构(点路径与柱路径)及多阶段特征共享机制,有效融合局部细粒度与全局粗粒度上下文信息,从而在物体检测和自由道路估计任务中显著优于现有基线方法。

Siqi Pei, Andras Palffy, Dariu M. GavrilaWed, 11 Ma💻 cs

Robotic Scene Cloning:Advancing Zero-Shot Robotic Scene Adaptation in Manipulation via Visual Prompt Editing

本文提出了一种名为“机器人场景克隆”(RSC)的新方法,通过视觉提示编辑和条件注入模块对现有机器人操作轨迹进行场景特定的自适应调整,从而在无需现场数据采集的情况下显著提升了机器人在真实环境中的零样本泛化能力。

Binyuan Huang, Yuqing Wen, Yucheng Zhao, Yaosi Hu, Tiancai Wang, Chang Wen Chen, Haoqiang Fan, Zhenzhong ChenWed, 11 Ma💻 cs