Vision-Augmented On-Track System Identification for Autonomous Racing via Attention-Based Priors and Iterative Neural Correction

Este artigo propõe um novo sistema de identificação de dinâmica veicular para corridas autônomas que combina uma rede CNN leve para estimar atrito a partir de imagens e um modelo S4 para capturar resíduais temporais, permitindo uma convergência rápida e precisa dos parâmetros de pneus mesmo em condições extremas.

Zhiping Wu, Cheng Hu, Yiqin Wang, Lei Xie, Hongye SuWed, 11 Ma💻 cs

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Este trabalho propõe um framework que distila uma política expert Conditional Flow Matching em uma rede estudante de passo único via IMLE e uma função de perda baseada na distância de Chamfer, permitindo a geração de trajetórias multi-modais de alta frequência e precisão para controle robótico em tempo real.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

Este trabalho introduz o "Open-World Motion Forecasting", um novo cenário e framework de ponta a ponta para previsão de trajetória que supera as limitações de taxonomia fixa e percepção perfeita ao aprender continuamente novas classes de objetos a partir de imagens de câmera, mitigando o esquecimento catastrófico através de pseudo-rotulagem filtrada por modelos de linguagem visual e amostragem de replay baseada em variância de características.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

Stein Variational Ergodic Surface Coverage with SE(3) Constraints

Este trabalho apresenta um método inovador de Descida de Gradiente Variacional de Stein (SVGD) pré-condicionado com restrições SE(3) para otimização de trajetórias ergódicas, permitindo que robôs gerem trajetórias de cobertura de superfícies complexas em nuvens de pontos com maior qualidade e eficiência computacional do que as abordagens existentes.

Jiayun Li, Yufeng Jin, Sangli Teng, Dejian Gong, Georgia ChalvatzakiWed, 11 Ma💻 cs

SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments

O artigo apresenta o SEA-Nav, um quadro de aprendizado por reforço que combina funções de barreira controlável diferenciáveis, replay adaptativo de colisões e restrições cinemáticas para permitir que robôs quadrúpedes naveguem com segurança e agilidade em ambientes densamente obstruídos com tempo de treinamento de apenas alguns minutos.

Shiyi Chen, Mingye Yang, Haiyan Mao, Jiaqi Zhang, Haiyi Liu, Shuheng He, Debing Zhang, Zihao Qiu, Chun ZhangWed, 11 Ma💻 cs

StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving

O artigo apresenta o StyleVLA, um modelo de Visão-Linguagem-Ação (VLA) baseado em física e treinado com um grande conjunto de dados instrucionais, que supera modelos proprietários ao gerar trajetórias de direção autônoma não apenas seguras, mas também fisicamente viáveis e adaptadas a estilos de condução diversos.

Yuan Gao, Dengyuan Hua, Mattia Piccinini, Finn Rasmus Schäfer, Korbinian Moller, Lin Li, Johannes BetzWed, 11 Ma💻 cs

Context-Nav: Context-Driven Exploration and Viewpoint-Aware 3D Spatial Reasoning for Instance Navigation

O artigo apresenta o Context-Nav, uma abordagem sem treinamento específico que aprimora a navegação de instâncias em ambientes 3D ao utilizar alinhamentos texto-imagem densos para guiar a exploração global e realizar verificações espaciais conscientes do ponto de vista para validar candidatos, alcançando desempenho de ponta sem necessidade de ajuste fino.

Won Shik Jang, Ue-Hwan KimWed, 11 Ma💻 cs

Beyond Short-Horizon: VQ-Memory for Robust Long-Horizon Manipulation in Non-Markovian Simulation Benchmarks

O artigo apresenta o RuleSafe, um novo benchmark de manipulação articulada com tarefas não-Markovianas de longo horizonte, e propõe a VQ-Memory, uma representação temporal compacta baseada em VQ-VAE que melhora significativamente o planejamento e a generalização em modelos de manipulação robótica.

Wang Honghui, Jing Zhi, Ao Jicong, Song Shiji, Li Xuelong, Huang Gao, Bai ChenjiaWed, 11 Ma💻 cs

NS-VLA: Towards Neuro-Symbolic Vision-Language-Action Models

O artigo apresenta o NS-VLA, um novo framework neuro-simbólico que combina codificadores simbólicos, solucionadores e aprendizado por reforço online para superar as limitações de modelos VLA existentes, resultando em maior eficiência de dados, generalização zero-shot e capacidade de exploração expandida em tarefas de manipulação robótica.

Ziyue Zhu, Shangyang Wu, Shuai Zhao, Zhiqiu Zhao, Shengjie Li, Yi Wang, Fang Li, Haoran LuoWed, 11 Ma💻 cs

Trajectory Optimization for Self-Wrap-Aware Cable-Towed Planar Object Manipulation under Implicit Tension Constraints

Este artigo propõe uma otimização de trajetória que integra implicitamente as restrições de tensão e o auto-envolvimento do cabo para manipulação de objetos planos, demonstrando que permitir a evolução do estado do cabo gera soluções mais eficientes do que decisões explícitas de roteamento que tendem a ser conservadoras.

Yu Li, Amin Fakhari, Hamid SadeghianWed, 11 Ma💻 cs

ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly

O artigo apresenta o ReTac-ACT, uma política de aprendizado por imitação que funde visão e tato através de mecanismos de atenção cruzada, um mecanismo de controle baseado em propriocepção e um objetivo de reconstrução tátil, alcançando desempenho superior em tarefas de montagem de precisão com oclusão visual e folgas industriais rigorosas.

Minchi Ruan, LiangQing Zhou, Hongtong Li, Zongtao Wang, ZhaoMing Lu, Jianwei Zhang, Bin FangWed, 11 Ma💻 cs

SCDP: Learning Humanoid Locomotion from Partial Observations via Mixed-Observation Distillation

O artigo apresenta o SCDP, uma abordagem que utiliza um modelo de difusão condicionado a sensores e treinamento com observações mistas para aprender locomoção em humanoides apenas com dados onboard, alcançando desempenho comparável a métodos que usam estados privilegiados e demonstrando sucesso em robôs reais sem necessidade de estimativa de estado externa.

Milo Carroll, Tianhu Peng, Lingfan Bao, Chengxu Zhou, Zhibin LiWed, 11 Ma🤖 cs.LG

A Generalized Voronoi Graph based Coverage Control Approach for Non-Convex Environment

Este artigo propõe uma abordagem de controle de cobertura para sistemas multi-robôs em ambientes não convexos com múltiplos obstáculos, utilizando um Gráfico de Voronoi Generalizado (GVG) dividido em fases de balanceamento de carga ponderado e cobertura colaborativa para otimizar a alocação de robôs e garantir a convergência do processo.

Zuyi Guo, Ronghao Zheng, Meiqin Liu, Senlin ZhangWed, 11 Ma💻 cs

OTPL-VIO: Robust Visual-Inertial Odometry with Optimal Transport Line Association and Adaptive Uncertainty

O artigo apresenta o OTPL-VIO, um sistema de odometria visual-inercial estéreo robusto que utiliza descritores profundos livres de treinamento e correspondência baseada em transporte ótimo para associar linhas, superando limitações em cenas de baixa textura e mudanças bruscas de iluminação com maior precisão e estabilidade em tempo real.

Zikun Chen, Wentao Zhao, Yihe Niu, Tianchen Deng, Jingchuan WangWed, 11 Ma💻 cs

Robotic Scene Cloning:Advancing Zero-Shot Robotic Scene Adaptation in Manipulation via Visual Prompt Editing

O artigo apresenta o Robotic Scene Cloning (RSC), um método inovador que aprimora a adaptação zero-shot de robôs a novos cenários de manipulação ao editar trajetórias existentes por meio de prompts visuais, permitindo a geração de amostras consistentes e a transferência eficaz de políticas para ambientes reais sem necessidade de coleta extensiva de dados.

Binyuan Huang, Yuqing Wen, Yucheng Zhao, Yaosi Hu, Tiancai Wang, Chang Wen Chen, Haoqiang Fan, Zhenzhong ChenWed, 11 Ma💻 cs