Task-Relevant and Irrelevant Region-Aware Augmentation for Generalizable Vision-Based Imitation Learning in Agricultural Manipulation

O artigo propõe o DRAIL, um framework de aumento de dados que separa regiões relevantes e irrelevantes da tarefa para melhorar a generalização da aprendizagem por imitação em manipulação agrícola, demonstrando maior robustez e sucesso em tarefas de colheita e seleção de vegetais sob condições visuais não vistas.

Shun Hattori, Hikaru Sasaki, Takumi Hachimine + 2 more2026-03-06💻 cs

Beyond the Patch: Exploring Vulnerabilities of Visuomotor Policies via Viewpoint-Consistent 3D Adversarial Object

Este trabalho propõe um método de otimização de textura adversarial 3D consistente com a viewpoint, utilizando renderização diferenciável e estratégias de aprendizado como EOT e um currículo de refinamento, para explorar e explorar vulnerabilidades em políticas visuomotoras de robôs sob condições de viewpoint dinâmico, superando as limitações dos ataques de patches 2D tradicionais.

Chanmi Lee, Minsung Yoon, Woojae Kim + 2 more2026-03-06💻 cs

U-OBCA: Uncertainty-Aware Optimization-Based Collision Avoidance via Wasserstein Distributionally Robust Chance Constraints

O artigo apresenta o U-OBCA, um método de planejamento de trajetória que utiliza restrições de chance distribucionalmente robustas baseadas em Wasserstein para lidar com incertezas em robôs e obstáculos poligonais, eliminando aproximações geométricas conservadoras e melhorando significativamente a eficiência de navegação em ambientes estreitos e clutterados.

Zehao Wang, Yuxuan Tang, Han Zhang + 2 more2026-03-06🔢 math

Integrated cooperative localization of heterogeneous measurement swarm: A unified data-driven method

Este trabalho propõe um método unificado e baseado em dados para localização cooperativa em enxames de robôs heterogêneos, utilizando um estimador adaptativo de localização relativa e uma estratégia distribuída que garantem a convergência mesmo sob topologias de medição direcionadas e esparsas, superando as restrições geométricas de abordagens anteriores.

Kunrui Ze, Wei Wang, Guibin Sun + 3 more2026-03-06💻 cs

CoIn3D: Revisiting Configuration-Invariant Multi-Camera 3D Object Detection

O artigo apresenta o CoIn3D, um framework generalizável para detecção 3D de objetos com múltiplas câmeras que supera as limitações de transferência entre diferentes configurações de sensores ao incorporar explicitamente discrepâncias de priores espaciais (como intrínsecos, extrínsecos e layouts) através de modulação de características espaciais e aumento de dados orientado à câmera.

Zhaonian Kuang, Rui Ding, Haotian Wang + 3 more2026-03-06💻 cs

VinePT-Map: Pole-Trunk Semantic Mapping for Resilient Autonomous Robotics in Vineyards

Este artigo apresenta o VinePT-Map, um framework de mapeamento semântico que utiliza troncos de videiras e postes de suporte como marcos estruturais persistentes para permitir a localização resiliente e agnóstica às estações de robôs autônomos em vinhedos, validado através de um novo conjunto de dados multitemporal e extensos experimentos de campo.

Giorgio Audrito, Mauro Martini, Alessandro Navone + 2 more2026-03-06💻 cs

AIM-SLAM: Dense Monocular SLAM via Adaptive and Informative Multi-View Keyframe Prioritization with Foundation Model

O artigo apresenta o AIM-SLAM, um sistema de SLAM monocular denso que supera limitações anteriores ao utilizar o modelo de fundação VGGT e um módulo SIGMA para priorização adaptativa de múltiplos quadros-chave baseada em sobreposição de voxels e ganho de informação, resultando em otimização conjunta Sim(3) e desempenho superior em estimativa de pose e reconstrução densa.

Jinwoo Jeon, Dong-Uk Seo, Eungchang Mason Lee + 1 more2026-03-06💻 cs

SPIRIT: Perceptive Shared Autonomy for Robust Robotic Manipulation under Deep Learning Uncertainty

O artigo apresenta o SPIRIT, um sistema de autonomia compartilhada perceptiva que utiliza estimativas de incerteza de aprendizado profundo para alternar dinamicamente entre manipulação autônoma e teleoperação háptica, garantindo assim manipulação robótica robusta e segura mesmo diante de falhas na percepção baseada em IA.

Jongseok Lee, Ribin Balachandran, Harsimran Singh + 6 more2026-03-06🤖 cs.AI

Decoupling Task and Behavior: A Two-Stage Reward Curriculum in Reinforcement Learning for Robotics

O artigo propõe um currículo de recompensa em duas etapas para aprendizado por reforço em robótica, que desacopla objetivos específicos da tarefa de termos comportamentais auxiliares, permitindo primeiro o aprendizado da tarefa e depois a introdução de otimizações como eficiência energética, resultando em um método simples e eficaz que supera as abordagens tradicionais em diversos ambientes.

Kilian Freitag, Knut Åkesson, Morteza Haghir Chehreghani2026-03-06🤖 cs.LG

Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models

Este artigo propõe um quadro adaptativo para Modelos Visão-Linguagem-Ação que, inspirado na cognição humana, classifica dinamicamente a complexidade da tarefa utilizando apenas embeddings visuais para decidir entre executar, raciocinar ou abster-se, otimizando assim o uso de recursos e prevenindo falhas em cenários fora de distribuição.

Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-06💻 cs

Critic in the Loop: A Tri-System VLA Framework for Robust Long-Horizon Manipulation

O artigo apresenta o "Critic in the Loop", um framework hierárquico adaptativo que integra um modelo VLM para raciocínio global, um modelo VLA para execução reativa e um crítico visual leve para rotear dinamicamente o controle, permitindo manipulação robótica robusta e eficiente em tarefas de longo horizonte ao minimizar consultas custosas e lidar com falhas.

Pengfei Yi, Yingjie Ma, Wenjiang Xu + 4 more2026-03-06💻 cs