Systematic Evaluation of Novel View Synthesis for Video Place Recognition

Este artigo apresenta uma avaliação sistemática da geração de vistas sintéticas para reconhecimento de lugares em vídeo (VPR), demonstrando que, embora pequenas adições de novas vistas melhorem as estatísticas de reconhecimento, para adições maiores o tipo de imagem e a quantidade de vistas são mais determinantes do que a magnitude da mudança de perspectiva.

Muhammad Zawad Mahmud, Samiha Islam, Damian Lyons2026-03-09💻 cs

Iterative Convex Optimization with Control Barrier Functions for Obstacle Avoidance among Polytopes

Este artigo propõe um novo quadro iterativo de controle preditivo baseado em modelos (MPC) com funções de barreira de controle convexas que, ao utilizar hiperplanos de suporte derivados de cálculos exatos de distância entre polítopos, permite o planejamento de trajetórias e o controle de segurança em tempo real para robôs poliedrais em ambientes com obstáculos poliedrais, superando as limitações de precisão geométrica e desempenho computacional de métodos existentes.

Shuo Liu, Zhe Huang, Calin A. Belta2026-03-09💻 cs

PROBE: Probabilistic Occupancy BEV Encoding with Analytical Translation Robustness for 3D Place Recognition

O artigo apresenta o PROBE, um descritor de reconhecimento de lugar para LiDAR sem aprendizado que utiliza codificação de ocupação probabilística em visão de pássaro (BEV) e marginalização analítica de incertezas de translação para alcançar alta precisão e generalização entre diferentes sensores sem necessidade de ajuste por conjunto de dados.

Jinseop Lee, Byoungho Lee, Gichul Yoo2026-03-09💻 cs

MagRobot:An Open Simulator for Magnetically Navigated Robots

O artigo apresenta o MagRobot, o primeiro simulador de código aberto universal que facilita o projeto, a visualização e a validação de robôs navegados magneticamente para aplicações médicas minimamente invasivas, oferecendo um ambiente flexível para benchmarking e otimização de hardware e algoritmos.

Heng Wang (South China University of Technology), Haoyu Song (South China University of Technology), Jiatao Zheng (South China University of Technology), Yuxiang Han (South China University of Technology), Kunli Wang (South China University of Technology)2026-03-09💻 cs

Moving Through Clutter: Scaling Data Collection and Benchmarking for 3D Scene-Aware Humanoid Locomotion via Virtual Reality

Este artigo apresenta o "Moving Through Clutter" (MTC), um framework de código aberto baseado em Realidade Virtual para coleta de dados e avaliação de locomoção de humanoides em ambientes 3D desordenados, fornecendo um novo conjunto de dados e benchmarks para desenvolver sistemas que adaptem o movimento ao cenário e garantam segurança contra colisões.

Beichen Wang, Yuanjie Lu, Linji Wang, Liuchuan Yu, Xuesu Xiao2026-03-09💻 cs

TADPO: Reinforcement Learning Goes Off-road

O artigo apresenta o TADPO, uma nova formulação de gradiente de política que combina trajetórias off-policy e on-policy para permitir a navegação em alta velocidade em terrenos off-road complexos, marcando a primeira implementação bem-sucedida de políticas baseadas em aprendizado por reforço em um veículo off-road em escala real com transferência zero-shot de simulação para a realidade.

Zhouchonghao Wu, Raymond Song, Vedant Mundheda, Luis E. Navarro-Serment, Christof Schoenborn, Jeff Schneider2026-03-09🤖 cs.AI

Restoring Linguistic Grounding in VLA Models via Train-Free Attention Recalibration

Este artigo identifica e mitiga a "cegueira linguística" em modelos Visão-Linguagem-Ação (VLA), onde políticas robóticas ignoram instruções contraditórias em favor de pistas visuais, propondo o método IGAR, uma técnica de recalibração de atenção sem treinamento que restaura a fidelidade às instruções sem modificar a arquitetura do modelo.

Ninghao Zhang, Bin Zhu, Shijie Zhou, Jingjing Chen2026-03-09🤖 cs.AI

Devil is in Narrow Policy: Unleashing Exploration in Driving VLA Models

O artigo apresenta o Curious-VLA, um framework que supera a limitação de políticas restritivas em modelos VLA de direção autônoma através de uma estratégia de expansão de trajetórias viáveis e amostragem adaptativa, alcançando resultados state-of-the-art no benchmark Navsim ao desbloquear o potencial exploratório desses modelos.

Canyu Chen, Yuguang Yang, Zhewen Tan, Yizhi Wang, Ruiyi Zhan, Haiyan Liu, Xuanyao Mao, Jason Bao, Xinyue Tang, Linlin Yang, Bingchuan Sun, Yan Wang, Baochang Zhang2026-03-09💻 cs

Multimodal Behavior Tree Generation: A Small Vision-Language Model for Robot Task Planning

Este trabalho apresenta um método para gerar árvores de comportamento para planejamento de tarefas robóticas utilizando modelos de visão e linguagem (VLMs) compactos e de código aberto, que são fine-tuned em um novo dataset construído a partir de episódios robóticos existentes e alcançam uma taxa de sucesso de 87% em tarefas domésticas, rivalizando com modelos fechados de grande porte com recursos computacionais significativamente menores.

Cristiano Battistini, Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-09💻 cs