Interactive World Simulator for Robot Policy Training and Evaluation

O artigo apresenta o "Interactive World Simulator", um framework que utiliza modelos de consistência para criar simulações interativas rápidas e fisicamente consistentes a partir de dados moderados, permitindo o treinamento e avaliação escaláveis de políticas robóticas com desempenho comparável ao real.

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model

O artigo apresenta o RAG-Driver, um modelo de linguagem grande multimodal com aprendizado por contexto aumentado por recuperação que utiliza demonstrações de especialistas para gerar explicações de condução e previsões de controle com alto desempenho e generalização zero-shot em ambientes não vistos, superando desafios como escassez de dados e esquecimento catastrófico.

Jianhao Yuan, Shuyang Sun, Daniel Omeiza, Bo Zhao, Paul Newman, Lars Kunze, Matthew Gadd2026-03-09🤖 cs.AI

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

O FALCON é um método de pré-treinamento auto-supervisionado para reconhecimento de ações em vídeos de UAVs que supera o desequilíbrio espacial típico de imagens aéreas ao integrar um autoencoder mascarado consciente de objetos com reconstrução futura de duplo horizonte, resultando em maior precisão e inferência significativamente mais rápida em comparação com abordagens supervisionadas.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

Integrated Hierarchical Decision-Making in Inverse Kinematic Planning and Control

Este trabalho apresenta um novo e eficiente framework de programação não-linear que integra decisões hierárquicas ao planejamento e controle de cinemática inversa, utilizando a norma 0\ell_0 para resolver problemas complexos como a seleção simultânea de locais de preensão e posições de efetuadores finais com maior precisão e versatilidade do que as abordagens atuais.

Kai Pfeiffer, Quan Zhang, Yuqing Chen, Gordon Boateng, Yuquan Wang, Vincent Bonnet, Aberrahmane Kheddar2026-03-09💻 cs

CAPS: Context-Aware Priority Sampling for Enhanced Imitation Learning in Autonomous Driving

Este artigo apresenta o CAPS, um método inovador que utiliza VQ-VAEs para criar representações estruturadas e reequilibrar conjuntos de dados desbalanceados em aprendizado por imitação, resultando em melhorias significativas no desempenho e na generalização de sistemas de direção autônoma no simulador CARLA.

Hamidreza Mirkhani, Behzad Khamidehi, Ehsan Ahmadi, Mohammed Elmahgiubi, Weize Zhang, Fazel Arasteh, Umar Rajguru, Kasra Rezaee, Dongfeng Bai2026-03-09🤖 cs.LG

Whole-Body Model-Predictive Control of Legged Robots with MuJoCo

Este artigo demonstra que uma abordagem simples de controle preditivo de modelo (MPC) baseada no algoritmo iLQR e no MuJoCo é surpreendentemente eficaz no mundo real, permitindo a generalização de políticas de locomoção e manipulação para robôs quadrúpedes e humanoides com poucas considerações de simulação para realidade.

John Z. Zhang, Taylor A. Howell, Zeji Yi, Chaoyi Pan, Guanya Shi, Guannan Qu, Tom Erez, Yuval Tassa, Zachary Manchester2026-03-09💻 cs

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

O artigo apresenta o FindAnything, um framework de mapeamento em mundo aberto que integra informações visuais e linguísticas em submapas volumétricos centrados em objetos, permitindo uma compreensão semântica escalável e eficiente em termos de memória e tempo para exploração robótica em ambientes desconhecidos.

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI

ROS-related Robotic Systems Development with V-model-based Application of MeROS Metamodel

Este artigo propõe uma metodologia estruturada baseada no metamodelo MeROS e adaptada ao modelo em V para integrar a Engenharia de Sistemas Baseada em Modelos (MBSE) com o Robot Operating System (ROS), visando garantir coerência semântica e rastreabilidade no desenvolvimento de sistemas robóticos heterogêneos complexos.

Tomasz Winiarski, Jan Kaniuka, Daniel Giełdowski, Jakub Ostrysz, Krystian Radlak, Dmytro Kushnir2026-03-09💻 cs

Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL

Este trabalho apresenta um novo framework de aprendizado por reforço multiagente com arquitetura aluno-professor que gera automaticamente um currículo adaptativo de comportamentos de tráfego, permitindo que veículos autônomos aprendam a lidar de forma equilibrada e segura com cenários que variam do rotineiro ao crítico, superando as limitações dos métodos baseados em regras.

Ahmed Abouelazm, Johannes Ratz, Philip Schörner, J. Marius Zöllner2026-03-09🤖 cs.LG

Bridging Simulation and Usability: A User-Friendly Framework for Scenario Generation in CARLA

Este artigo apresenta um framework interativo e sem código para geração de cenários no simulador CARLA, que utiliza uma interface gráfica e uma representação baseada em grafos para permitir que usuários sem expertise técnica criem, modifiquem e executem testes de validação para veículos autônomos de forma acessível e eficiente.

Ahmed Abouelazm, Mohammad Mahmoud, Conrad Walter, Oleksandr Shchetsura, Erne Hussong, Helen Gremmelmaier, J. Marius Zöllner2026-03-09💻 cs

VEGA: Electric Vehicle Navigation Agent via Physics-Informed Neural Operator and Proximal Policy Optimization

O artigo apresenta o VEGA, um sistema de navegação para veículos elétricos que combina um operador neural informado por física para estimar parâmetros do veículo e um agente de aprendizado por reforço (PPO) para planejar rotas e paradas de recarga de forma eficiente, demonstrando resultados superiores em tempo de viagem e velocidade de inferência em comparação com métodos tradicionais.

Hansol Lim, Minhyeok Im, Jonathan Boyack, Jee Won Lee, Jongseong Brad Choi2026-03-09🤖 cs.LG

Language Conditioning Improves Accuracy of Aircraft Goal Prediction in Non-Towered Airspace

Este artigo apresenta um framework multimodal que integra a compreensão de linguagem natural com raciocínio espacial para prever com maior precisão os objetivos de aeronaves em espaços aéreos não controlados, utilizando transcrições de comunicações de rádio para condicionar modelos probabilísticos e melhorar a tomada de decisão autônoma.

Sundhar Vinodh Sangeetha, Chih-Yuan Chiu, Sarah H. Q. Li, Shreyas Kousik2026-03-09💻 cs

GLIDE: A Coordinated Aerial-Ground Framework for Search and Rescue in Unknown Environments

O artigo apresenta o GLIDE, um quadro cooperativo de busca e resgate que integra dois drones e um veículo terrestre para otimizar a localização de vítimas e a navegação segura em ambientes desconhecidos, utilizando um drone para detecção de alvos, outro para mapeamento do terreno e o veículo terrestre para planejamento de trajetória em tempo real.

Seth Farrell, Chenghao Li, Hesam Mojtahedi, Henrik I. Christensen2026-03-09💻 cs

Decision-Driven Semantic Object Exploration for Legged Robots via Confidence-Calibrated Perception and Topological Subgoal Selection

Este trabalho propõe uma abordagem baseada em visão para exploração semântica orientada a decisões em robôs com pernas, que utiliza arbitragem de evidências semânticas calibradas por confiança, memória topológica de crescimento controlado e seleção de subobjetivos baseada em utilidade semântica para transformar observações ruidosas em decisões de exploração estáveis e executáveis sem depender de reconstrução geométrica densa.

Guoyang Zhao, Yudong Li, Weiqing Qi, Kai Zhang, Bonan Liu, Kai Chen, Haoang Li, Jun Ma2026-03-09💻 cs

ROSflight 2.0: Lean ROS 2-Based Autopilot for Unmanned Aerial Vehicles

Este artigo apresenta o ROSflight 2.0, um sistema de piloto automático leve e de código aberto baseado em ROS 2, projetado para pesquisadores, que introduz melhorias na modularidade, suporte a hardware e ambiente de simulação para acelerar a pesquisa em veículos aéreos não tripulados, demonstrando experimentalmente o controle de um multirotor a 400 Hz com todos os laços de controle executados no computador de bordo.

Jacob Moore, Phil Tokumaru, Ian Reid, Brandon Sutherland, Joseph Ritchie, Gabe Snow, Tim McLain2026-03-09💻 cs