CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions

O artigo apresenta o CBF-RL, um framework que integra Funções de Barreira de Controle (CBFs) durante o treinamento de Aprendizado por Reforço para internalizar restrições de segurança na política aprendida, permitindo a implantação segura em robôs reais, como o Unitree G1, sem a necessidade de filtros de segurança em tempo real.

Lizhi Yang, Blake Werner, Massimiliano de Sa + 1 more2026-03-06💻 cs

ROVER: Regulator-Driven Robust Temporal Verification of Black-Box Robot Policies

O artigo apresenta o ROVER, uma abordagem inovadora de verificação temporal baseada em reguladores para políticas de robôs caixas-pretas, que utiliza especificações de Lógica Temporal de Sinal (STL) e métricas de robustez para guiar o retreinamento iterativo, resultando em melhorias significativas na satisfação de requisitos de segurança temporal tanto em simulações quanto em robôs reais.

Kristy Sakano, Jianyu An, Dinesh Manocha + 1 more2026-03-06💻 cs

Observer-Actor: Active Vision Imitation Learning with Sparse-View Gaussian Splatting

O artigo propõe o ObAct, um novo framework de aprendizado por imitação com visão ativa que utiliza um braço robótico como observador para construir uma representação 3DGS e encontrar a melhor posição de câmera, permitindo que o braço executor atue com observações mais claras e resultando em políticas significativamente mais robustas do que em configurações com câmeras estáticas.

Yilong Wang, Cheng Qian, Ruomeng Fan + 1 more2026-03-06💻 cs

MarketGen: A Scalable Simulation Platform with Auto-Generated Embodied Supermarket Environments

O artigo apresenta o MarketGen, uma plataforma de simulação escalável que utiliza geração procedural de conteúdo baseada em agentes para criar automaticamente ambientes de supermercado realistas e estruturados, oferecendo um novo benchmark e biblioteca de ativos para avançar a pesquisa em agentes corporativos para aplicações comerciais complexas.

Xu Hu, Yiyang Feng, Junran Peng + 7 more2026-03-06💻 cs

GRAND: Guidance, Rebalancing, and Assignment for Networked Dispatch in Multi-Agent Path Finding

O artigo apresenta o GRAND, um algoritmo hierárquico que combina orientação baseada em aprendizado de máquina, rebalanceamento por fluxo de custo mínimo e atribuição local para otimizar o despacho de grandes frotas de robôs em armazéns, aumentando o throughput em até 10% em relação aos melhores métodos existentes enquanto mantém a execução em tempo real.

Johannes Gaber, Meshal Alharbi, Daniele Gammelli + 1 more2026-03-06💻 cs

TEMPO-VINE: A Multi-Temporal Sensor Fusion Dataset for Localization and Mapping in Vineyards

O artigo apresenta o TEMPO-VINE, o primeiro conjunto de dados público multitemporal e multimodal projetado para avaliar técnicas de fusão de sensores, localização e mapeamento em vinhedos reais, preenchendo uma lacuna crítica ao fornecer trajetórias de referência e dados de sensores heterogêneos sob diversas condições ambientais e de crescimento vegetal.

Mauro Martini, Marco Ambrosio, Judith Vilella-Cantos + 2 more2026-03-06💻 cs

NeuralRemaster: Phase-Preserving Diffusion for Structure-Aligned Generation

O artigo apresenta o NeuralRemaster, um método de difusão que preserva as fases dos dados de entrada enquanto randomiza suas magnitudes, permitindo a geração de imagens e vídeos estruturalmente alinhados e geometricamente consistentes para tarefas como re-renderização e transferência sim-to-real, sem custos adicionais de inferência ou alterações na arquitetura do modelo.

Yu Zeng, Charles Ochoa, Mingyuan Zhou + 3 more2026-03-06💻 cs

EmboTeam: Grounding LLM Reasoning into Reactive Behavior Trees via PDDL for Embodied Multi-Robot Collaboration

O artigo apresenta o EmboTeam, um framework inovador para planejamento de tarefas em equipes de robôs heterogêneos que integra raciocínio de modelos de linguagem (LLMs), planejamento clássico baseado em PDDL e árvores de comportamento reativas para melhorar significativamente a execução de tarefas de longo prazo em ambientes domésticos.

Haishan Zeng, Mengna Wang, Peng Li2026-03-06💻 cs

DDP-WM: Disentangled Dynamics Prediction for Efficient World Models

O artigo apresenta o DDP-WM, um modelo de mundo eficiente que utiliza a previsão de dinâmicas desentrelaçadas para decompor a evolução do estado em interações físicas primárias e atualizações de contexto secundárias, alcançando uma aceleração de inferência de 9 vezes e melhorias significativas no sucesso de planejamento em comparação com modelos densos baseados em Transformers.

Shicheng Yin, Kaixuan Yin, Weixing Chen + 3 more2026-03-06💻 cs

Towards Exploratory and Focused Manipulation with Bimanual Active Perception: A New Problem, Benchmark and Strategy

Este trabalho apresenta o novo problema de Manipulação Exploratória e Focada (EFM), estabelecendo o benchmark EFM-10 e uma estratégia de Percepção Ativa Bimanual (BAP) que utiliza um braço para visão ativa e outro para sensoriamento de força, validando sua eficácia através de um conjunto de dados e aprendizado por imitação para superar oclusões visuais em tarefas de manipulação desafiadoras.

Yuxin He, Ruihao Zhang, Tianao Shen + 2 more2026-03-06💻 cs