NeuralRemaster: Phase-Preserving Diffusion for Structure-Aligned Generation

O artigo apresenta o NeuralRemaster, um método de difusão que preserva as fases dos dados de entrada enquanto randomiza suas magnitudes, permitindo a geração de imagens e vídeos estruturalmente alinhados e geometricamente consistentes para tarefas como re-renderização e transferência sim-to-real, sem custos adicionais de inferência ou alterações na arquitetura do modelo.

Yu Zeng, Charles Ochoa, Mingyuan Zhou + 3 more2026-03-06💻 cs

EmboTeam: Grounding LLM Reasoning into Reactive Behavior Trees via PDDL for Embodied Multi-Robot Collaboration

O artigo apresenta o EmboTeam, um framework inovador para planejamento de tarefas em equipes de robôs heterogêneos que integra raciocínio de modelos de linguagem (LLMs), planejamento clássico baseado em PDDL e árvores de comportamento reativas para melhorar significativamente a execução de tarefas de longo prazo em ambientes domésticos.

Haishan Zeng, Mengna Wang, Peng Li2026-03-06💻 cs

DDP-WM: Disentangled Dynamics Prediction for Efficient World Models

O artigo apresenta o DDP-WM, um modelo de mundo eficiente que utiliza a previsão de dinâmicas desentrelaçadas para decompor a evolução do estado em interações físicas primárias e atualizações de contexto secundárias, alcançando uma aceleração de inferência de 9 vezes e melhorias significativas no sucesso de planejamento em comparação com modelos densos baseados em Transformers.

Shicheng Yin, Kaixuan Yin, Weixing Chen + 3 more2026-03-06💻 cs

Towards Exploratory and Focused Manipulation with Bimanual Active Perception: A New Problem, Benchmark and Strategy

Este trabalho apresenta o novo problema de Manipulação Exploratória e Focada (EFM), estabelecendo o benchmark EFM-10 e uma estratégia de Percepção Ativa Bimanual (BAP) que utiliza um braço para visão ativa e outro para sensoriamento de força, validando sua eficácia através de um conjunto de dados e aprendizado por imitação para superar oclusões visuais em tarefas de manipulação desafiadoras.

Yuxin He, Ruihao Zhang, Tianao Shen + 2 more2026-03-06💻 cs

Interpretable Multimodal Gesture Recognition for Drone and Mobile Robot Teleoperation via Log-Likelihood Ratio Fusion

Este artigo propõe um sistema de reconhecimento de gestos multimodal e interpretável, que funde dados de sensores inerciais e capacitivos por meio de uma estratégia de razão de verossimilhança logarítmica para teleoperação robusta e eficiente de drones e robôs móveis, superando as limitações de métodos baseados apenas em visão.

Seungyeol Baek, Jaspreet Singh, Lala Shakti Swarup Ray + 3 more2026-03-06💻 cs

Dual-Interaction-Aware Cooperative Control Strategy for Alleviating Mixed Traffic Congestion

Este artigo propõe a estratégia de controle cooperativo DIACC, baseada em Aprendizado por Reforço Multiagente, que mitiga o congestionamento em tráfego misto através de módulos de percepção de interação local e global, um design de recompensa adaptativo e um mecanismo de refinamento de segurança para otimizar a eficiência do tráfego em cenários de gargalo.

Zhengxuan Liu, Yuxin Cai, Yijing Wang + 3 more2026-03-06💻 cs

Act-Observe-Rewrite: Multimodal Coding Agents as In-Context Policy Learners for Robot Manipulation

O artigo apresenta o framework Act-Observe-Rewrite (AOR), no qual um agente de linguagem multimodal melhora políticas de manipulação robótica sintetizando e reescrevendo código executável entre tentativas com base em observações visuais e falhas estruturadas, alcançando alto desempenho em tarefas sem necessidade de demonstrações, engenharia de recompensas ou atualizações de gradiente.

Vaishak Kumar2026-03-06💻 cs

Efficient Autonomous Navigation of a Quadruped Robot in Underground Mines on Edge Hardware

Este artigo apresenta um sistema de navegação autônoma totalmente independente, executado em hardware de borda de baixo consumo sem GPU ou conectividade de rede, que permite a um robô quadrúpede Boston Dynamics Spot navegar com sucesso 100% das vezes em minas subterrâneas escuras e sem GPS, utilizando apenas percepção geométrica e planejamento de caminho sem necessidade de treinamento específico do ambiente.

Yixiang Gao, Kwame Awuah-Offei2026-03-06💻 cs