SORS: A Modular, High-Fidelity Simulator for Soft Robots

O artigo apresenta o SORS, um simulador modular e de alta fidelidade baseado no método dos elementos finitos e otimização não linear, projetado para superar os desafios de modelagem de deformações não lineares e interações de contato em robôs macios, validando sua eficácia na ponte entre simulação e realidade através de diversos experimentos e otimização de controle.

Manuel Mekkattu, Mike Y. Michelis, Robert K. Katzschmann2026-03-09💻 cs

VISO: Robust Underwater Visual-Inertial-Sonar SLAM with Photometric Rendering for Dense 3D Reconstruction

O artigo apresenta o VISO, um sistema robusto de SLAM subaquático que funde câmeras estéreo, IMU e sonar 3D com calibração online e renderização fotométrica para alcançar localização precisa e reconstrução 3D densa em tempo real, superando os métodos atuais em ambientes subaquáticos.

Shu Pan, Simon Archieri, Ahmet Cinar, Jonatan Scharff Willners, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

InsSo3D: Inertial Navigation System and 3D Sonar SLAM for turbid environment inspection

O artigo apresenta o InsSo3D, um sistema robusto de SLAM 3D que combina sonar tridimensional e navegação inercial para realizar mapeamento e localização precisos em ambientes subaquáticos turvos, corrigindo eficazmente a deriva de odometria e permitindo a inspeção segura de estruturas submersas.

Simon Archieri, Ahmet Cinar, Shu Pan, Jonatan Scharff Willners, Michele Grimaldi, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

(MGS)2^2-Net: Unifying Micro-Geometric Scale and Macro-Geometric Structure for Cross-View Geo-Localization

O artigo apresenta a (MGS)2^2-Net, um framework inovador para geolocalização cruzada que supera as limitações de métodos existentes ao unificar a adaptação de escala micro-geométrica e o filtragem de estrutura macro-geométrica para alinhar com precisão imagens aéreas oblíquas e de satélite, alcançando desempenho state-of-the-art em benchmarks públicos.

Minglei Li, Mengfan He, Chunyu Li, Chao Chen, Xingyu Shao, Ziyang Meng2026-03-09💻 cs

APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots

O artigo apresenta o APEX, um sistema baseado em aprendizado por reforço profundo que permite a humanoides, como o Unitree G1, realizar de forma autônoma e segura a travessia zero-shot de plataformas elevadas (cerca de 114% do comprimento da perna) através da composição de comportamentos de escalada, reconfiguração postural e navegação, superando as limitações de segurança e impacto das soluções de salto tradicionais.

Yikai Wang, Tingxuan Leng, Changyi Lin, Shiqi Liu, Shir Simon, Bingqing Chen, Jonathan Francis, Ding Zhao2026-03-09💻 cs

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

O artigo apresenta o MiDAS, um sistema de código aberto e agnóstico à plataforma que permite a aquisição não invasiva e sincronizada de dados multimodais para cirurgia robótica minimamente invasiva, validado em robôs Raven-II e da Vinci Xi e acompanhado de um novo conjunto de dados anotados que inclui tarefas de sutura de reparo de hérnia.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

Beyond Imitation: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

Este artigo propõe o framework RL-Co, um método de co-treinamento sim-real baseado em aprendizado por reforço que supera as limitações do ajuste fino supervisionado ao combinar pré-treinamento com demonstrações mistas e refinamento interativo em simulação, resultando em melhorias significativas nas taxas de sucesso, generalização e eficiência de dados para modelos de Visão-Linguagem-Ação em tarefas de manipulação robótica real.

Liangzhi Shi, Shuaihang Chen, Feng Gao, Yinuo Chen, Kang Chen, Tonghe Zhang, Hongzhi Zang, Weinan Zhang, Chao Yu, Yu Wang2026-03-09💻 cs

ProFocus: Proactive Perception and Focused Reasoning in Vision-and-Language Navigation

O artigo apresenta o ProFocus, um framework de treinamento livre que aprimora a navegação visão-linguagem unindo percepção proativa, que gera consultas visuais direcionadas, e raciocínio focado, que utiliza uma busca em árvore para priorizar contextos históricos relevantes, alcançando desempenho de ponta em benchmarks sem necessidade de ajuste.

Wei Xue, Mingcheng Li, Xuecheng Wu, Jingqun Tang, Dingkang Yang, Lihua Zhang2026-03-09💻 cs

Digital-Twin Losses for Lane-Compliant Trajectory Prediction at Urban Intersections

Este artigo apresenta um pipeline de previsão de trajetória para interseções urbanas baseado em gêmeos digitais e V2X, que utiliza uma função de perda inovadora combinando erro quadrático médio e uma "twin loss" para garantir precisão, diversidade e conformidade com regras de trânsito, reduzindo significativamente violações críticas sem comprometer o desempenho em tempo real.

Kuo-Yi Chao, Erik Leo Haß, Melina Gegg, Jiajie Zhang, Ralph Raßhofer, Alois Christian Knoll2026-03-09💻 cs

TEGA: A Tactile-Enhanced Grasping Assistant for Assistive Robotics via Sensor Fusion and Closed-Loop Haptic Feedback

O artigo apresenta o TEGA, um sistema de teleoperação assistiva que combina inferência de intenção baseada em EMG, sensoriamento visotátil e feedback háptico vibratório em tempo real para permitir que usuários com deficiência no membro superior ajustem intuitivamente a força de preensão e melhorem a estabilidade da manipulação robótica.

Hengxu You, Tianyu Zhou, Fang Xu, Kaleb Smith, Eric Jing Du2026-03-09💻 cs

Task Parameter Extrapolation via Learning Inverse Tasks from Forward Demonstrations

Este artigo propõe uma abordagem de aprendizado conjunto que utiliza demonstrações de tarefas diretas em novas configurações para aprender tarefas inversas e extrapolar políticas de habilidades robóticas a condições não vistas, superando as limitações de generalização zero-shot e a dependência de grandes volumes de dados de métodos existentes.

Serdar Bahar, Fatih Dogangun, Matteo Saveriano, Yukie Nagai, Emre Ugur2026-03-09💻 cs

RACAS: Controlling Diverse Robots With a Single Agentic System

O artigo apresenta o RACAS, uma arquitetura agênica baseada em modelos de linguagem que permite o controle em malha fechada de robôs radicalmente diferentes (terrestres, subaquáticos e de membros articulados) utilizando apenas descrições em linguagem natural, eliminando a necessidade de reprogramação ou re-treinamento para cada nova plataforma.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

RFM-HRI : A Multimodal Dataset of Medical Robot Failure, User Reaction and Recovery Preferences for Item Retrieval Tasks

Este artigo apresenta o conjunto de dados multimodal RFM-HRI, que registra as reações verbais e não verbais de usuários e suas preferências de recuperação diante de falhas em robôs médicos durante tarefas de recuperação de itens, fornecendo uma base fundamental para o desenvolvimento de métodos de detecção e recuperação de falhas em interações humano-robô.

Yashika Batra, Giuliano Pioldi, Promise Ekpo, Arman Sayatqyzy, Purnjay Maruur, Shalom Otieno, Kevin Ching, Angelique Taylor2026-03-09💻 cs