cs.RO artigos | Gist.Science

Task-Relevant and Irrelevant Region-Aware Augmentation for Generalizable Vision-Based Imitation Learning in Agricultural Manipulation

O artigo propõe o DRAIL, um framework de aumento de dados que separa regiões relevantes e irrelevantes da tarefa para melhorar a generalização da aprendizagem por imitação em manipulação agrícola, demonstrando maior robustez e sucesso em tarefas de colheita e seleção de vegetais sob condições visuais não vistas.

Shun Hattori, Hikaru Sasaki, Takumi Hachimine + 2 more2026-03-06💻 cs

Hyperbolic Multiview Pretraining for Robotic Manipulation

O artigo apresenta o HyperMVP, um framework de pré-treinamento auto-supervisionado em espaço hiperbólico que, combinado com o novo dataset 3D-MOV, supera métodos baseados em geometria euclidiana ao aprender representações estruturadas mais robustas para tarefas de manipulação robótica.

Jin Yang, Ping Wei, Yixin Chen2026-03-06💻 cs

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

O artigo apresenta o ReCouPLe, um framework leve que utiliza raciocínios em linguagem natural para fornecer sinais causais e aprender recompensas robustas a partir de feedback de preferência, permitindo a transferência de conhecimento para novas tarefas e melhorando significativamente a precisão e o desempenho sob mudanças de distribuição.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory

O artigo apresenta o VPWEM, uma política visuomotora não markoviana que integra memórias de trabalho e episódicas por meio de um compressor contextual baseado em Transformer, permitindo que robôs aprendam tarefas de manipulação complexas com memória de longo prazo de forma eficiente e superando significativamente os métodos atuais.

Yuheng Lei, Zhixuan Liang, Hongyuan Zhang + 1 more2026-03-06🤖 cs.AI

Beyond the Patch: Exploring Vulnerabilities of Visuomotor Policies via Viewpoint-Consistent 3D Adversarial Object

Este trabalho propõe um método de otimização de textura adversarial 3D consistente com a viewpoint, utilizando renderização diferenciável e estratégias de aprendizado como EOT e um currículo de refinamento, para explorar e explorar vulnerabilidades em políticas visuomotoras de robôs sob condições de viewpoint dinâmico, superando as limitações dos ataques de patches 2D tradicionais.

Chanmi Lee, Minsung Yoon, Woojae Kim + 2 more2026-03-06💻 cs

U-OBCA: Uncertainty-Aware Optimization-Based Collision Avoidance via Wasserstein Distributionally Robust Chance Constraints

O artigo apresenta o U-OBCA, um método de planejamento de trajetória que utiliza restrições de chance distribucionalmente robustas baseadas em Wasserstein para lidar com incertezas em robôs e obstáculos poligonais, eliminando aproximações geométricas conservadoras e melhorando significativamente a eficiência de navegação em ambientes estreitos e clutterados.

Zehao Wang, Yuxuan Tang, Han Zhang + 2 more2026-03-06🔢 math

Integrated cooperative localization of heterogeneous measurement swarm: A unified data-driven method

Este trabalho propõe um método unificado e baseado em dados para localização cooperativa em enxames de robôs heterogêneos, utilizando um estimador adaptativo de localização relativa e uma estratégia distribuída que garantem a convergência mesmo sob topologias de medição direcionadas e esparsas, superando as restrições geométricas de abordagens anteriores.

Kunrui Ze, Wei Wang, Guibin Sun + 3 more2026-03-06💻 cs

Person Detection and Tracking from an Overhead Crane LiDAR

Este artigo apresenta a criação de um conjunto de dados específico para detecção e rastreamento de pessoas por LiDAR em visão aérea de guindastes industriais, avaliando e adaptando detectores 3D e algoritmos de rastreamento para superar o deslocamento de domínio e demonstrar a viabilidade em tempo real dessa aplicação.

Nilusha Jayawickrama, Henrik Toikka, Risto Ojala2026-03-06🤖 cs.LG

Observer Design for Augmented Reality-based Teleoperation of Soft Robots

Este artigo apresenta um sistema de teleoperação para robôs macios baseado em realidade aumentada utilizando o HoloLens 2, que valida a interação do operador com o manipulador pneumático PETER através de um observador que estima a posição do robô com erros de aproximadamente 5% do seu comprimento.

Jorge Francisco García-Samartín, Iago López Pérez, Emirhan Yolcu + 2 more2026-03-06💻 cs

Direct Contact-Tolerant Motion Planning With Vision Language Models

Este artigo apresenta o planejador DCT, que integra modelos de visão e linguagem para gerar nuvens de pontos conscientes de contato e otimizar a navegação direta, permitindo que robôs operem com eficiência e robustez em ambientes desordenados com obstáculos móveis ou deformáveis.

He Li, Jian Sun, Chengyang Li + 4 more2026-03-06💻 cs

CoIn3D: Revisiting Configuration-Invariant Multi-Camera 3D Object Detection

O artigo apresenta o CoIn3D, um framework generalizável para detecção 3D de objetos com múltiplas câmeras que supera as limitações de transferência entre diferentes configurações de sensores ao incorporar explicitamente discrepâncias de priores espaciais (como intrínsecos, extrínsecos e layouts) através de modulação de características espaciais e aumento de dados orientado à câmera.

Zhaonian Kuang, Rui Ding, Haotian Wang + 3 more2026-03-06💻 cs

VinePT-Map: Pole-Trunk Semantic Mapping for Resilient Autonomous Robotics in Vineyards

Este artigo apresenta o VinePT-Map, um framework de mapeamento semântico que utiliza troncos de videiras e postes de suporte como marcos estruturais persistentes para permitir a localização resiliente e agnóstica às estações de robôs autônomos em vinhedos, validado através de um novo conjunto de dados multitemporal e extensos experimentos de campo.

Giorgio Audrito, Mauro Martini, Alessandro Navone + 2 more2026-03-06💻 cs

AIM-SLAM: Dense Monocular SLAM via Adaptive and Informative Multi-View Keyframe Prioritization with Foundation Model

O artigo apresenta o AIM-SLAM, um sistema de SLAM monocular denso que supera limitações anteriores ao utilizar o modelo de fundação VGGT e um módulo SIGMA para priorização adaptativa de múltiplos quadros-chave baseada em sobreposição de voxels e ganho de informação, resultando em otimização conjunta Sim(3) e desempenho superior em estimativa de pose e reconstrução densa.

Jinwoo Jeon, Dong-Uk Seo, Eungchang Mason Lee + 1 more2026-03-06💻 cs

GaussTwin: Unified Simulation and Correction with Gaussian Splatting for Robotic Digital Twins

O artigo apresenta o GaussTwin, um gêmeo digital em tempo real que integra simulação física baseada em dinâmica e hastes de Cosserat com *Gaussian Splatting* para correção visual, permitindo um controle robótico mais preciso e robusto ao fechar a lacuna entre o mundo real e a simulação.

Yichen Cai, Paul Jansonnie, Cristiana de Farias + 2 more2026-03-06💻 cs

SPIRIT: Perceptive Shared Autonomy for Robust Robotic Manipulation under Deep Learning Uncertainty

O artigo apresenta o SPIRIT, um sistema de autonomia compartilhada perceptiva que utiliza estimativas de incerteza de aprendizado profundo para alternar dinamicamente entre manipulação autônoma e teleoperação háptica, garantindo assim manipulação robótica robusta e segura mesmo diante de falhas na percepção baseada em IA.

Jongseok Lee, Ribin Balachandran, Harsimran Singh + 6 more2026-03-06🤖 cs.AI

Decoupling Task and Behavior: A Two-Stage Reward Curriculum in Reinforcement Learning for Robotics

O artigo propõe um currículo de recompensa em duas etapas para aprendizado por reforço em robótica, que desacopla objetivos específicos da tarefa de termos comportamentais auxiliares, permitindo primeiro o aprendizado da tarefa e depois a introdução de otimizações como eficiência energética, resultando em um método simples e eficaz que supera as abordagens tradicionais em diversos ambientes.

Kilian Freitag, Knut Åkesson, Morteza Haghir Chehreghani2026-03-06🤖 cs.LG

SeedPolicy: Horizon Scaling via Self-Evolving Diffusion Policy for Robot Manipulation

O artigo apresenta o SeedPolicy, uma nova política de difusão que integra o módulo de Atenção Porteira Autoevolutiva (SEGA) para superar as limitações de modelagem temporal em tarefas de manipulação robótica de longo alcance, alcançando desempenho superior e maior eficiência computacional em comparação com métodos existentes.

Youqiang Gui, Yuxuan Zhou, Shen Cheng + 4 more2026-03-06💻 cs

Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models

Este artigo propõe um quadro adaptativo para Modelos Visão-Linguagem-Ação que, inspirado na cognição humana, classifica dinamicamente a complexidade da tarefa utilizando apenas embeddings visuais para decidir entre executar, raciocinar ou abster-se, otimizando assim o uso de recursos e prevenindo falhas em cenários fora de distribuição.

Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-06💻 cs

Lifelong Language-Conditioned Robotic Manipulation Learning

O artigo apresenta o SkillsCrafter, um novo framework de manipulação robótica que permite a aprendizagem contínua de múltiplas habilidades linguísticas sem esquecer as anteriores, utilizando adaptação de habilidades e agregação de especialização para preservar e generalizar o conhecimento.

Xudong Wang, Zebin Han, Zhiyu Liu + 5 more2026-03-06🤖 cs.AI

Critic in the Loop: A Tri-System VLA Framework for Robust Long-Horizon Manipulation

O artigo apresenta o "Critic in the Loop", um framework hierárquico adaptativo que integra um modelo VLM para raciocínio global, um modelo VLA para execução reativa e um crítico visual leve para rotear dinamicamente o controle, permitindo manipulação robótica robusta e eficiente em tarefas de longo horizonte ao minimizar consultas custosas e lidar com falhas.

Pengfei Yi, Yingjie Ma, Wenjiang Xu + 4 more2026-03-06💻 cs

← Anterior Próximo →