cs.RO artigos | Gist.Science

Systematic Evaluation of Novel View Synthesis for Video Place Recognition

Este artigo apresenta uma avaliação sistemática da geração de vistas sintéticas para reconhecimento de lugares em vídeo (VPR), demonstrando que, embora pequenas adições de novas vistas melhorem as estatísticas de reconhecimento, para adições maiores o tipo de imagem e a quantidade de vistas são mais determinantes do que a magnitude da mudança de perspectiva.

Muhammad Zawad Mahmud, Samiha Islam, Damian Lyons2026-03-09💻 cs

Improved hopping control on slopes for small robots using spring mass modeling

Este trabalho apresenta um método simples e eficaz para melhorar o controle de robôs saltadores em terrenos inclinados, utilizando um modelo massa-mola para ajustar o ângulo de aterrissagem e aplicar um torque corretivo, garantindo estabilidade sem a necessidade de sensores ou computação complexos.

Heston Roberts, Pronoy Sarker, Sm Ashikul Islam, Min Gyu Kim2026-03-09💻 cs

Iterative Convex Optimization with Control Barrier Functions for Obstacle Avoidance among Polytopes

Este artigo propõe um novo quadro iterativo de controle preditivo baseado em modelos (MPC) com funções de barreira de controle convexas que, ao utilizar hiperplanos de suporte derivados de cálculos exatos de distância entre polítopos, permite o planejamento de trajetórias e o controle de segurança em tempo real para robôs poliedrais em ambientes com obstáculos poliedrais, superando as limitações de precisão geométrica e desempenho computacional de métodos existentes.

Shuo Liu, Zhe Huang, Calin A. Belta2026-03-09💻 cs

FTSplat: Feed-forward Triangle Splatting Network

O artigo apresenta o FTSplat, um modelo de aprendizado profundo feed-forward que gera superfícies triangulares contínuas e prontas para simulação a partir de imagens multiview em uma única passagem, eliminando a necessidade de otimização por cena e superando as limitações de métodos anteriores como NeRF e 3DGS.

Xiong Jinlin, Li Can, Shen Jiawei, Qi Zhigang, Sun Lei, Zhao Dongyang2026-03-09💻 cs

Swooper: Learning High-Speed Aerial Grasping With a Simple Gripper

O artigo apresenta o Swooper, uma abordagem baseada em aprendizado por reforço profundo que utiliza uma estratégia de duas etapas para treinar uma única rede neural leve capaz de controlar com precisão o voo e a preensão de um drone quadrotor em alta velocidade, alcançando uma taxa de sucesso de 84% em testes reais sem necessidade de ajuste fino.

Ziken Huang, Xinze Niu, Bowen Chai, Renbiao Jin, Danping Zou2026-03-09💻 cs

How to Model Your Crazyflie Brushless

Este trabalho apresenta um modelo dinâmico preciso do novo Crazyflie Brushless, validado por simulações e hardware, que permite o treinamento de controladores de aprendizado por reforço para manobras acrobáticas complexas com transferência bem-sucedida de simulação para o mundo real, além de oferecer todo o projeto de código aberto para a comunidade.

Alexander Gräfe, Christoph Scherer, Wolfgang Hönig, Sebastian Trimpe2026-03-09💻 cs

PROBE: Probabilistic Occupancy BEV Encoding with Analytical Translation Robustness for 3D Place Recognition

O artigo apresenta o PROBE, um descritor de reconhecimento de lugar para LiDAR sem aprendizado que utiliza codificação de ocupação probabilística em visão de pássaro (BEV) e marginalização analítica de incertezas de translação para alcançar alta precisão e generalização entre diferentes sensores sem necessidade de ajuste por conjunto de dados.

Jinseop Lee, Byoungho Lee, Gichul Yoo2026-03-09💻 cs

Proprioceptive Shape Estimation of Tensegrity Manipulators Using Energy Minimisation

Este artigo demonstra que é possível estimar a forma de manipuladores de tensoestrutura em grande escala com alta precisão utilizando apenas dados proprioceptivos de inclinação dos struts, obtidos por IMUs, e um método de minimização de energia, eliminando a necessidade de sensores exteroceptivos externos.

Tufail Ahmad Bhat, Shuhei Ikemoto2026-03-09💻 cs

HarvestFlex: Strawberry Harvesting via Vision-Language-Action Policy Adaptation in the Wild

Este trabalho apresenta o primeiro estudo de transferência de políticas Visão-Linguagem-Ação para a colheita real de morangos em estufas, demonstrando que um sistema de malha fechada com três câmeras RGB e apenas 3,71 horas de dados teleoperados alcançou uma taxa de sucesso de 74,0% com o modelo pi_0.5 totalmente ajustado.

Ziyang Zhao, Shuheng Wang, Zhonghua Miao, Ya Xiong2026-03-09💻 cs

MagRobot:An Open Simulator for Magnetically Navigated Robots

O artigo apresenta o MagRobot, o primeiro simulador de código aberto universal que facilita o projeto, a visualização e a validação de robôs navegados magneticamente para aplicações médicas minimamente invasivas, oferecendo um ambiente flexível para benchmarking e otimização de hardware e algoritmos.

Heng Wang (South China University of Technology), Haoyu Song (South China University of Technology), Jiatao Zheng (South China University of Technology), Yuxiang Han (South China University of Technology), Kunli Wang (South China University of Technology)2026-03-09💻 cs

Moving Through Clutter: Scaling Data Collection and Benchmarking for 3D Scene-Aware Humanoid Locomotion via Virtual Reality

Este artigo apresenta o "Moving Through Clutter" (MTC), um framework de código aberto baseado em Realidade Virtual para coleta de dados e avaliação de locomoção de humanoides em ambientes 3D desordenados, fornecendo um novo conjunto de dados e benchmarks para desenvolver sistemas que adaptem o movimento ao cenário e garantam segurança contra colisões.

Beichen Wang, Yuanjie Lu, Linji Wang, Liuchuan Yu, Xuesu Xiao2026-03-09💻 cs

TADPO: Reinforcement Learning Goes Off-road

O artigo apresenta o TADPO, uma nova formulação de gradiente de política que combina trajetórias off-policy e on-policy para permitir a navegação em alta velocidade em terrenos off-road complexos, marcando a primeira implementação bem-sucedida de políticas baseadas em aprendizado por reforço em um veículo off-road em escala real com transferência zero-shot de simulação para a realidade.

Zhouchonghao Wu, Raymond Song, Vedant Mundheda, Luis E. Navarro-Serment, Christof Schoenborn, Jeff Schneider2026-03-09🤖 cs.AI

Restoring Linguistic Grounding in VLA Models via Train-Free Attention Recalibration

Este artigo identifica e mitiga a "cegueira linguística" em modelos Visão-Linguagem-Ação (VLA), onde políticas robóticas ignoram instruções contraditórias em favor de pistas visuais, propondo o método IGAR, uma técnica de recalibração de atenção sem treinamento que restaura a fidelidade às instruções sem modificar a arquitetura do modelo.

Ninghao Zhang, Bin Zhu, Shijie Zhou, Jingjing Chen2026-03-09🤖 cs.AI

Devil is in Narrow Policy: Unleashing Exploration in Driving VLA Models

O artigo apresenta o Curious-VLA, um framework que supera a limitação de políticas restritivas em modelos VLA de direção autônoma através de uma estratégia de expansão de trajetórias viáveis e amostragem adaptativa, alcançando resultados state-of-the-art no benchmark Navsim ao desbloquear o potencial exploratório desses modelos.

Canyu Chen, Yuguang Yang, Zhewen Tan, Yizhi Wang, Ruiyi Zhan, Haiyan Liu, Xuanyao Mao, Jason Bao, Xinyue Tang, Linlin Yang, Bingchuan Sun, Yan Wang, Baochang Zhang2026-03-09💻 cs

RODEO: RObotic DEcentralized Organization

O artigo apresenta o RODEO, um framework baseado em blockchain que integra mecanismos de confiança e auditoria para organizar robôs de serviço em DAOs, permitindo a execução verificável de tarefas, remuneração em tokens e reinvestimento autônomo de recursos para prolongar sua operação.

Milan Groshev, Eduardo Castelló Ferrer2026-03-09💻 cs

Transforming Omnidirectional RGB-LiDAR data into 3D Gaussian Splatting

Este artigo apresenta um pipeline inovador que transforma logs arquivados de sensores omnidirecionais RGB-LiDAR em inicializações robustas para 3D Gaussian Splatting, superando desafios de distorção e sobrecarga computacional para criar gêmeos digitais de alta qualidade a partir de dados existentes.

Semin Bae, Hansol Lim, Jongseong Brad Choi2026-03-09💻 cs

Lifelong Embodied Navigation Learning

O artigo apresenta o Uni-Walker, um framework de aprendizado contínuo para agentes de navegação corporificada que supera o esquecimento catastrófico ao decoplar o conhecimento em componentes compartilhados e específicos por meio de DE-LoRA, estratégias de herança de conhecimento e mecanismos de raciocínio específicos para tarefas.

Xudong Wang, Jiahua Dong, Baichen Liu, Qi Lyu, Lianqing Liu, Zhi Han2026-03-09🤖 cs.AI

Multimodal Behavior Tree Generation: A Small Vision-Language Model for Robot Task Planning

Este trabalho apresenta um método para gerar árvores de comportamento para planejamento de tarefas robóticas utilizando modelos de visão e linguagem (VLMs) compactos e de código aberto, que são fine-tuned em um novo dataset construído a partir de episódios robóticos existentes e alcançam uma taxa de sucesso de 87% em tarefas domésticas, rivalizando com modelos fechados de grande porte com recursos computacionais significativamente menores.

Cristiano Battistini, Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-09💻 cs

Sticky-Glance: Robust Intent Recognition for Human Robot Collaboration via Single-Glance

O artigo apresenta o "Sticky-Glance", um framework robusto de reconhecimento de intenção baseado em olhar que utiliza um algoritmo de "olhar adesivo" para estabilizar a seleção de objetos em ambientes dinâmicos com apenas três amostras, permitindo um controle compartilhado contínuo que reduz o tempo de tarefa em quase 10%.

Yuzhi Lai, Shenghai Yuan, Peizheng Li, Andreas Zell2026-03-09💻 cs

A Hazard-Informed Data Pipeline for Robotics Physical Safety

Este relatório apresenta uma estrutura de segurança física para robótica que integra engenharia de riscos clássica, simulação de gêmeos digitais e geração de dados sintéticos para alinhar a declaração de ativos e a enumeração de vulnerabilidades ao treinamento de modelos de aprendizado de máquina.

Alexei Odinokov, Rostislav Yavorskiy2026-03-09🤖 cs.AI

← Anterior Próximo →