cs.RO artigos | Gist.Science

ICLR: In-Context Imitation Learning with Visual Reasoning

O artigo apresenta o ICLR, um novo framework de aprendizado por imitação em contexto que aprimora a adaptação robótica a tarefas complexas ao integrar traços de raciocínio visual estruturado e previsão de ações em um único modelo transformador autoregressivo, demonstrando melhorias significativas na taxa de sucesso e generalização em comparação com métodos existentes.

Toan Nguyen, Weiduo Yuan, Songlin Wei, Hui Li, Daniel Seita, Yue Wang2026-03-10💻 cs

ACCURATE: Arbitrary-shaped Continuum Reconstruction Under Robust Adaptive Two-view Estimation

O artigo apresenta o ACCURATE, um framework de reconstrução 3D robusto que combina redes neurais de segmentação com um algoritmo de otimização geométrica para reconstruir com alta precisão corpos contínuos longos e finos, como cateteres, a partir de imagens biplanares, superando as limitações de métodos existentes em relação a oclusões e formas complexas.

Yaozhi Zhang, Shun Yu, Yugang Zhang, Yang Liu2026-03-10💻 cs

ReconDrive: Fast Feed-Forward 4D Gaussian Splatting for Autonomous Driving Scene Reconstruction

O artigo apresenta o ReconDrive, um framework feed-forward inovador que adapta o modelo de fundação VGGT para gerar rapidamente representações 4D Gaussianas de alta fidelidade de cenas de direção autônoma, superando as limitações de qualidade dos métodos existentes e a lentidão das otimizações por cena, oferecendo assim uma solução escalável para simulação realista.

Haibao Yu, Kuntao Xiao, Jiahang Wang, Ruiyang Hao, Yuxin Huang, Guoran Hu, Haifang Qin, Bowen Jing, Yuntian Bo, Ping Luo2026-03-10💻 cs

Approximate Imitation Learning for Event-based Quadrotor Flight in Cluttered Environments

Este artigo apresenta uma abordagem inovadora de Aprendizado por Imitação Aproximada que permite a um quadricóptero voar em alta velocidade (até 9,8 m/s) em ambientes cluttered utilizando apenas uma câmera de eventos, superando as limitações de simulação ao treinar uma rede neural end-to-end com dados de estado simulados leves em vez de renderizar eventos sintéticos caros.

Nico Messikommer, Jiaxu Xing, Leonard Bauersfeld, Marco Cannici, Elie Aljalbout, Davide Scaramuzza2026-03-10💻 cs

FeasibleCap: Real-Time Embodiment Constraint Guidance for In-the-Wild Robot Demonstration Collection

O FeasibleCap é um sistema de coleta de dados em tempo real que fornece orientação visual e háptica sobre restrições de execução diretamente no dispositivo durante a captura de demonstrações, garantindo que os movimentos sejam viáveis para o robô-alvo sem a necessidade de hardware robótico, óculos de realidade aumentada ou modelos de dinâmica aprendidos.

Zi Yin, Fanhong Li, Yun Gui, Jia Liu2026-03-10💻 cs

Model-Based and Neural-Aided Approaches for Dog Dead Reckoning

Este artigo propõe e valida três algoritmos de dead reckoning para cães (biológicos e robóticos) que utilizam apenas sensores inerciais, demonstrando que métodos assistidos por redes neurais superam as abordagens baseadas em modelos, alcançando um erro de distância absoluto inferior a 10% e oferecendo uma solução de posicionamento leve e de baixo custo.

Gal Versano. Itai Savin, Itzik Klein2026-03-10💻 cs

SMAT: Staged Multi-Agent Training for Co-Adaptive Exoskeleton Control

O artigo apresenta o SMAT, um método de treinamento multiagente em quatro estágios que permite o desenvolvimento de um controlador de exoesqueleto de quadril capaz de reduzir a ativação muscular e fornecer assistência mecânica positiva consistente em diversos usuários sem necessidade de re-treinamento específico.

Yifei Yuan, Ghaith Androwis, Xianlian Zhou2026-03-10🤖 cs.LG

GeoLoco: Leveraging 3D Geometric Priors from Visual Foundation Model for Robust RGB-Only Humanoid Locomotion

O artigo apresenta o GeoLoco, um framework de locomoção para humanoides que utiliza exclusivamente imagens RGB e aproveita os priores geométricos de um Modelo Visual Fundamental (VFM) congelado para superar as limitações de simulação-para-realidade, permitindo transferência zero-shot robusta para o robô Unitree G1 em terrenos desafiadores.

Yufei Liu, Xieyuanli Chen, Hainan Pan, Chenghao Shi, Yanjie Chen, Kaihong Huang, Zhiwen Zeng, Huimin Lu2026-03-10💻 cs

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

Este artigo apresenta um quadro de aprendizado por reforço para controlar exoesqueletos que reduzem os momentos articulares biológicos e valida esses controladores treinados em simulação através de um conjunto de dados de marcha aberto, demonstrando forte consistência entre simulação e dados reais, especialmente no nível de torque no quadril, embora desafios permaneçam para a transferência sim-real em velocidades mais altas e inclinações mais íngremes.

Zihang You, Xianlian Zhou2026-03-10🤖 cs.LG

PanoDP: Learning Collision-Free Navigation with Panoramic Depth and Differentiable Physics

O artigo apresenta o PanoDP, um framework de aprendizado sem comunicação que combina percepção de profundidade panorâmica de quatro visões com sinais de treinamento baseados em física diferenciável para melhorar a navegação autônoma livre de colisões em ambientes desordenados e dinâmicos.

Hao Zhong, Pei Chi, Jiang Zhao, Shenghai Yuan, Xuyang Gao, Thien-Minh Nguyen, Lihua Xie2026-03-10💻 cs

TempoFit: Plug-and-Play Layer-Wise Temporal KV Memory for Long-Horizon Vision-Language-Action Manipulation

O artigo apresenta o TempoFit, uma solução de retrofit temporal sem treinamento que melhora a capacidade de manipulação de longo prazo de políticas VLA pré-treinadas ao reutilizar e recuperar memórias de chaves/valores de camadas anteriores, alcançando ganhos significativos de desempenho em tarefas complexas sem aumentar a latência ou exigir novos módulos treináveis.

Jun Sun, Boyu Yang, Jiahao Zhang, Ning Ma, Chencheng Wu, Siqing Zhang, Yiou Huang, Qiufeng Wang, Shan Liang, Yaran Chen2026-03-10💻 cs

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

O artigo apresenta o AtomicVLA, um framework unificado de planejamento e execução que utiliza uma biblioteca de habilidades atômicas escalável e um mecanismo de especialistas mistos orientados por habilidades para superar as limitações dos modelos VLA existentes em tarefas robóticas de longo horizonte e aprendizado contínuo.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan Liang2026-03-10💻 cs

Multi-Agent Off-World Exploration for Sparse Evidence Discovery via Gaussian Belief Mapping and Dual-Domain Coverage

Este artigo propõe um quadro de planeamento de trajetória para exploração multiagente fora da Terra, baseado em mapeamento de crença Gaussiana e cobertura de dupla domínio, que supera as limitações das abordagens existentes ao equilibrar a descoberta de evidências esparsas com a segurança operacional em terrenos perigosos e comunicações restritas.

Zhuoran Qiao, Tianxin Hu, Thien-Minh Nguyen, Shenghai Yuan2026-03-10💻 cs

DAISS: Phase-Aware Imitation Learning for Dual-Arm Robotic Ultrasound-Guided Interventions

O artigo apresenta o DAISS, um sistema cirúrgico teleoperado de dois braços que utiliza aprendizado por imitação sensível a fases e feedback de ultrassom em tempo real para automatizar com precisão procedimentos de intervenção guiada por imagem, como a inserção de agulhas, reduzindo a carga cognitiva e replicando estratégias de especialistas a partir de demonstrações limitadas.

Feng Li, Pei Liu, Shiting Wang, Ning Wang, Zhongliang Jiang, Nassir Navab, Yuan Bi2026-03-10💻 cs

Low-Cost Teleoperation Extension for Mobile Manipulators

Este artigo apresenta um framework de teleoperação de baixo custo e código aberto para manipuladores móveis bimanuais, que utiliza hardware comum como smartphones e pedais para permitir um controle intuitivo de todo o corpo, eliminando a necessidade de equipamentos especializados caros e demonstrando melhor desempenho e menor carga cognitiva em comparação com controles baseados em teclado.

Danil Belov, Artem Erkhov, Yaroslav Savotin, Tatiana Podladchikova, Pavel Osinenko2026-03-10💻 cs

UniUncer: Unified Dynamic Static Uncertainty for End to End Driving

O artigo apresenta o UniUncer, um framework unificado e leve que melhora a confiabilidade da direção de ponta a ponta ao estimar e integrar incertezas tanto de elementos estáticos quanto dinâmicos, resultando em ganhos significativos de precisão e desempenho em cenários desafiadores.

Yu Gao, Jijun Wang, Zongzheng Zhang, Anqing Jiang, Yiru Wang, Yuwen Heng, Shuo Wang, Hao Sun, Zhangfeng Hu, Hao Zhao2026-03-10💻 cs

RoboPCA: Pose-centered Affordance Learning from Human Demonstrations for Robot Manipulation

O artigo apresenta o RoboPCA, um framework de aprendizado de affordance centrado na pose que prevê conjuntamente regiões de contato e poses adequadas para manipulação robótica, utilizando o pipeline Human2Afford para gerar automaticamente anotações a partir de demonstrações humanas e demonstrando superioridade em relação a métodos existentes em diversos cenários.

Zhanqi Xiao, Ruiping Wang, Xilin Chen2026-03-10💻 cs

C $^2$ -Explorer: Contiguity-Driven Task Allocation with Connectivity-Aware Task Representation for Decentralized Multi-UAV Exploration

O artigo apresenta o C $^2$ -Explorer, um framework descentralizado para exploração multi-UAV que supera limitações de comunicação e alocação não contígua ao utilizar representações de tarefas baseadas em conectividade e uma formulação de alocação orientada à contiguidade, resultando em reduções significativas no tempo de exploração e na distância percorrida.

Xinlu Yan, Mingjie Zhang, Yuhao Fang, Yanke Sun, Jun Ma, Youmin Gong, Boyu Zhou, Jie Mei2026-03-10💻 cs

AeroPlace-Flow: Language-Grounded Object Placement for Aerial Manipulators via Visual Foresight and Object Flow

O artigo apresenta o AeroPlace-Flow, um framework sem treinamento que permite a manipulação aérea de objetos baseada em linguagem, unindo previsão visual e raciocínio geométrico 3D para gerar trajetórias de colocação precisas e livres de colisões a partir de instruções naturais, alcançando uma taxa de sucesso de 75% em experimentos reais.

Sarthak Mishra, Rishabh Dev Yadav, Naveen Nair, Wei Pan, Spandan Roy2026-03-10💻 cs

Directing the Robot: Scaffolding Creative Human-AI-Robot Interaction

Este artigo propõe uma reestruturação da interação humano-IA-robô como "andaime" (scaffolding), onde os humanos atuam como diretores criativos que definem intenções e orientam revisões, enquanto a IA medeia a execução robótica, visando priorizar a agência humana, a criatividade e o fluxo em vez da autonomia ou eficiência pura.

Jordan Aiko Deja, Isidro Butaslac, Nicko Reginio Caluya, Maheshya Weerasinghe2026-03-10💻 cs

← Anterior Próximo →

cs.RO