cs.RO artigos | Gist.Science

Real-time tightly coupled GNSS and IMU integration via Factor Graph Optimization

Este trabalho apresenta um método de otimização de grafos de fatores (FGO) para integração GNSS-IMU em tempo real e acoplamento rigoroso, que utiliza marginalização com atraso fixo para permitir estimativa causal de estados e demonstrar alta robustez em ambientes urbanos degradados.

Radu-Andrei Cioaca, Paul Irofti, Cristian Rusu + 3 more2026-03-05🤖 cs.LG

MEM: Multi-Scale Embodied Memory for Vision Language Action Models

Este trabalho apresenta o MEM (Multi-Scale Embodied Memory), uma arquitetura de memória mista que combina representações de vídeo de curto prazo e texto de longo prazo para capacitar modelos de ação visual e linguística a executar tarefas robóticas complexas de longa duração e adaptar suas estratégias de manipulação de forma inteligente.

Marcel Torne, Karl Pertsch, Homer Walke + 14 more2026-03-05🤖 cs.LG

UrbanHuRo: A Two-Layer Human-Robot Collaboration Framework for the Joint Optimization of Heterogeneous Urban Services

O artigo propõe o UrbanHuRo, um framework de colaboração humano-robô em duas camadas que otimiza conjuntamente serviços urbanos heterogêneos, como entregas e sensoriamento, demonstrando através de dados reais aumentos significativos na cobertura de sensoriamento e na renda dos entregadores.

Tonmoy Dey, Lin Jiang, Zheng Dong + 1 more2026-03-05🤖 cs.AI

Large-Language-Model-Guided State Estimation for Partially Observable Task and Motion Planning

O artigo apresenta o CoCo-TAMP, um framework hierárquico que utiliza o raciocínio de senso comum de Grandes Modelos de Linguagem (LLMs) para estimar estados em ambientes parcialmente observáveis, permitindo que robôs identifiquem objetos relevantes e reduzam significativamente o tempo de planejamento e execução em tarefas de longo prazo.

Yoonwoo Kim, Raghav Arora, Roberto Martín-Martín + 3 more2026-03-05🤖 cs.AI

HALyPO: Heterogeneous-Agent Lyapunov Policy Optimization for Human-Robot Collaboration

O artigo propõe o HALyPO, um método de otimização de política que utiliza certificação de estabilidade de Lyapunov no espaço de parâmetros para corrigir gradientes descentralizados e estabilizar o aprendizado em colaborações humano-robô, superando a lacuna de racionalidade inerente à heterogeneidade entre agentes.

Hao Zhang, Yaru Niu, Yikai Wang + 2 more2026-03-05🤖 cs.AI

RAGNav: A Retrieval-Augmented Topological Reasoning Framework for Multi-Goal Visual-Language Navigation

O artigo apresenta o RAGNav, um framework de navegação visual-linguística multi-objetivo que supera as limitações de raciocínio espacial e planejamento de métodos genéricos ao integrar mapas topológicos e florestas semânticas em uma memória de dupla base, alcançando desempenho state-of-the-art através de recuperação guiada por âncoras e propagação de scores de vizinhança.

Ling Luo, Qiangian Bai2026-03-05🤖 cs.AI

Interaction-Aware Whole-Body Control for Compliant Object Transport

Este artigo apresenta um controle corporal completo orientado à interação (IO-WBC), inspirado no cerebelo, que combina um gerador de referência otimizado com uma política de aprendizado por reforço para permitir que humanoides assistivos realizem o transporte cooperativo de objetos de forma estável e complacente em ambientes desestruturados, mantendo o equilíbrio mesmo sob forças de interação fortes e variáveis.

Hao Zhang, Yves Tseng, Ding Zhao + 1 more2026-03-05🤖 cs.AI

Cognition to Control - Multi-Agent Learning for Human-Humanoid Collaborative Transport

O artigo apresenta o C2C, uma arquitetura hierárquica de três camadas que integra percepção baseada em visão-linguagem, deliberação estratégica via aprendizado por reforço multiagente e controle corporal completo para permitir uma colaboração robusta e adaptativa entre humanos e humanoides em tarefas de transporte conjunto.

Hao Zhang, Ding Zhao, H. Eric Tseng2026-03-05🤖 cs.AI

Pretrained Vision-Language-Action Models are Surprisingly Resistant to Forgetting in Continual Learning

Este trabalho demonstra que modelos pré-treinados de Visão-Linguagem-Ação (VLA) são surpreendentemente resistentes ao esquecimento no aprendizado contínuo, permitindo que técnicas simples de replay de experiências adquiram novas habilidades sem esquecer as anteriores, graças ao papel fundamental do pré-treinamento em grande escala.

Huihan Liu, Changyeon Kim, Bo Liu + 2 more2026-03-05🤖 cs.AI

IROSA: Interactive Robot Skill Adaptation using Natural Language

O artigo apresenta o IROSA, um novo framework que utiliza modelos de linguagem pré-treinados para adaptar habilidades de robôs industriais por meio de comandos em linguagem natural, mantendo uma camada de abstração segura que evita o ajuste fino do modelo e a interação direta com o hardware.

Markus Knauer, Samuel Bustamante, Thomas Eiband + 3 more2026-03-05🤖 cs.AI

RVN-Bench: A Benchmark for Reactive Visual Navigation

O artigo apresenta o RVN-Bench, um novo benchmark baseado no simulador Habitat 2.0 e em cenas HM3D de alta fidelidade, projetado para avaliar e treinar agentes de navegação visual reativa e livre de colisões em ambientes internos complexos e não mapeados.

Jaewon Lee, Jaeseok Heo, Gunmin Lee + 3 more2026-03-05🤖 cs.AI

Right in Time: Reactive Reasoning in Regulated Traffic Spaces

Este trabalho propõe um quadro de design de missões reativo que combina o Design de Missão Probabilístico (ProMis) com Circuitos Reativos para permitir inferência probabilística exata em tempo real em domínios híbridos, permitindo que sistemas de transporte inteligentes, como drones, garantam segurança e conformidade legal durante a operação com uma aceleração de várias ordens de grandeza em comparação com métodos anteriores.

Simon Kohaut, Benedict Flade, Julian Eggert + 2 more2026-03-05🤖 cs.AI

Self-adapting Robotic Agents through Online Continual Reinforcement Learning with World Model Feedback

Este trabalho apresenta um quadro de Aprendizado por Reforço Contínuo Online que permite a adaptação automática de agentes robóticos durante a operação, utilizando resíduos de um modelo de mundo para detectar mudanças e desencadear ajustes finos sem supervisão externa, validado em simulações e veículos reais.

Fabian Domberg, Georg Schildbach2026-03-05🤖 cs.AI

Sim2Sea: Sim-to-Real Policy Transfer for Maritime Vessel Navigation in Congested Waters

O artigo apresenta o Sim2Sea, um framework abrangente que utiliza simulação paralela acelerada por GPU, uma política de navegação dual-stream com mascaramento de ações guiada por obstáculos e randomização de domínio para permitir a transferência zero-shot segura e eficiente de políticas de navegação autônoma de ambientes simulados para um veleiro não tripulado de 17 toneladas operando em águas reais congestionadas.

Xinyu Cui, Xuanfa Jin, Xue Yan + 7 more2026-03-05🤖 cs.AI

SaFeR: Safety-Critical Scenario Generation for Autonomous Driving Test via Feasibility-Constrained Token Resampling

O artigo apresenta o SaFeR, um método inovador que gera cenários críticos para segurança no teste de direção autônoma, equilibrando adversariedade, realismo e viabilidade física através de um mecanismo de atenção diferencial e uma estratégia de reamostragem de tokens restrita a uma região de viabilidade máxima aprendida por reforço.

Jinlong Cui, Fenghua Liang, Guo Yang + 2 more2026-03-05🤖 cs.AI

GarmentPile++: Affordance-Driven Cluttered Garments Retrieval with Vision-Language Reasoning

O artigo apresenta o GarmentPile++, um pipeline inovador que combina raciocínio visão-linguagem e percepção de affordance visual para recuperar com segurança e precisão um único item de roupa de uma pilha desordenada, utilizando segmentação de objetos e cooperação de dois braços para lidar com cenários complexos do mundo real.

Mingleyang Li, Yuran Wang, Yue Chen + 6 more2026-03-05🤖 cs.AI

Learning Hip Exoskeleton Control Policy via Predictive Neuromusculoskeletal Simulation

Este artigo apresenta um quadro de aprendizagem baseado em simulação neuromusculoesquelética que treina uma política de controlo para exósteles do quadril inteiramente em ambiente virtual, sem necessidade de dados de captura de movimento, e demonstra a sua transferência bem-sucedida para hardware real, reduzindo a ativação muscular e o trabalho articular enquanto elimina a necessidade de ajustes experimentais extensivos.

Ilseung Park, Changseob Song, Inseung Kang2026-03-05🤖 cs.LG

PRAM-R: A Perception-Reasoning-Action-Memory Framework with LLM-Guided Modality Routing for Adaptive Autonomous Driving

Este artigo apresenta o PRAM-R, um framework unificado de percepção, raciocínio, ação e memória que utiliza roteamento de modalidades guiado por LLM e um design de duplo loop assíncrono para otimizar a eficiência computacional e a adaptação na condução autônoma, reduzindo significativamente o uso de sensores e oscilações de roteamento sem comprometer a precisão em cenários urbanos complexos.

Yi Zhang, Xian Zhang, Saisi Zhao + 4 more2026-03-05🤖 cs.AI

VANGUARD: Vehicle-Anchored Ground Sample Distance Estimation for UAVs in GPS-Denied Environments

O artigo apresenta o VANGUARD, uma ferramenta de percepção geométrica leve e determinística que permite a agentes autônomos baseados em LLMs recuperar a escala métrica em ambientes sem GPS ao estimar a Distância de Amostragem do Solo (GSD) a partir de veículos detectados, superando as alucinações espaciais de modelos de visão-linguagem e reduzindo significativamente erros e falhas catastróficas na medição de áreas.

Yifei Chen, Xupeng Chen, Feng Wang + 2 more2026-03-05🤖 cs.AI

RoboCasa365: A Large-Scale Simulation Framework for Training and Benchmarking Generalist Robots

O artigo apresenta o RoboCasa365, um novo benchmark de simulação em larga escala que oferece 365 tarefas domésticas em 2.500 ambientes de cozinha variados, com extensos dados de demonstração humana e sintética, para avaliar e treinar robôs generalistas e analisar os fatores que impactam sua generalização.

Soroush Nasiriany, Sepehr Nasiriany, Abhiram Maddukuri + 1 more2026-03-05🤖 cs.AI

← Anterior Próximo →