Large-Language-Model-Guided State Estimation for Partially Observable Task and Motion Planning

O artigo apresenta o CoCo-TAMP, um framework hierárquico que utiliza o raciocínio de senso comum de Grandes Modelos de Linguagem (LLMs) para estimar estados em ambientes parcialmente observáveis, permitindo que robôs identifiquem objetos relevantes e reduzam significativamente o tempo de planejamento e execução em tarefas de longo prazo.

Yoonwoo Kim, Raghav Arora, Roberto Martín-Martín + 3 more2026-03-05🤖 cs.AI

RAGNav: A Retrieval-Augmented Topological Reasoning Framework for Multi-Goal Visual-Language Navigation

O artigo apresenta o RAGNav, um framework de navegação visual-linguística multi-objetivo que supera as limitações de raciocínio espacial e planejamento de métodos genéricos ao integrar mapas topológicos e florestas semânticas em uma memória de dupla base, alcançando desempenho state-of-the-art através de recuperação guiada por âncoras e propagação de scores de vizinhança.

Ling Luo, Qiangian Bai2026-03-05🤖 cs.AI

Interaction-Aware Whole-Body Control for Compliant Object Transport

Este artigo apresenta um controle corporal completo orientado à interação (IO-WBC), inspirado no cerebelo, que combina um gerador de referência otimizado com uma política de aprendizado por reforço para permitir que humanoides assistivos realizem o transporte cooperativo de objetos de forma estável e complacente em ambientes desestruturados, mantendo o equilíbrio mesmo sob forças de interação fortes e variáveis.

Hao Zhang, Yves Tseng, Ding Zhao + 1 more2026-03-05🤖 cs.AI

Pretrained Vision-Language-Action Models are Surprisingly Resistant to Forgetting in Continual Learning

Este trabalho demonstra que modelos pré-treinados de Visão-Linguagem-Ação (VLA) são surpreendentemente resistentes ao esquecimento no aprendizado contínuo, permitindo que técnicas simples de replay de experiências adquiram novas habilidades sem esquecer as anteriores, graças ao papel fundamental do pré-treinamento em grande escala.

Huihan Liu, Changyeon Kim, Bo Liu + 2 more2026-03-05🤖 cs.AI

Right in Time: Reactive Reasoning in Regulated Traffic Spaces

Este trabalho propõe um quadro de design de missões reativo que combina o Design de Missão Probabilístico (ProMis) com Circuitos Reativos para permitir inferência probabilística exata em tempo real em domínios híbridos, permitindo que sistemas de transporte inteligentes, como drones, garantam segurança e conformidade legal durante a operação com uma aceleração de várias ordens de grandeza em comparação com métodos anteriores.

Simon Kohaut, Benedict Flade, Julian Eggert + 2 more2026-03-05🤖 cs.AI

Sim2Sea: Sim-to-Real Policy Transfer for Maritime Vessel Navigation in Congested Waters

O artigo apresenta o Sim2Sea, um framework abrangente que utiliza simulação paralela acelerada por GPU, uma política de navegação dual-stream com mascaramento de ações guiada por obstáculos e randomização de domínio para permitir a transferência zero-shot segura e eficiente de políticas de navegação autônoma de ambientes simulados para um veleiro não tripulado de 17 toneladas operando em águas reais congestionadas.

Xinyu Cui, Xuanfa Jin, Xue Yan + 7 more2026-03-05🤖 cs.AI

SaFeR: Safety-Critical Scenario Generation for Autonomous Driving Test via Feasibility-Constrained Token Resampling

O artigo apresenta o SaFeR, um método inovador que gera cenários críticos para segurança no teste de direção autônoma, equilibrando adversariedade, realismo e viabilidade física através de um mecanismo de atenção diferencial e uma estratégia de reamostragem de tokens restrita a uma região de viabilidade máxima aprendida por reforço.

Jinlong Cui, Fenghua Liang, Guo Yang + 2 more2026-03-05🤖 cs.AI

Learning Hip Exoskeleton Control Policy via Predictive Neuromusculoskeletal Simulation

Este artigo apresenta um quadro de aprendizagem baseado em simulação neuromusculoesquelética que treina uma política de controlo para exósteles do quadril inteiramente em ambiente virtual, sem necessidade de dados de captura de movimento, e demonstra a sua transferência bem-sucedida para hardware real, reduzindo a ativação muscular e o trabalho articular enquanto elimina a necessidade de ajustes experimentais extensivos.

Ilseung Park, Changseob Song, Inseung Kang2026-03-05🤖 cs.LG

PRAM-R: A Perception-Reasoning-Action-Memory Framework with LLM-Guided Modality Routing for Adaptive Autonomous Driving

Este artigo apresenta o PRAM-R, um framework unificado de percepção, raciocínio, ação e memória que utiliza roteamento de modalidades guiado por LLM e um design de duplo loop assíncrono para otimizar a eficiência computacional e a adaptação na condução autônoma, reduzindo significativamente o uso de sensores e oscilações de roteamento sem comprometer a precisão em cenários urbanos complexos.

Yi Zhang, Xian Zhang, Saisi Zhao + 4 more2026-03-05🤖 cs.AI

VANGUARD: Vehicle-Anchored Ground Sample Distance Estimation for UAVs in GPS-Denied Environments

O artigo apresenta o VANGUARD, uma ferramenta de percepção geométrica leve e determinística que permite a agentes autônomos baseados em LLMs recuperar a escala métrica em ambientes sem GPS ao estimar a Distância de Amostragem do Solo (GSD) a partir de veículos detectados, superando as alucinações espaciais de modelos de visão-linguagem e reduzindo significativamente erros e falhas catastróficas na medição de áreas.

Yifei Chen, Xupeng Chen, Feng Wang + 2 more2026-03-05🤖 cs.AI