Provably Safe Trajectory Generation for Manipulators Under Motion and Environmental Uncertainties

Este artigo propõe um novo quadro de planejamento de movimento com limites de risco que integra um modelo de operador Koopman estocástico profundo para prever distribuições de estado, um método de verificação hierárquica usando programação de soma de quadrados para certificação formal de colisão e um controlador MPPI, validando sua eficácia na geração de trajetórias seguras e eficientes para manipuladores robóticos em ambientes incertos e não convexos através de simulações e experimentos reais.

Fei Meng, Zijiang Yang, Xinyu Mao, Haobo Liang, Max Q. -H. MengWed, 11 Ma💻 cs

PM-Nav: Priori-Map Guided Embodied Navigation in Functional Buildings

O artigo apresenta o PM-Nav, um sistema de navegação corporal guiado por mapas prévios que transforma mapas ambientais em representações semânticas e utiliza prompts hierárquicos de cadeia de pensamento para superar as limitações de navegação em edifícios funcionais com características altamente similares, alcançando melhorias significativas em relação aos métodos existentes tanto em simulação quanto no mundo real.

Jiang Gao, Xiangyu Dong, Haozhou Li, Haoran Zhao, Yaoming Zhou, Xiaoguang MaWed, 11 Ma🤖 cs.AI

DexHiL: A Human-in-the-Loop Framework for Vision-Language-Action Model Post-Training in Dexterous Manipulation

O artigo apresenta o DexHiL, um inovador framework de aprendizado com intervenção humana que integra o controle do braço e da mão para o pós-treinamento de modelos Visão-Linguagem-Ação, demonstrando um aumento significativo de 25% nas taxas de sucesso em tarefas de manipulação dextrosa em comparação com métodos de ajuste fino offline.

Yifan Han, Zhongxi Chen, Yuxuan Zhao, Congsheng Xu, Yanming Shao, Yichuan Peng, Yao Mu, Wenzhao LianWed, 11 Ma🤖 cs.AI

SPAN-Nav: Generalized Spatial Awareness for Versatile Vision-Language Navigation

O artigo apresenta o SPAN-Nav, um modelo fundamental de ponta a ponta que aprimora a navegação visão-linguagem ao integrar uma consciência espacial 3D universal, extraída de um vasto conjunto de dados de ocupação e condensada em um único token para raciocínio de ações, alcançando desempenho superior em diversos cenários e validada em experimentos do mundo real.

Jiahang Liu, Tianyu Xu, Jiawei Chen, Lu Yue, Jiazhao Zhang, Zhiyong Wang, Minghan Li, Qisheng Zhao, Anqi Li, Qi Su, Zhizheng Zhang, He WangWed, 11 Ma💻 cs

STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation

Este trabalho apresenta o STONE, um grande conjunto de dados multimodal e escalável para navegação off-road, que fornece mapas de tratabilidade 3D gerados automaticamente sem anotação manual, utilizando sensores sincronizados como LiDAR, câmeras e radares em diversos ambientes e condições.

Konyul Park, Daehun Kim, Jiyong Oh, Seunghoon Yu, Junseo Park, Jaehyun Park, Hongjae Shin, Hyungchan Cho, Jungho Kim, Jun Won ChoiWed, 11 Ma💻 cs

Robust Spatiotemporal Motion Planning for Multi-Agent Autonomous Racing via Topological Gap Identification and Accelerated MPC

Este artigo apresenta um quadro robusto de planejamento de movimento para corridas autônomas multiagente que combina identificação topológica de lacunas via GPs esparsos e um MPC acelerado por um solver PTC, resultando em tempos de manobra reduzidos, alta taxa de sucesso em ultrapassagens e menor latência computacional na plataforma F1TENTH.

Mingyi Zhang, Cheng Hu, Yiqin Wang, Haotong Qin, Hongye Su, Lei XieWed, 11 Ma💻 cs

WESPR: Wind-adaptive Energy-Efficient Safe Perception & Planning for Robust Flight with Quadrotors

O artigo apresenta o WESPR, um framework rápido que integra percepção geométrica e dados meteorológicos locais para prever campos de vento induzidos pelo ambiente, permitindo planejamento de trajetória e adaptação de controle proativos que reduzem significativamente o desvio e aumentam a estabilidade de drones quadricópteros em condições turbulentas.

Khuzema Habib, Pranav Deshakulkarni Manjunath, Kasra Torshizi, Troi Williams, Pratap TokekarWed, 11 Ma💻 cs

Embodied Human Simulation for Quantitative Design and Analysis of Interactive Robotics

Este trabalho apresenta um framework de simulação baseado em aprendizado por reforço e modelos musculoesqueléticos que permite a análise quantitativa e a co-otimização de parâmetros estruturais e de controle em robótica interativa, superando as limitações de experimentos tradicionais ao fornecer acesso direto a métricas biomecânicas internas.

Chenhui Zuo, Jinhao Xu, Michael Qian Vergnolle, Yanan SuiWed, 11 Ma🤖 cs.AI

Implicit Geometry Representations for Vision-and-Language Navigation from Web Videos

Este artigo apresenta um novo quadro de trabalho para navegação visão-linguagem que utiliza vídeos de tours de ambientes reais da web e representações geométricas implícitas para superar as limitações de escalabilidade e diversidade dos simuladores, estabelecendo novos recordes de desempenho e permitindo agentes de navegação zero-shot mais robustos.

Mingfei Han, Haihong Hao, Liang Ma, Kamila Zhumakhanova, Ekaterina Radionova, Jingyi Zhang, Xiaojun Chang, Xiaodan Liang, Ivan LaptevWed, 11 Ma💻 cs

See, Plan, Rewind: Progress-Aware Vision-Language-Action Models for Robust Robotic Manipulation

O artigo apresenta o SPR (See, Plan, Rewind), um modelo de visão-linguagem-ação que melhora a manipulação robótica ao monitorar o progresso do tarefa através de marcos espaciais, permitindo o planejamento de trajetórias e a recuperação automática de falhas, o que resulta em maior robustez e generalização em benchmarks desafiadores.

Tingjun Dai, Mingfei Han, Tingwen Du, Zhiheng Liu, Zhihui Li, Salman Khan, Jun Yu, Xiaojun ChangWed, 11 Ma💻 cs

NLiPsCalib: An Efficient Calibration Framework for High-Fidelity 3D Reconstruction of Curved Visuotactile Sensors

O artigo apresenta o NLiPsCalib, um framework de calibração eficiente e consistente com a física que utiliza estereoscopia fotométrica de luz próxima (NLiPs) e fontes de luz controláveis para permitir a reconstrução 3D de alta fidelidade em sensores visuotáteis curvos, simplificando o processo para poucos contatos com objetos cotidianos e reduzindo a barreira de entrada para o desenvolvimento de sensores personalizados.

Xuhao Qin, Feiyu Zhao, Yatao Leng, Runze Hu, Chenxi XiaoWed, 11 Ma💻 cs

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

O artigo apresenta o SPAARS, um framework de aprendizado por reforço offline-to-online que utiliza uma exploração curricular segura no espaço latente para superar as limitações de desempenho dos métodos baseados em CVAE, transferindo o controle para o espaço de ações bruto e alcançando maior eficiência de amostragem e retornos superiores em tarefas de robótica.

Swaminathan S K, Aritra HazraWed, 11 Ma🤖 cs.AI