ACCURATE: Arbitrary-shaped Continuum Reconstruction Under Robust Adaptive Two-view Estimation

O artigo apresenta o ACCURATE, um framework de reconstrução 3D robusto que combina redes neurais de segmentação com um algoritmo de otimização geométrica para reconstruir com alta precisão corpos contínuos longos e finos, como cateteres, a partir de imagens biplanares, superando as limitações de métodos existentes em relação a oclusões e formas complexas.

Yaozhi Zhang, Shun Yu, Yugang Zhang, Yang LiuTue, 10 Ma💻 cs

ReconDrive: Fast Feed-Forward 4D Gaussian Splatting for Autonomous Driving Scene Reconstruction

O artigo apresenta o ReconDrive, um framework feed-forward inovador que adapta o modelo de fundação VGGT para gerar rapidamente representações 4D Gaussianas de alta fidelidade de cenas de direção autônoma, superando as limitações de qualidade dos métodos existentes e a lentidão das otimizações por cena, oferecendo assim uma solução escalável para simulação realista.

Haibao Yu, Kuntao Xiao, Jiahang Wang, Ruiyang Hao, Yuxin Huang, Guoran Hu, Haifang Qin, Bowen Jing, Yuntian Bo, Ping LuoTue, 10 Ma💻 cs

Approximate Imitation Learning for Event-based Quadrotor Flight in Cluttered Environments

Este artigo apresenta uma abordagem inovadora de Aprendizado por Imitação Aproximada que permite a um quadricóptero voar em alta velocidade (até 9,8 m/s) em ambientes cluttered utilizando apenas uma câmera de eventos, superando as limitações de simulação ao treinar uma rede neural end-to-end com dados de estado simulados leves em vez de renderizar eventos sintéticos caros.

Nico Messikommer, Jiaxu Xing, Leonard Bauersfeld, Marco Cannici, Elie Aljalbout, Davide ScaramuzzaTue, 10 Ma💻 cs

FeasibleCap: Real-Time Embodiment Constraint Guidance for In-the-Wild Robot Demonstration Collection

O FeasibleCap é um sistema de coleta de dados em tempo real que fornece orientação visual e háptica sobre restrições de execução diretamente no dispositivo durante a captura de demonstrações, garantindo que os movimentos sejam viáveis para o robô-alvo sem a necessidade de hardware robótico, óculos de realidade aumentada ou modelos de dinâmica aprendidos.

Zi Yin, Fanhong Li, Yun Gui, Jia LiuTue, 10 Ma💻 cs

GeoLoco: Leveraging 3D Geometric Priors from Visual Foundation Model for Robust RGB-Only Humanoid Locomotion

O artigo apresenta o GeoLoco, um framework de locomoção para humanoides que utiliza exclusivamente imagens RGB e aproveita os priores geométricos de um Modelo Visual Fundamental (VFM) congelado para superar as limitações de simulação-para-realidade, permitindo transferência zero-shot robusta para o robô Unitree G1 em terrenos desafiadores.

Yufei Liu, Xieyuanli Chen, Hainan Pan, Chenghao Shi, Yanjie Chen, Kaihong Huang, Zhiwen Zeng, Huimin LuTue, 10 Ma💻 cs

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

Este artigo apresenta um quadro de aprendizado por reforço para controlar exoesqueletos que reduzem os momentos articulares biológicos e valida esses controladores treinados em simulação através de um conjunto de dados de marcha aberto, demonstrando forte consistência entre simulação e dados reais, especialmente no nível de torque no quadril, embora desafios permaneçam para a transferência sim-real em velocidades mais altas e inclinações mais íngremes.

Zihang You, Xianlian ZhouTue, 10 Ma🤖 cs.LG

TempoFit: Plug-and-Play Layer-Wise Temporal KV Memory for Long-Horizon Vision-Language-Action Manipulation

O artigo apresenta o TempoFit, uma solução de retrofit temporal sem treinamento que melhora a capacidade de manipulação de longo prazo de políticas VLA pré-treinadas ao reutilizar e recuperar memórias de chaves/valores de camadas anteriores, alcançando ganhos significativos de desempenho em tarefas complexas sem aumentar a latência ou exigir novos módulos treináveis.

Jun Sun, Boyu Yang, Jiahao Zhang, Ning Ma, Chencheng Wu, Siqing Zhang, Yiou Huang, Qiufeng Wang, Shan Liang, Yaran ChenTue, 10 Ma💻 cs

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

O artigo apresenta o AtomicVLA, um framework unificado de planejamento e execução que utiliza uma biblioteca de habilidades atômicas escalável e um mecanismo de especialistas mistos orientados por habilidades para superar as limitações dos modelos VLA existentes em tarefas robóticas de longo horizonte e aprendizado contínuo.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan LiangTue, 10 Ma💻 cs

Multi-Agent Off-World Exploration for Sparse Evidence Discovery via Gaussian Belief Mapping and Dual-Domain Coverage

Este artigo propõe um quadro de planeamento de trajetória para exploração multiagente fora da Terra, baseado em mapeamento de crença Gaussiana e cobertura de dupla domínio, que supera as limitações das abordagens existentes ao equilibrar a descoberta de evidências esparsas com a segurança operacional em terrenos perigosos e comunicações restritas.

Zhuoran Qiao, Tianxin Hu, Thien-Minh Nguyen, Shenghai YuanTue, 10 Ma💻 cs

DAISS: Phase-Aware Imitation Learning for Dual-Arm Robotic Ultrasound-Guided Interventions

O artigo apresenta o DAISS, um sistema cirúrgico teleoperado de dois braços que utiliza aprendizado por imitação sensível a fases e feedback de ultrassom em tempo real para automatizar com precisão procedimentos de intervenção guiada por imagem, como a inserção de agulhas, reduzindo a carga cognitiva e replicando estratégias de especialistas a partir de demonstrações limitadas.

Feng Li, Pei Liu, Shiting Wang, Ning Wang, Zhongliang Jiang, Nassir Navab, Yuan BiTue, 10 Ma💻 cs

Low-Cost Teleoperation Extension for Mobile Manipulators

Este artigo apresenta um framework de teleoperação de baixo custo e código aberto para manipuladores móveis bimanuais, que utiliza hardware comum como smartphones e pedais para permitir um controle intuitivo de todo o corpo, eliminando a necessidade de equipamentos especializados caros e demonstrando melhor desempenho e menor carga cognitiva em comparação com controles baseados em teclado.

Danil Belov, Artem Erkhov, Yaroslav Savotin, Tatiana Podladchikova, Pavel OsinenkoTue, 10 Ma💻 cs

RoboPCA: Pose-centered Affordance Learning from Human Demonstrations for Robot Manipulation

O artigo apresenta o RoboPCA, um framework de aprendizado de affordance centrado na pose que prevê conjuntamente regiões de contato e poses adequadas para manipulação robótica, utilizando o pipeline Human2Afford para gerar automaticamente anotações a partir de demonstrações humanas e demonstrando superioridade em relação a métodos existentes em diversos cenários.

Zhanqi Xiao, Ruiping Wang, Xilin ChenTue, 10 Ma💻 cs

C2^2-Explorer: Contiguity-Driven Task Allocation with Connectivity-Aware Task Representation for Decentralized Multi-UAV Exploration

O artigo apresenta o C2^2-Explorer, um framework descentralizado para exploração multi-UAV que supera limitações de comunicação e alocação não contígua ao utilizar representações de tarefas baseadas em conectividade e uma formulação de alocação orientada à contiguidade, resultando em reduções significativas no tempo de exploração e na distância percorrida.

Xinlu Yan, Mingjie Zhang, Yuhao Fang, Yanke Sun, Jun Ma, Youmin Gong, Boyu Zhou, Jie MeiTue, 10 Ma💻 cs

AeroPlace-Flow: Language-Grounded Object Placement for Aerial Manipulators via Visual Foresight and Object Flow

O artigo apresenta o AeroPlace-Flow, um framework sem treinamento que permite a manipulação aérea de objetos baseada em linguagem, unindo previsão visual e raciocínio geométrico 3D para gerar trajetórias de colocação precisas e livres de colisões a partir de instruções naturais, alcançando uma taxa de sucesso de 75% em experimentos reais.

Sarthak Mishra, Rishabh Dev Yadav, Naveen Nair, Wei Pan, Spandan RoyTue, 10 Ma💻 cs

Directing the Robot: Scaffolding Creative Human-AI-Robot Interaction

Este artigo propõe uma reestruturação da interação humano-IA-robô como "andaime" (scaffolding), onde os humanos atuam como diretores criativos que definem intenções e orientam revisões, enquanto a IA medeia a execução robótica, visando priorizar a agência humana, a criatividade e o fluxo em vez da autonomia ou eficiência pura.

Jordan Aiko Deja, Isidro Butaslac, Nicko Reginio Caluya, Maheshya WeerasingheTue, 10 Ma💻 cs

Residual Control for Fast Recovery from Dynamics Shifts

O artigo propõe uma arquitetura de controle residual alinhada à estabilidade que, ao manter uma política nominal fixa e utilizar um canal aditivo regulado para compensar dinâmicas imprevistas, permite que sistemas robóticos se recuperem rapidamente de perturbações em tempo de execução sem necessidade de re-treinamento.

Nethmi Jayasinghe, Diana Gontero, Francesco Migliarba, Spencer T. Brown, Vinod K. Sangwan, Mark C. Hersam, Amit Ranjan TrivediTue, 10 Ma💻 cs