Vision-Augmented On-Track System Identification for Autonomous Racing via Attention-Based Priors and Iterative Neural Correction

Questo paper propone un innovativo sistema di identificazione per veicoli autonomi da corsa che combina una rete neurale leggera per stimare l'attrito stradale tramite visione, un modello S4 per catturare le dinamiche temporali residue e un algoritmo di ottimizzazione senza derivate per estrarre parametri fisici interpretabili, ottenendo così una convergenza più rapida e una maggiore precisione rispetto ai metodi tradizionali.

Zhiping Wu, Cheng Hu, Yiqin Wang, Lei Xie, Hongye SuWed, 11 Ma💻 cs

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Il paper propone un framework che distilla una politica esperta Conditional Flow Matching in una politica studentessa a singolo passo tramite Implicit Maximum Likelihood Estimation e una distanza di Chamfer bi-direzionale, permettendo di generare in tempo reale traiettorie multi-modali ad alta frequenza per il controllo robotico senza subire il collasso della distribuzione tipico dei metodi di accelerazione esistenti.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

Questo lavoro introduce l'Open-World Motion Forecasting, un nuovo paradigma che supera i limiti degli approcci chiusi permettendo ai veicoli autonomi di prevedere le traiettorie direttamente dalle immagini e di adattarsi continuamente a nuove classi di oggetti senza dimenticare quelle apprese in precedenza, grazie a un framework end-to-end che combina pseudo-etichettatura, modelli visione-linguaggio e strategie di replay innovative.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments

Il paper presenta SEA-Nav, un framework di apprendimento per rinforzo che combina funzioni di barriera differenziabili, un meccanismo di replay adattivo e vincoli cinematici per permettere ai robot quadrupedi di navigare in modo sicuro e agile in ambienti densamente ostacolati con un tempo di addestramento di soli pochi minuti.

Shiyi Chen, Mingye Yang, Haiyan Mao, Jiaqi Zhang, Haiyi Liu, Shuheng He, Debing Zhang, Zihao Qiu, Chun ZhangWed, 11 Ma💻 cs

Receptogenesis in a Vascularized Robotic Embodiment

Questo articolo presenta un sistema robotico vascolarizzato in grado di generare hardware ex novo attraverso la ricostituzione dinamica dei materiali, dimostrando la "receptogenesi" in cui sensori vengono costruiti on-demand da riserve interne di fluidi per adattare le capacità del robot in tempo reale.

Kadri-Ann Pankratov, Leonid Zinatullin, Hans Priks, Adele Metsniit, Urmas Johanson, Tarmo Tamm, Alvo Aabloo, Edoardo Sinibaldi, Indrek MustWed, 11 Ma🔬 cond-mat.mtrl-sci

Context-Nav: Context-Driven Exploration and Viewpoint-Aware 3D Spatial Reasoning for Instance Navigation

Il paper presenta Context-Nav, un approccio senza addestramento specifico che risolve la navigazione di istanze tramite descrizioni testuali lunghe integrando allineamenti testo-immagine per guidare l'esplorazione globale e un ragionamento spaziale 3D consapevole del punto di vista per verificare i candidati, ottenendo prestazioni all'avanguardia su InstanceNav e CoIN-Bench.

Won Shik Jang, Ue-Hwan KimWed, 11 Ma💻 cs

Beyond Short-Horizon: VQ-Memory for Robust Long-Horizon Manipulation in Non-Markovian Simulation Benchmarks

Il paper introduce RuleSafe, un nuovo benchmark di manipolazione articolata con compiti non-Markoviani a lungo termine, e propone VQ-Memory, una rappresentazione temporale strutturata basata su VQ-VAE che migliora significativamente il ragionamento e la pianificazione dei modelli robotici in scenari complessi.

Wang Honghui, Jing Zhi, Ao Jicong, Song Shiji, Li Xuelong, Huang Gao, Bai ChenjiaWed, 11 Ma💻 cs

ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly

Il paper presenta ReTac-ACT, un modello di apprendimento per imitazione che fonde visione e tatto tramite un meccanismo di gating stato-dipendente e un obiettivo di ricostruzione tattile, ottenendo prestazioni superiori nel montaggio di precisione anche in condizioni di occlusione visiva e tolleranze industriali strette.

Minchi Ruan, LiangQing Zhou, Hongtong Li, Zongtao Wang, ZhaoMing Lu, Jianwei Zhang, Bin FangWed, 11 Ma💻 cs

SCDP: Learning Humanoid Locomotion from Partial Observations via Mixed-Observation Distillation

Il paper presenta SCDP, una strategia di apprendimento che utilizza modelli di diffusione addestrati su osservazioni parziali per distillare il controllo della locomozione umanoide da dati offline, permettendo a un robot reale di muoversi in modo robusto basandosi esclusivamente sui sensori di bordo senza necessità di stima esplicita dello stato.

Milo Carroll, Tianhu Peng, Lingfan Bao, Chengxu Zhou, Zhibin LiWed, 11 Ma🤖 cs.LG

A Generalized Voronoi Graph based Coverage Control Approach for Non-Convex Environment

Questo articolo propone un approccio di controllo per la copertura basato sul Grafico di Voronoi Generalizzato (GVG) per sistemi multi-robot in ambienti non convessi, che combina un algoritmo di bilanciamento del carico per l'allocazione ottimale dei robot in sottoregioni ponderate e un nuovo controller collaborativo per garantire una copertura efficiente con convergenza dimostrata.

Zuyi Guo, Ronghao Zheng, Meiqin Liu, Senlin ZhangWed, 11 Ma💻 cs

OTPL-VIO: Robust Visual-Inertial Odometry with Optimal Transport Line Association and Adaptive Uncertainty

Il paper presenta OTPL-VIO, un sistema di odometria visivo-inerziale stereo robusto che combina descrittori profondi senza addestramento per le linee con un'associazione basata sul trasporto ottimo e un pesamento adattivo dell'incertezza, migliorando significativamente accuratezza e stabilità in scenari a bassa texture e con variazioni di illuminazione.

Zikun Chen, Wentao Zhao, Yihe Niu, Tianchen Deng, Jingchuan WangWed, 11 Ma💻 cs

Robotic Scene Cloning:Advancing Zero-Shot Robotic Scene Adaptation in Manipulation via Visual Prompt Editing

Il paper propone Robotic Scene Cloning (RSC), un metodo innovativo che utilizza l'editing di prompt visivi per adattare le traiettorie robotiche a nuovi scenari in modo zero-shot, migliorando significativamente la generalizzazione delle politiche di manipolazione sia in ambienti simulati che reali.

Binyuan Huang, Yuqing Wen, Yucheng Zhao, Yaosi Hu, Tiancai Wang, Chang Wen Chen, Haoqiang Fan, Zhenzhong ChenWed, 11 Ma💻 cs