M2M^2-Occ: Resilient 3D Semantic Occupancy Prediction for Autonomous Driving with Incomplete Camera Inputs

Il paper presenta M2M^2-Occ, un framework innovativo per la previsione dell'occupazione semantica 3D che garantisce resilienza e coerenza strutturale in scenari di guida autonoma con input multivista incompleti, grazie a un modulo di ricostruzione mascherata e a una memoria di caratteristiche che recuperano informazioni mancanti senza compromettere le prestazioni in condizioni ottimali.

Kaixin Lin, Kunyu Peng, Di Wen, Yufan Chen, Ruiping Liu, Kailun YangWed, 11 Ma⚡ eess

Let's Reward Step-by-Step: Step-Aware Contrastive Alignment for Vision-Language Navigation in Continuous Environments

Il paper introduce SACA, un nuovo framework di allineamento contrastivo step-aware che risolve le limitazioni degli attuali metodi di addestramento per la navigazione visione-linguaggio in ambienti continui, migliorando la generalizzazione e il recupero dagli errori attraverso una supervisione densa e un'analisi dettagliata dei singoli passaggi.

Haoyuan Li, Rui Liu, Hehe Fan, Yi YangWed, 11 Ma💻 cs

PanoAffordanceNet: Towards Holistic Affordance Grounding in 360{\deg} Indoor Environments

Il paper introduce PanoAffordanceNet, un nuovo framework end-to-end e il dataset 360-AGD per il grounding olistico delle affordance in ambienti interni a 360 gradi, superando le sfide delle distorsioni geometriche e della dispersione sematica attraverso modulatori spettrali adattivi e testine di densificazione sferica.

Guoliang Zhu, Wanjun Jia, Caoyang Shao, Yuheng Zhang, Zhiyong Li, Kailun YangWed, 11 Ma⚡ eess

TIMID: Time-Dependent Mistake Detection in Videos of Robot Executions

Il paper presenta TIMID, una nuova architettura ispirata alla rilevazione di anomalie video che, sfruttando supervisione debole e un dataset di simulazione multi-robot, supera i limiti dei modelli esistenti nel rilevare errori temporali complessi durante l'esecuzione di compiti robotici ad alto livello.

Nerea Gallego (University of Zaragoza), Fernando Salanova (University of Zaragoza), Claudio Mannarano (University of Zaragoza, University of Torino), Cristian Mahulea (University of Zaragoza), Eduardo Montijano (University of Zaragoza)Wed, 11 Ma💻 cs

Lightweight 3D LiDAR-Based UAV Tracking: An Adaptive Extended Kalman Filtering Approach

Questo articolo presenta un sistema di tracciamento UAV basato su LiDAR 3D leggero e adattivo, che utilizza un Filtro di Kalman Esteso Adattivo (AEKF) per garantire un posizionamento relativo robusto e preciso in ambienti privi di GPS, superando le limitazioni dei metodi convenzionali in termini di carico utile e prestazioni durante manovre aggressive.

Nivand Khosravi, Meysam Basiri, Rodrigo VenturaWed, 11 Ma⚡ eess

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Questo articolo presenta il framework DAPL, che facilita l'apprendimento di politiche dinamiche consapevoli per abilitare la destrezza estrinseca in scenari affollati, superando i metodi esistenti grazie a una modellazione esplicita delle dinamiche indotte dal contatto e ottenendo risultati superiori sia in simulazione che nel mondo reale.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He WangWed, 11 Ma🤖 cs.AI

NanoBench: A Multi-Task Benchmark Dataset for Nano-Quadrotor System Identification, Control, and State Estimation

Il paper presenta NanoBench, il primo dataset open-source multi-task che fornisce dati sincronizzati a livello di attuatore, controller e stimatore su un nano-quadrotore Crazyflie 2.1, colmando il divario nei benchmark esistenti per lo studio dell'identificazione di sistema, del controllo e della stima dello stato in condizioni di aerodinamica a basso numero di Reynolds e vincoli computazionali severi.

Syed Izzat Ullah, Jose BacaWed, 11 Ma⚡ eess

Kinodynamic Motion Retargeting for Humanoid Locomotion via Multi-Contact Whole-Body Trajectory Optimization

Il paper presenta KDMR, un nuovo framework per il ridimensionamento cinematico-dinamico della locomozione umanoide che, formulando il problema come ottimizzazione di traiettoria a contatto multiplo e integrando dati di forza di reazione al suolo, genera movimenti fisicamente coerenti che superano i limiti dei metodi puramente cinematici e migliorano l'addestramento delle politiche di controllo.

Xiaoyu Zhang, Steven Haener, Varun Madabushi, Maegan TuckerWed, 11 Ma💻 cs

TiPToP: A Modular Open-Vocabulary Planning System for Robotic Manipulation

Il paper presenta TiPToP, un sistema modulare open-source per la pianificazione robotica che combina modelli visivi preaddestrati e un pianificatore Task and Motion (TAMP) per eseguire compiti di manipolazione complessi da immagini e istruzioni linguistiche senza richiedere dati robotici specifici, dimostrando prestazioni competitive rispetto a modelli VLA addestrati su grandi dataset.

William Shen, Nishanth Kumar, Sahit Chintalapudi, Jie Wang, Christopher Watson, Edward Hu, Jing Cao, Dinesh Jayaraman, Leslie Pack Kaelbling, Tomás Lozano-PérezWed, 11 Ma💻 cs

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

Questa rassegna esamina l'applicazione della teoria dell'utilità alla modellazione cognitiva nella robotica, analizzando l'evoluzione dai sistemi basati sul comportamento alle architetture cognitive e ai sistemi di valore, con particolare attenzione al processo decisionale, all'apprendimento e all'interazione in ambienti multi-agente e uomo-robot, proponendo infine nuove direzioni di ricerca e problemi aperti.

Qin YangTue, 10 Ma💻 cs

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

Questo lavoro propone una rete di oscillatori accoppiati (CON) che, garantendo una struttura lagrangiana, stabilità input-stato e una mappatura invertibile tra input e forze latenti, abilita un controllo efficace nello spazio latente basato su modelli a forma chiusa per sistemi fisici complessi, come dimostrato con successo su un robot soffice utilizzando solo immagini.

Maximilian Stölzle, Cosimo Della SantinaTue, 10 Ma🤖 cs.LG

Variational approach to nonholonomic and inequality-constrained mechanics

Questo lavoro presenta un'azione scalare esplicita e generale per sistemi meccanici non olonomi e vincolati da disuguaglianze, derivata dal formalismo quantistico di Schwinger-Keldysh, che permette di recuperare le equazioni di Lagrange-d'Alembert tramite estremizzazione e di validare la dinamica attraverso l'ottimizzazione numerica diretta senza ricorrere alle equazioni del moto.

A. Rothkopf, W. A. HorowitzTue, 10 Ma🔢 math

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Questo lavoro propone un metodo che sfrutta modelli visione-linguaggio preaddestrati per apprendere modelli del mondo simbolici astratti da dimostrazioni brevi, consentendo a sistemi robotici di pianificare e risolvere compiti decisionali a lungo termine con una generalizzazione zero-shot in scenari complessi e non visti in precedenza.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack KaelblingTue, 10 Ma🤖 cs.LG