Systematic Evaluation of Novel View Synthesis for Video Place Recognition

Questo articolo presenta una valutazione sistematica dell'impatto delle viste sintetiche innovative sul riconoscimento dei luoghi nei video, dimostrando che l'aggiunta di tali viste migliora le statistiche di riconoscimento e che, per aggiunte più ampie, il numero di viste e il tipo di immagine sono fattori più critici rispetto alla magnitudine del cambiamento di prospettiva.

Muhammad Zawad Mahmud, Samiha Islam, Damian Lyons2026-03-09💻 cs

Iterative Convex Optimization with Control Barrier Functions for Obstacle Avoidance among Polytopes

Questo articolo propone un nuovo quadro iterativo di controllo predittivo basato su modelli (MPC) e funzioni di barriera di controllo (DCBF) che, sfruttando iperpiani di supporto derivati da calcoli esatti di punti più vicini tra poliedri, garantisce la convessità dell'ottimizzazione per una navigazione sicura e in tempo reale di robot poliedrici in ambienti con ostacoli poliedrici complessi.

Shuo Liu, Zhe Huang, Calin A. Belta2026-03-09💻 cs

Swooper: Learning High-Speed Aerial Grasping With a Simple Gripper

Il paper presenta Swooper, un approccio basato sul reinforcement learning profondo che, grazie a una strategia di apprendimento in due fasi e un'architettura neurale leggera, permette a un drone quadrotore di eseguire prese aeree ad alta velocità con un semplice gripper commerciale, raggiungendo un tasso di successo dell'84% in scenari reali senza necessità di riaddestramento.

Ziken Huang, Xinze Niu, Bowen Chai, Renbiao Jin, Danping Zou2026-03-09💻 cs

PROBE: Probabilistic Occupancy BEV Encoding with Analytical Translation Robustness for 3D Place Recognition

Il paper presenta PROBE, un descrittore di riconoscimento dei luoghi basato su LiDAR privo di apprendimento che utilizza una codifica probabilistica dell'occupazione BEV e un'analisi matematica delle traslazioni continue per ottenere una robustezza superiore e una generalizzazione cross-sensore senza necessità di tuning specifico per dataset.

Jinseop Lee, Byoungho Lee, Gichul Yoo2026-03-09💻 cs

MagRobot:An Open Simulator for Magnetically Navigated Robots

Il documento presenta MagRobot, il primo simulatore open-source universale che facilita la progettazione, la visualizzazione e il benchmarking di robot navigati magneticamente per applicazioni mediche minimamente invasive, offrendo un ambiente flessibile per testare algoritmi e hardware in scenari anatomici deformabili.

Heng Wang (South China University of Technology), Haoyu Song (South China University of Technology), Jiatao Zheng (South China University of Technology), Yuxiang Han (South China University of Technology), Kunli Wang (South China University of Technology)2026-03-09💻 cs

Moving Through Clutter: Scaling Data Collection and Benchmarking for 3D Scene-Aware Humanoid Locomotion via Virtual Reality

Il paper presenta Moving Through Clutter (MTC), un framework open-source basato sulla realtà virtuale per la raccolta dati e il benchmarking della locomozione umanoide in ambienti 3D affollati, fornendo un nuovo dataset di traiettorie umane adattate ai robot per studiare l'adattamento geometrico e la pianificazione consapevole dell'ambiente.

Beichen Wang, Yuanjie Lu, Linji Wang, Liuchuan Yu, Xuesu Xiao2026-03-09💻 cs

Devil is in Narrow Policy: Unleashing Exploration in Driving VLA Models

Il paper presenta Curious-VLA, un framework che supera i limiti delle politiche ristrette nei modelli VLA per la guida autonoma attraverso una strategia di espansione delle traiettorie fattibili e un campionamento adattivo, ottenendo risultati all'avanguardia sul benchmark Navsim.

Canyu Chen, Yuguang Yang, Zhewen Tan, Yizhi Wang, Ruiyi Zhan, Haiyan Liu, Xuanyao Mao, Jason Bao, Xinyue Tang, Linlin Yang, Bingchuan Sun, Yan Wang, Baochang Zhang2026-03-09💻 cs

Lifelong Embodied Navigation Learning

Il paper propone Uni-Walker, un framework di apprendimento incarnato a vita che risolve il problema della rimozione catastrofica nei agenti di navigazione potenziati da LLM, decoulando le conoscenze in componenti condivise e specifiche tramite DE-LoRA e strategie di eredità e ortogonalità per adattarsi a compiti e stili di istruzioni diversi mantenendo le competenze apprese in precedenza.

Xudong Wang, Jiahua Dong, Baichen Liu, Qi Lyu, Lianqing Liu, Zhi Han2026-03-09🤖 cs.AI

Multimodal Behavior Tree Generation: A Small Vision-Language Model for Robot Task Planning

Questo lavoro propone un metodo per generare alberi comportamentali per la pianificazione di compiti robotici utilizzando un modello visione-linguaggio (VLM) compatto e open-source, che viene addestrato su un nuovo dataset derivato da episodi robotici esistenti e dimostra prestazioni competitive con modelli chiusi su larga scala pur richiedendo risorse computazionali significativamente inferiori.

Cristiano Battistini, Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-09💻 cs

Sticky-Glance: Robust Intent Recognition for Human Robot Collaboration via Single-Glance

Il paper propone "Sticky-Glance", un framework robusto per il riconoscimento delle intenzioni basato sullo sguardo che, tramite un algoritmo di "sguardo adesivo" e un controllo condiviso continuo, permette alle persone con limitate capacità motorie di interagire efficacemente con robot in ambienti dinamici, riducendo il carico di lavoro e il tempo di esecuzione dei compiti.

Yuzhi Lai, Shenghai Yuan, Peizheng Li, Andreas Zell2026-03-09💻 cs