cs.RO articoli | Gist.Science

RODEO: RObotic DEcentralized Organization

Il paper presenta RODEO, un framework basato su blockchain che integra meccanismi di fiducia e responsabilità per i robot di servizio, permettendo loro di eseguire compiti autonomi verificabili, ricevere compensi in token e reinvestire tali fondi per servizi essenziali come la ricarica delle batterie.

Milan Groshev, Eduardo Castelló Ferrer2026-03-09💻 cs

Transforming Omnidirectional RGB-LiDAR data into 3D Gaussian Splatting

Questo lavoro presenta una pipeline innovativa che trasforma log sensoriali omnidirezionali RGB-LiDAR esistenti, spesso sottoutilizzati, in asset di inizializzazione robusti per il 3D Gaussian Splatting, superando le distorsioni e l'overhead computazionale per generare gemelli digitali di alta qualità.

Semin Bae, Hansol Lim, Jongseong Brad Choi2026-03-09💻 cs

Lifelong Embodied Navigation Learning

Il paper propone Uni-Walker, un framework di apprendimento incarnato a vita che risolve il problema della rimozione catastrofica nei agenti di navigazione potenziati da LLM, decoulando le conoscenze in componenti condivise e specifiche tramite DE-LoRA e strategie di eredità e ortogonalità per adattarsi a compiti e stili di istruzioni diversi mantenendo le competenze apprese in precedenza.

Xudong Wang, Jiahua Dong, Baichen Liu, Qi Lyu, Lianqing Liu, Zhi Han2026-03-09🤖 cs.AI

Multimodal Behavior Tree Generation: A Small Vision-Language Model for Robot Task Planning

Questo lavoro propone un metodo per generare alberi comportamentali per la pianificazione di compiti robotici utilizzando un modello visione-linguaggio (VLM) compatto e open-source, che viene addestrato su un nuovo dataset derivato da episodi robotici esistenti e dimostra prestazioni competitive con modelli chiusi su larga scala pur richiedendo risorse computazionali significativamente inferiori.

Cristiano Battistini, Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-09💻 cs

Sticky-Glance: Robust Intent Recognition for Human Robot Collaboration via Single-Glance

Il paper propone "Sticky-Glance", un framework robusto per il riconoscimento delle intenzioni basato sullo sguardo che, tramite un algoritmo di "sguardo adesivo" e un controllo condiviso continuo, permette alle persone con limitate capacità motorie di interagire efficacemente con robot in ambienti dinamici, riducendo il carico di lavoro e il tempo di esecuzione dei compiti.

Yuzhi Lai, Shenghai Yuan, Peizheng Li, Andreas Zell2026-03-09💻 cs

A Hazard-Informed Data Pipeline for Robotics Physical Safety

Questo rapporto presenta un quadro strutturato per la sicurezza fisica dei robot che integra l'ingegneria della sicurezza classica con l'apprendimento automatico, allineando la dichiarazione degli asset, l'enumerazione delle vulnerabilità e la generazione di dati sintetici basati sui pericoli per l'addestramento di modelli di sicurezza.

Alexei Odinokov, Rostislav Yavorskiy2026-03-09🤖 cs.AI

Dual-Agent Multiple-Model Reinforcement Learning for Event-Triggered Human-Robot Co-Adaptation in Decoupled Task Spaces

Questo articolo presenta una strategia di controllo condiviso per la riabilitazione robotica che, integrando un meccanismo di attivazione basato su eventi e un algoritmo di apprendimento per rinforzo a doppio agente (DAMMRL), ottimizza la co-adattazione uomo-robot in spazi di compito disaccoppiati, migliorando precisione ed efficienza nei compiti di raggiungimento.

Yaqi Li, Zhengqi Han, Huifang Liu, Steven W. Su2026-03-09💻 cs

DreamToNav: Generalizable Navigation for Robots via Generative Video Planning

Il paper presenta DreamToNav, un innovativo framework di navigazione robotica che utilizza modelli generativi video per tradurre prompt linguistici naturali in traiettorie eseguibili, permettendo a robot di diverse locomozioni di pianificare e realizzare compiti complessi con un'accuratezza significativa senza necessità di ingegnerizzazione specifica per ogni attività.

Valerii Serpiva, Jeffrin Sam, Chidera Simon, Hajira Amjad, Iana Zhura, Artem Lykov, Dzmitry Tsetserukou2026-03-09💻 cs

KISS-IMU: Self-supervised Inertial Odometry with Motion-balanced Learning and Uncertainty-aware Inference

Il paper presenta KISS-IMU, un nuovo framework di odometria inerziale auto-supervisionato che elimina la dipendenza dai dati di verità fondamentale sfruttando la registrazione ICP basata su LiDAR e l'ottimizzazione del grafo delle pose, garantendo robustezza attraverso un addestramento bilanciato per il movimento e un'inferenza adattiva guidata dall'incertezza.

Jiwon Choi, Hogyun Kim, Geonmo Yang, Juhui Lee, Younggun Cho2026-03-09💻 cs

VG3S: Visual Geometry Grounded Gaussian Splatting for Semantic Occupancy Prediction

Il paper introduce VG3S, un nuovo framework che potenzia la previsione dell'occupazione semantica 3D integrando forti segnali geometrici da Modelli Fondamentali Visivi (VFM) tramite un adattatore gerarchico, ottenendo significativi miglioramenti di accuratezza sul benchmark nuScenes.

Xiaoyang Yan, Muleilan Pei, Shaojie Shen2026-03-09💻 cs

Few-Shot Neural Differentiable Simulator: Real-to-Sim Rigid-Contact Modeling

Questo lavoro propone un simulatore differenziabile basato su reti neurali che, combinando formulazioni analitiche con modelli GNN e utilizzando pochi dati reali per la calibrazione, migliora l'accuratezza della simulazione dei contatti rigidi e l'efficienza dell'apprendimento delle politiche robotiche.

Zhenhao Huang, Siyuan Luo, Bingyang Zhou, Ziqiu Zeng, Jason Pho, Fan Shi2026-03-09💻 cs

TaPD: Temporal-adaptive Progressive Distillation for Observation-Adaptive Trajectory Forecasting in Autonomous Driving

Il paper presenta TaPD, un framework unificato e plug-and-play che utilizza la distillazione progressiva temporale-adattiva e un modulo di riempimento temporale per migliorare l'accuratezza della previsione delle traiettorie in scenari di guida autonoma con storie di osservazione variabili o estremamente brevi.

Mingyu Fan, Yi Liu, Hao Zhou, Deheng Qian, Mohammad Haziq Khan, Matthias Raetsch2026-03-09🤖 cs.AI

NOVA: Next-step Open-Vocabulary Autoregression for 3D Multi-Object Tracking in Autonomous Driving

Il paper introduce NOVA, un nuovo paradigma di autoregressione open-vocabulary che sfrutta i modelli linguistici su larga scala per trasformare il tracciamento 3D di oggetti multipli in un compito di completamento di sequenze spaziotemporali, ottenendo prestazioni superiori nel tracciamento di categorie sconosciute rispetto ai metodi tradizionali.

Kai Luo, Xu Wang, Rui Fan, Kailun Yang2026-03-09💻 cs

Towards Robotic Lake Maintenance: Integrating SONAR and Satellite Data to Assist Human Operators

Questo articolo propone un approccio a due fasi per la manutenzione robotizzata di laghi artificiali, integrando dati satellitari per la rilevazione preliminare della vegetazione sommersa e mappature ad alta risoluzione tramite SONAR a bordo di veicoli di superficie non pilotati, al fine di ottimizzare il raccolto mirato e ridurre il carico di lavoro per gli operatori umani.

Ahmed H. Elsayed, Christoph Manss, Tarek A. El-Mihoub, Andrej Lejman, Frederic Stahl2026-03-09💻 cs

Can we Trust Unreliable Voxels? Exploring 3D Semantic Occupancy Prediction under Label Noise

Questo lavoro introduce il benchmark OccNL e il framework DPR-Occ per affrontare la previsione dell'occupazione semantica 3D in presenza di rumore di etichetta, dimostrando che le strategie esistenti falliscono in spazi voxel sparsi e proponendo un metodo innovativo basato sul ragionamento su etichette parziali che mantiene prestazioni elevate anche con un rumore del 90%.

Wenxin Li, Kunyu Peng, Di Wen, Junwei Zheng, Jiale Wei, Mengfei Duan, Yuheng Zhang, Rui Fan, Kailun Yang2026-03-09💻 cs

SuperSuit: An Isomorphic Bimodal Interface for Scalable Mobile Manipulation

Il paper presenta SuperSuit, un'interfaccia bimodale isomorfa che unifica teleoperazione e dimostrazione attiva per robot mobili manipolatori, consentendo la raccolta scalabile di dati ad alta qualità per compiti a lungo orizzonte attraverso una rappresentazione cinematica coerente che elimina la necessità di modifiche alle policy a valle.

Tongqing Chen, Hang Wu, Jiasen Wang, Xiaotao Li, Zhu Jin, Lu Fang2026-03-09💻 cs

Open-Source Based and ETSI Compliant Cooperative, Connected, and Automated Mini-Cars

Questo articolo propone l'utilizzo di mini-auto in scala 1:10 basate su software open-source e conformi agli standard ETSI come soluzione economica ed efficace per colmare il divario tra simulazione e test reali di veicoli autonomi, cooperativi e connessi, dimostrando la fattibilità della piattaforma attraverso la validazione di un sistema di avviso di collisione agli incroci.

Lorenzo Farina, Federico Gavioli, Salvatore Iandolo, Francesco Moretti, Giuseppe Perrone, Matteo Piccoli, Francesco Raviglione, Marco Rapelli, Antonio Solida, Paolo Burgio, Carlo Augusto Grazia, Alessandro Bazzi2026-03-09💻 cs

Safe Consensus of Cooperative Manipulation with Hierarchical Event-Triggered Control Barrier Functions

Questo articolo presenta un framework di controllo distribuito che garantisce il consenso e la sicurezza nella manipolazione cooperativa tramite funzioni barriera di controllo gerarchiche attivate da eventi, riducendo i costi computazionali e di comunicazione rispetto ai metodi tradizionali.

Simiao Zhuang, Bingkun Huang, Zewen Yang2026-03-09💻 cs

Data Analogies Enable Efficient Cross-Embodiment Transfer

Questo studio dimostra che, per migliorare il trasferimento cross-embodiment nei robot, l'uso di "analogie di dati" (dimostrazioni accoppiate che allineano scenari e traiettorie tra diversi corpi robotici) è più efficace dell'aumento indiscriminato della diversità dei dati, specialmente quando si affrontano cambiamenti morfologici, portando a un incremento medio del 22,5% nel successo del trasferimento rispetto ai dataset non accoppiati.

Jonathan Yang, Chelsea Finn, Dorsa Sadigh2026-03-09💻 cs

History-Conditioned Spatio-Temporal Visual Token Pruning for Efficient Vision-Language Navigation

Il paper propone un framework di pruning dei token visivi spaziotemporali basato sulla storia, privo di riaddestramento, che riduce significativamente la latenza computazionale nei modelli Vision-Language-Action per la navigazione robotica, mantenendo un'alta accuratezza e permettendo un'implementazione in tempo reale su robot reali.

Qitong Wang, Yijun Liang, Ming Li, Tianyi Zhou, Christopher Rasmussen2026-03-09💻 cs

← Precedente Successivo →