cs.RO articoli | Gist.Science

Real-time tightly coupled GNSS and IMU integration via Factor Graph Optimization

Questo lavoro presenta un metodo di integrazione GNSS-IMU in tempo reale basato sull'ottimizzazione del grafo fattoriale, che utilizza l'ottimizzazione incrementale con marginalizzazione a finestra fissa per garantire una stima causale dello stato e dimostrare elevate prestazioni in ambienti urbani degradati.

Radu-Andrei Cioaca, Paul Irofti, Cristian Rusu + 3 more2026-03-05🤖 cs.LG

MEM: Multi-Scale Embodied Memory for Vision Language Action Models

Il paper introduce MEM (Multi-Scale Embodied Memory), un'architettura di memoria multimodale che combina ricordi a breve termine basati su video e ricordi a lungo termine basati su testo per abilitare i robot a eseguire compiti complessi e di lunga durata, come pulire una cucina o preparare un panino, adattando intelligentemente le proprie strategie di manipolazione.

Marcel Torne, Karl Pertsch, Homer Walke + 14 more2026-03-05🤖 cs.LG

UrbanHuRo: A Two-Layer Human-Robot Collaboration Framework for the Joint Optimization of Heterogeneous Urban Services

Il paper propone UrbanHuRo, un framework di collaborazione uomo-robot a due livelli che ottimizza congiuntamente servizi urbani eterogenei, come le consegne e il rilevamento ambientale, migliorando significativamente la copertura sensoriale, il reddito dei corrieri e l'efficienza operativa attraverso algoritmi distribuiti e apprendimento per rinforzo.

Tonmoy Dey, Lin Jiang, Zheng Dong + 1 more2026-03-05🤖 cs.AI

Large-Language-Model-Guided State Estimation for Partially Observable Task and Motion Planning

Il lavoro propone CoCo-TAMP, un framework che utilizza la capacità di ragionamento comune dei grandi modelli linguistici per guidare la stima dello stato in ambienti parzialmente osservabili, riducendo significativamente i tempi di pianificazione ed esecuzione rispetto ai metodi tradizionali.

Yoonwoo Kim, Raghav Arora, Roberto Martín-Martín + 3 more2026-03-05🤖 cs.AI

HALyPO: Heterogeneous-Agent Lyapunov Policy Optimization for Human-Robot Collaboration

Il paper propone HALyPO, un metodo di ottimizzazione delle politiche basato su funzioni di Lyapunov che garantisce la stabilità formale nell'apprendimento decentralizzato per la collaborazione uomo-robot, colmando il divario razionale tra agenti eterogenei e migliorando così la generalizzazione e la resilienza in scenari complessi.

Hao Zhang, Yaru Niu, Yikai Wang + 2 more2026-03-05🤖 cs.AI

RAGNav: A Retrieval-Augmented Topological Reasoning Framework for Multi-Goal Visual-Language Navigation

Il paper presenta RAGNav, un framework di navigazione visivo-linguistica multi-obiettivo che integra una memoria a doppia base (mappe topologiche e foreste semantiche) con meccanismi di recupero guidati da ancoraggi per superare le allucinazioni spaziali e migliorare il ragionamento topologico, ottenendo prestazioni allo stato dell'arte.

Ling Luo, Qiangian Bai2026-03-05🤖 cs.AI

Interaction-Aware Whole-Body Control for Compliant Object Transport

Questo articolo presenta un controllo corporeo intero orientato all'interazione (IO-WBC), ispirato al cervelletto biologico e basato su apprendimento per rinforzo, che permette agli umanoidi assistivi di trasportare oggetti in modo compliant e stabile in ambienti non strutturati, separando l'esecuzione dell'interazione superiore dal supporto inferiore per gestire forze di contatto variabili senza dipendere dal tracciamento preciso della velocità.

Hao Zhang, Yves Tseng, Ding Zhao + 1 more2026-03-05🤖 cs.AI

Cognition to Control - Multi-Agent Learning for Human-Humanoid Collaborative Transport

Il paper propone C2C, un'architettura gerarchica a tre livelli che integra un modello linguistico-visual, un processo decisionale deliberativo basato su apprendimento multi-agente e un controllo corporeo completo per abilitare una collaborazione stabile e adattiva tra umani e umanoidi nel trasporto congiunto di oggetti.

Hao Zhang, Ding Zhao, H. Eric Tseng2026-03-05🤖 cs.AI

Pretrained Vision-Language-Action Models are Surprisingly Resistant to Forgetting in Continual Learning

Questo studio dimostra che i modelli preaddestrati Vision-Language-Action (VLA) sono sorprendentemente resistenti all'oblio nell'apprendimento continuo, superando i modelli più piccoli grazie alla pre-addestramento che, combinato con una semplice riproduzione delle esperienze, permette di acquisire nuove competenze senza dimenticare quelle precedenti e di recuperare rapidamente le abilità apparentemente perse.

Huihan Liu, Changyeon Kim, Bo Liu + 2 more2026-03-05🤖 cs.AI

IROSA: Interactive Robot Skill Adaptation using Natural Language

Il paper presenta IROSA, un framework innovativo che utilizza modelli linguistici pre-addestrati per adattare le abilità di un robot industriale a comandi naturali, garantendo sicurezza e trasparenza senza necessità di riaddestramento.

Markus Knauer, Samuel Bustamante, Thomas Eiband + 3 more2026-03-05🤖 cs.AI

RVN-Bench: A Benchmark for Reactive Visual Navigation

Il paper introduce RVN-Bench, un nuovo benchmark collision-aware basato su Habitat 2.0 e scene HM3D ad alta fedeltà, progettato per valutare e addestrare agenti di navigazione visiva reattiva e sicura in ambienti interni complessi e non mappati.

Jaewon Lee, Jaeseok Heo, Gunmin Lee + 3 more2026-03-05🤖 cs.AI

Right in Time: Reactive Reasoning in Regulated Traffic Spaces

Questo lavoro propone un framework di progettazione missionale reattivo che combina ProMis e Circuiti Reattivi per abilitare inferenze probabilistiche esatte e in tempo reale su dati ambientali incerti e regolamenti logici, garantendo sicurezza e conformità normativa per sistemi di trasporto intelligenti come gli UAS.

Simon Kohaut, Benedict Flade, Julian Eggert + 2 more2026-03-05🤖 cs.AI

Self-adapting Robotic Agents through Online Continual Reinforcement Learning with World Model Feedback

Questo lavoro presenta un framework di apprendimento per rinforzo continuo online, ispirato biologicamente e basato su DreamerV3, che permette agli agenti robotici di adattarsi autonomamente a cambiamenti imprevisti durante il deployment rilevando errori di previsione del modello del mondo e attivando un fine-tuning automatico monitorato senza supervisione esterna.

Fabian Domberg, Georg Schildbach2026-03-05🤖 cs.AI

Sim2Sea: Sim-to-Real Policy Transfer for Maritime Vessel Navigation in Congested Waters

Il paper presenta Sim2Sea, un framework che colma il divario tra simulazione e realtà per la navigazione autonoma in acque affollate, combinando un simulatore GPU accelerato, una politica spaziotemporale a doppio flusso con mascheramento delle azioni sicuro e una randomizzazione del dominio mirata, permettendo il trasferimento zero-shot su un vero veicolo autonomo marino.

Xinyu Cui, Xuanfa Jin, Xue Yan + 7 more2026-03-05🤖 cs.AI

SaFeR: Safety-Critical Scenario Generation for Autonomous Driving Test via Feasibility-Constrained Token Resampling

Il paper propone SaFeR, un metodo innovativo per la generazione di scenari critici per la guida autonoma che bilancia adversarialità, fattibilità fisica e realismo comportamentale attraverso un meccanismo di attenzione differenziale e una strategia di ricampionamento vincolata da una regione di fattibilità approssimata tramite apprendimento per rinforzo.

Jinlong Cui, Fenghua Liang, Guo Yang + 2 more2026-03-05🤖 cs.AI

GarmentPile++: Affordance-Driven Cluttered Garments Retrieval with Vision-Language Reasoning

Il paper propone GarmentPile++, un nuovo sistema che combina ragionamento visione-linguaggio e percezione delle affordanze visive per recuperare in modo sicuro e preciso un singolo capo da un mucchio disordinato, superando le limitazioni delle ricerche precedenti che consideravano solo capi singoli.

Mingleyang Li, Yuran Wang, Yue Chen + 6 more2026-03-05🤖 cs.AI

Learning Hip Exoskeleton Control Policy via Predictive Neuromusculoskeletal Simulation

Questo studio presenta un framework di apprendimento basato su simulazioni neuromuscoloscheletriche fisiche che addestra una politica di controllo per un esoscheletro dell'anca esclusivamente in ambiente simulato, dimostrandone il trasferimento efficace su hardware reale con riduzioni misurabili dell'attivazione muscolare e del lavoro articolare senza necessità di dati di movimento o sintonizzazioni aggiuntive.

Ilseung Park, Changseob Song, Inseung Kang2026-03-05🤖 cs.LG

PRAM-R: A Perception-Reasoning-Action-Memory Framework with LLM-Guided Modality Routing for Adaptive Autonomous Driving

Il documento presenta PRAM-R, un framework unificato per la guida autonoma che utilizza un router guidato da LLM e una memoria gerarchica per selezionare dinamicamente i sensori, riducendo significativamente i costi computazionali e le oscillazioni di routing pur mantenendo l'accuratezza in scenari urbani complessi.

Yi Zhang, Xian Zhang, Saisi Zhao + 4 more2026-03-05🤖 cs.AI

VANGUARD: Vehicle-Anchored Ground Sample Distance Estimation for UAVs in GPS-Denied Environments

Il paper presenta VANGUARD, uno strumento geometrico deterministico che permette agli agenti autonomi di stimare la distanza campione a terra (GSD) in ambienti privi di GPS rilevando veicoli come ancoraggi spaziali, risolvendo così le allucinazioni di scala dei modelli VLM e garantendo una ragionamento spaziale sicuro e metricamente accurato.

Yifei Chen, Xupeng Chen, Feng Wang + 2 more2026-03-05🤖 cs.AI

RoboCasa365: A Large-Scale Simulation Framework for Training and Benchmarking Generalist Robots

Il paper presenta RoboCasa365, un ampio framework di simulazione basato su 365 compiti quotidiani in 2.500 ambienti cucina diversi e oltre 2.200 ore di dati dimostrativi, progettato per valutare e migliorare le politiche dei robot generalisti attraverso esperimenti sistematici su apprendimento multi-task, modelli fondazionali e apprendimento continuo.

Soroush Nasiriany, Sepehr Nasiriany, Abhiram Maddukuri + 1 more2026-03-05🤖 cs.AI

← Precedente Successivo →