cs.RO articoli | Gist.Science

NaviGait: Navigating Dynamically Feasible Gait Libraries using Deep Reinforcement Learning

Il paper presenta NaviGait, un framework gerarchico che combina l'ottimizzazione di traiettoria con l'apprendimento per rinforzo per generare politiche di locomozione bipede robuste e intuitive, selezionando e adattando dinamicamente i passi da una libreria offline pre-calcolata.

Neil Janwani, Varun Madabushi, Maegan TuckerWed, 11 Ma💻 cs

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

Il paper presenta RL-100, un framework di apprendimento per rinforzo nel mondo reale basato su politiche visuo-motorie a diffusione, che unifica imitazione e rinforzo per ottenere un controllo robotico ad alta frequenza, stabile e robusto, raggiungendo il 100% di successo in 1000 episodi su otto compiti diversi e dimostrando capacità di adattamento zero-shot e few-shot in scenari dinamici complessi.

Kun Lei, Huanyu Li, Dongjie Yu, Zhenyu Wei, Lingxiao Guo, Zhennan Jiang, Ziyu Wang, Shiyu Liang, Huazhe XuWed, 11 Ma🤖 cs.AI

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

Il lavoro presenta FALCON, un nuovo paradigma che colma il divario di ragionamento spaziale nei modelli Vision-Language-Action integrando token 3D ricchi di informazioni geometriche direttamente nel modulo di azione, ottenendo così prestazioni all'avanguardia su numerosi compiti reali e simulati senza richiedere sensori specializzati o modifiche architetturali.

Zhengshen Zhang, Hao Li, Yalun Dai, Zhengbang Zhu, Lei Zhou, Chenchen Liu, Dong Wang, Francis E. H. Tay, Sijin Chen, Ziwei Liu, Yuxiao Liu, Xinghang Li, Pan ZhouWed, 11 Ma🤖 cs.AI

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

Questo articolo dimostra che il ri-pianificazione incrementale in ambienti dinamici può essere risolta più efficientemente trattando ogni richiesta come un problema indipendente utilizzando algoritmi di pianificazione quasi-sicuramente asintoticamente ottimali (ASAO), come EIT* e AORRTC, che trovano percorsi globali coerenti senza la necessità di aggiornare esplicitamente i piani esistenti.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. GammellWed, 11 Ma💻 cs

SynHLMA:Synthesizing Hand Language Manipulation for Articulated Object with Discrete Human Object Interaction Representation

Il paper presenta SynHLMA, un nuovo framework che genera sequenze di manipolazione delle mani per oggetti articolati basandosi su istruzioni linguistiche, utilizzando una rappresentazione discreta delle interazioni e un modello linguistico allineato per garantire grappi realistici e funzionali.

Wang zhi, Yuyan Liu, Liu Liu, Li Zhang, Ruixuan Lu, Dan GuoWed, 11 Ma🤖 cs.AI

EgoMI: Learning Active Vision and Whole-Body Manipulation from Egocentric Human Demonstrations

Il paper presenta EgoMI, un framework che colma il divario di incarnazione tra umani e robot semi-umanoidi apprendendo la manipolazione attiva e la coordinazione testa-mano da dimostrazioni umane in prima persona, utilizzando una politica potenziata da memoria per gestire i cambiamenti dinamici del punto di vista.

Justin Yu, Yide Shentu, Di Wu, Pieter Abbeel, Ken Goldberg, Philipp WuWed, 11 Ma💻 cs

From Demonstrations to Safe Deployment: Path-Consistent Safety Filtering for Diffusion Policies

Il paper propone PACS, un metodo di filtraggio della sicurezza basato sulla consistenza del percorso che garantisce il rispetto dei vincoli di sicurezza in tempo reale senza degradare le prestazioni dei modelli di diffusione, mantenendo la coerenza con la distribuzione di addestramento e superando gli approcci reattivi tradizionali.

Ralf Römer, Julian Balletshofer, Jakob Thumm, Marco Pavone, Angela P. Schoellig, Matthias AlthoffWed, 11 Ma⚡ eess

Bootstrap Dynamic-Aware 3D Visual Representation for Scalable Robot Learning

Il paper introduce AFRO, un framework auto-supervisionato che apprende rappresentazioni 3D consapevoli della dinamica robotica senza supervisione sulle azioni o sulla ricostruzione geometrica, migliorando significativamente il successo nelle attività di manipolazione rispetto ai metodi di pre-addestramento esistenti.

Qiwei Liang, Boyang Cai, Minghao Lai, Sitong Zhuang, Tao Lin, Yan Qin, Yixuan Ye, Jiaming Liang, Renjing XuWed, 11 Ma💻 cs

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

Il paper presenta UniBYD, un framework unificato che supera i limiti dell'imitazione umana nelle manipolazioni robotiche combinando una rappresentazione morfologica unificata e un algoritmo di reinforcement learning dinamico per adattare le politiche di controllo alle diverse morfologie robotiche, ottenendo un miglioramento significativo delle prestazioni rispetto allo stato dell'arte.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Relative Localization System Design for SnailBot: A Modular Self-reconfigurable Robot

Questo articolo presenta la progettazione e l'implementazione di un sistema di localizzazione relativa per SnailBot, un robot modulare auto-ricostituibile, che integra il riconoscimento di marcatori ArUco, l'analisi del flusso ottico e i dati IMU in un framework unificato per garantire un posizionamento preciso e robusto in tempo reale.

Shuhan Zhang, Tin Lun LamWed, 11 Ma⚡ eess

Magnetically Driven Elastic Microswimmers: Exploiting Hysteretic Collapse for Autonomous Propulsion and Independent Control

Questo studio presenta un microsciatore elastico a tre sfere azionato magneticamente che sfrutta il collasso isterico reversibile per generare un movimento netto non reciproco a basso numero di Reynolds, consentendo il controllo indipendente di più microrobot tramite un unico campo magnetico e aprendo nuove prospettive per interventi medici microinvasivi.

Theo Lequy, Andreas M. MenzelWed, 11 Ma🔬 physics.app-ph

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

Il paper presenta AirPulse, un robot volante autonomo di 26 grammi ispirato alle farfalle che, grazie a un'architettura di controllo gerarchica e ali compliant, realizza per la prima volta un volo stabile e guidato in regime tailless a bassa frequenza, aprendo nuove prospettive per il monitoraggio ecologico e l'ispezione in spazi confinati.

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue ZhouWed, 11 Ma💻 cs

Reactive Slip Control in Multifingered Grasping: Hybrid Tactile Sensing and Internal-Force Optimization

Questo lavoro presenta un approccio ibrido che combina sensori tattili multimodali e ottimizzazione delle forze interne per realizzare un controllo reattivo dello scorrimento in prese robotiche multifinger, consentendo una stabilizzazione chiusa in meno di 50 millisecondi.

Théo Ayral, Saifeddine Aloui, Mathieu GrossardWed, 11 Ma⚡ eess

Multimodal Adversarial Quality Policy for Safe Grasping

Questo lavoro propone il Multimodal Adversarial Quality Policy (MAQP), un framework che garantisce una presa robotica sicura in ambienti di interazione uomo-robot attraverso l'ottimizzazione congiunta di patch avversarie RGB e di profondità, risolvendo le discrepanze distributive e gli squilibri di ottimizzazione tipici delle modalità multimodali.

Kunlin Xie, Chenghao Li, Haolan Zhang, Nak Young ChongWed, 11 Ma💻 cs

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Il paper introduce Pri4R, un approccio semplice ed efficace che potenzia i modelli Vision-Language-Action con una comprensione implicita delle dinamiche del mondo attraverso l'addestramento su rappresentazioni 4D privilegiate, migliorando significativamente le prestazioni nei compiti di manipolazione fisica senza aggiungere overhead computazionale durante l'inferenza.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong KimWed, 11 Ma🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

Il paper presenta SPARC, un metodo di pianificazione dei percorsi per robot multipli che utilizza un meccanismo di attenzione potenziato dalle relazioni spaziali (RMHA) per migliorare la comunicazione decentralizzata e ottenere prestazioni superiori in ambienti ad alta densità rispetto alle tecniche esistenti.

Sayang Mu, Xiangyu Wu, Bo AnWed, 11 Ma🤖 cs.AI

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

Il paper introduce SPREAD, un framework per l'apprendimento per imitazione lifelong che utilizza la decomposizione ai valori singolari per allineare le rappresentazioni delle politiche in sottospazi a basso rango preservando la geometria intrinseca dei compiti, combinato con una strategia di distillazione guidata dalla confidenza, ottenendo così prestazioni all'avanguardia nel benchmark LIBERO mitigando l'oblio catastrofico.

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman MoghadamWed, 11 Ma🤖 cs.LG

Age-Related Differences in the Perception of Eye-Gaze from a Social Robot

Questo studio esamina come le differenze legate all'età influenzino la percezione dello sguardo deittico da parte di anziani e giovani nell'interazione con robot sociali, al fine di guidare la progettazione di segnali non verbali adattivi.

Lucas Morillo-Mendez, Martien G. S. Schrooten, Oscar Martinez MozosWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Il paper presenta Scale-Plan, un framework scalabile che combina modelli linguistici e pianificazione simbolica per generare rappresentazioni compatte di compiti multi-robot eterogenei, superando le limitazioni di allucinazione e scalabilità degli approcci esistenti attraverso la filtrazione delle informazioni irrilevanti e la validazione su un nuovo benchmark MAT2-THOR.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare

Questo lavoro presenta HMR-1, un sistema robotico di massaggio gerarchico basato su modelli linguistici visivi che, grazie al nuovo dataset multimodale MedMassage-12K, identifica con precisione i punti di agopuntura e pianifica traiettorie di controllo per applicazioni pratiche nella riabilitazione fisica.

Rongtao Xu, Mingming Yu, Xiaofeng Han, Yu Zhang, Kaiyi Hu, Zhe Feng, Zenghuang Fu, Changwei Wang, Weiliang Meng, Xiaopeng ZhangWed, 11 Ma💻 cs

← Precedente Successivo →