RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

Il paper presenta RL-100, un framework di apprendimento per rinforzo nel mondo reale basato su politiche visuo-motorie a diffusione, che unifica imitazione e rinforzo per ottenere un controllo robotico ad alta frequenza, stabile e robusto, raggiungendo il 100% di successo in 1000 episodi su otto compiti diversi e dimostrando capacità di adattamento zero-shot e few-shot in scenari dinamici complessi.

Kun Lei, Huanyu Li, Dongjie Yu, Zhenyu Wei, Lingxiao Guo, Zhennan Jiang, Ziyu Wang, Shiyu Liang, Huazhe XuWed, 11 Ma🤖 cs.AI

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

Il lavoro presenta FALCON, un nuovo paradigma che colma il divario di ragionamento spaziale nei modelli Vision-Language-Action integrando token 3D ricchi di informazioni geometriche direttamente nel modulo di azione, ottenendo così prestazioni all'avanguardia su numerosi compiti reali e simulati senza richiedere sensori specializzati o modifiche architetturali.

Zhengshen Zhang, Hao Li, Yalun Dai, Zhengbang Zhu, Lei Zhou, Chenchen Liu, Dong Wang, Francis E. H. Tay, Sijin Chen, Ziwei Liu, Yuxiao Liu, Xinghang Li, Pan ZhouWed, 11 Ma🤖 cs.AI

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

Questo articolo dimostra che il ri-pianificazione incrementale in ambienti dinamici può essere risolta più efficientemente trattando ogni richiesta come un problema indipendente utilizzando algoritmi di pianificazione quasi-sicuramente asintoticamente ottimali (ASAO), come EIT* e AORRTC, che trovano percorsi globali coerenti senza la necessità di aggiornare esplicitamente i piani esistenti.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. GammellWed, 11 Ma💻 cs

From Demonstrations to Safe Deployment: Path-Consistent Safety Filtering for Diffusion Policies

Il paper propone PACS, un metodo di filtraggio della sicurezza basato sulla consistenza del percorso che garantisce il rispetto dei vincoli di sicurezza in tempo reale senza degradare le prestazioni dei modelli di diffusione, mantenendo la coerenza con la distribuzione di addestramento e superando gli approcci reattivi tradizionali.

Ralf Römer, Julian Balletshofer, Jakob Thumm, Marco Pavone, Angela P. Schoellig, Matthias AlthoffWed, 11 Ma⚡ eess

Bootstrap Dynamic-Aware 3D Visual Representation for Scalable Robot Learning

Il paper introduce AFRO, un framework auto-supervisionato che apprende rappresentazioni 3D consapevoli della dinamica robotica senza supervisione sulle azioni o sulla ricostruzione geometrica, migliorando significativamente il successo nelle attività di manipolazione rispetto ai metodi di pre-addestramento esistenti.

Qiwei Liang, Boyang Cai, Minghao Lai, Sitong Zhuang, Tao Lin, Yan Qin, Yixuan Ye, Jiaming Liang, Renjing XuWed, 11 Ma💻 cs

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

Il paper presenta UniBYD, un framework unificato che supera i limiti dell'imitazione umana nelle manipolazioni robotiche combinando una rappresentazione morfologica unificata e un algoritmo di reinforcement learning dinamico per adattare le politiche di controllo alle diverse morfologie robotiche, ottenendo un miglioramento significativo delle prestazioni rispetto allo stato dell'arte.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Magnetically Driven Elastic Microswimmers: Exploiting Hysteretic Collapse for Autonomous Propulsion and Independent Control

Questo studio presenta un microsciatore elastico a tre sfere azionato magneticamente che sfrutta il collasso isterico reversibile per generare un movimento netto non reciproco a basso numero di Reynolds, consentendo il controllo indipendente di più microrobot tramite un unico campo magnetico e aprendo nuove prospettive per interventi medici microinvasivi.

Theo Lequy, Andreas M. MenzelWed, 11 Ma🔬 physics.app-ph

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

Il paper presenta AirPulse, un robot volante autonomo di 26 grammi ispirato alle farfalle che, grazie a un'architettura di controllo gerarchica e ali compliant, realizza per la prima volta un volo stabile e guidato in regime tailless a bassa frequenza, aprendo nuove prospettive per il monitoraggio ecologico e l'ispezione in spazi confinati.

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue ZhouWed, 11 Ma💻 cs

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Il paper introduce Pri4R, un approccio semplice ed efficace che potenzia i modelli Vision-Language-Action con una comprensione implicita delle dinamiche del mondo attraverso l'addestramento su rappresentazioni 4D privilegiate, migliorando significativamente le prestazioni nei compiti di manipolazione fisica senza aggiungere overhead computazionale durante l'inferenza.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong KimWed, 11 Ma🤖 cs.AI

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

Il paper introduce SPREAD, un framework per l'apprendimento per imitazione lifelong che utilizza la decomposizione ai valori singolari per allineare le rappresentazioni delle politiche in sottospazi a basso rango preservando la geometria intrinseca dei compiti, combinato con una strategia di distillazione guidata dalla confidenza, ottenendo così prestazioni all'avanguardia nel benchmark LIBERO mitigando l'oblio catastrofico.

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman MoghadamWed, 11 Ma🤖 cs.LG

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Il paper presenta Scale-Plan, un framework scalabile che combina modelli linguistici e pianificazione simbolica per generare rappresentazioni compatte di compiti multi-robot eterogenei, superando le limitazioni di allucinazione e scalabilità degli approcci esistenti attraverso la filtrazione delle informazioni irrilevanti e la validazione su un nuovo benchmark MAT2-THOR.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare

Questo lavoro presenta HMR-1, un sistema robotico di massaggio gerarchico basato su modelli linguistici visivi che, grazie al nuovo dataset multimodale MedMassage-12K, identifica con precisione i punti di agopuntura e pianifica traiettorie di controllo per applicazioni pratiche nella riabilitazione fisica.

Rongtao Xu, Mingming Yu, Xiaofeng Han, Yu Zhang, Kaiyi Hu, Zhe Feng, Zenghuang Fu, Changwei Wang, Weiliang Meng, Xiaopeng ZhangWed, 11 Ma💻 cs