cs.RO papers | Gist.Science

NaviGait: Navigating Dynamically Feasible Gait Libraries using Deep Reinforcement Learning

NaviGait is een hiërarchisch framework dat deep reinforcement learning combineert met trajectoptimalisatie om robuuste en intuïtieve loopbewegingen voor bipedale robots te genereren door bestaande gaits uit een bibliotheek te selecteren en minimaal aan te passen, wat resulteert in snellere training en betere stabiliteit dan bestaande methoden.

Neil Janwani, Varun Madabushi, Maegan TuckerWed, 11 Ma💻 cs

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

Het paper introduceert RL-100, een robuust real-world reinforcement learning-framework dat diffusiebeleid combineert met PPO en consistentiedistillatie om robotmanipulatietaken met 100% succes en menselijke snelheid uit te voeren, zelfs onder dynamische veranderingen en zonder hertraining.

Kun Lei, Huanyu Li, Dongjie Yu, Zhenyu Wei, Lingxiao Guo, Zhennan Jiang, Ziyu Wang, Shiyu Liang, Huazhe XuWed, 11 Ma🤖 cs.AI

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

Dit paper introduceert FALCON, een nieuw paradigma dat rijke 3D-ruimtelijke tokens afgeleid van RGB-beelden injecteert in de actiehead van Vision-Language-Action-modellen om de ruimtelijke redenering te verbeteren en state-of-the-art prestaties te bereiken in zowel simulatie als real-world taken.

Zhengshen Zhang, Hao Li, Yalun Dai, Zhengbang Zhu, Lei Zhou, Chenchen Liu, Dong Wang, Francis E. H. Tay, Sijin Chen, Ziwei Liu, Yuxiao Liu, Xinghang Li, Pan ZhouWed, 11 Ma🤖 cs.AI

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

Dit paper weerlegt de aanname dat reactieve replanning noodzakelijkerwijs bestaande plannen moet bijwerken, en toont aan dat het gebruik van snelle, bijna-zeker asymptotisch optimale (ASAO) algoritmen een efficiëntere oplossing biedt door een reeks onafhankelijke planningsproblemen op te lossen in plaats van bestaande plannen te hergebruiken.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. GammellWed, 11 Ma💻 cs

SynHLMA:Synthesizing Hand Language Manipulation for Articulated Object with Discrete Human Object Interaction Representation

Dit paper introduceert SynHLMA, een nieuw raamwerk dat natuurlijke taalinstructies omzet in realistische handbewegingen voor het manipuleren van gearticuleerde objecten door middel van een discrete interactierepresentatie en een taalmodel, wat leidt tot superieure prestaties in het genereren, voorspellen en interpoleren van grijpsequenties voor toepassingen in robotica en virtuele realiteit.

Wang zhi, Yuyan Liu, Liu Liu, Li Zhang, Ruixuan Lu, Dan GuoWed, 11 Ma🤖 cs.AI

EgoMI: Learning Active Vision and Whole-Body Manipulation from Egocentric Human Demonstrations

EgoMI is een framework dat de kloof tussen mens en robot overbrugt door gesynchroniseerde hand- en hoofdtrajecten uit egocentrische demonstraties te gebruiken, waardoor een geheugenaugmentatiebeleid robuuste imitatieleer mogelijk maakt voor semi-humanoid robots met een bewegend camerahoofd.

Justin Yu, Yide Shentu, Di Wu, Pieter Abbeel, Ken Goldberg, Philipp WuWed, 11 Ma💻 cs

From Demonstrations to Safe Deployment: Path-Consistent Safety Filtering for Diffusion Policies

Dit artikel introduceert PACS, een veiligheidsfilter voor diffusie-beleid dat door middel van pad-consistente remming en bereikbaarheidsanalyse veilige, real-time robotcontrole garandeert zonder de prestaties te verminderen.

Ralf Römer, Julian Balletshofer, Jakob Thumm, Marco Pavone, Angela P. Schoellig, Matthias AlthoffWed, 11 Ma⚡ eess

Bootstrap Dynamic-Aware 3D Visual Representation for Scalable Robot Learning

Dit paper introduceert AFRO, een zelftoezichtend framework dat dynamische 3D-voorstellingen leert door generatieve diffusie en omgekeerde dynamica te combineren, waardoor robuustere robotmanipulatie wordt bereikt zonder expliciete reconstructie- of actielabels.

Qiwei Liang, Boyang Cai, Minghao Lai, Sitong Zhuang, Tao Lin, Yan Qin, Yixuan Ye, Jiaming Liang, Renjing XuWed, 11 Ma💻 cs

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

Dit paper introduceert UniBYD, een unificerend raamwerk dat dynamisch versterkend leren en een unificerende morfologische representatie combineert om robotmanipulatie te optimaliseren die is afgestemd op de fysieke kenmerken van diverse robothanden, waardoor de beperkingen van puur imiteren van menselijke demonstraties worden overwonnen en de prestaties aanzienlijk worden verbeterd.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Relative Localization System Design for SnailBot: A Modular Self-reconfigurable Robot

Dit artikel presenteert een ontwerp en implementatie van een relatieve localisatiesysteem voor SnailBot, een modulaire zelfreconstruerende robot, dat ArUco-markers, optische flow en IMU-gegevens fuseert voor robuuste positionering in realtime.

Shuhan Zhang, Tin Lun LamWed, 11 Ma⚡ eess

Magnetically Driven Elastic Microswimmers: Exploiting Hysteretic Collapse for Autonomous Propulsion and Independent Control

Dit artikel beschrijft een magnetisch aangedreven elastische microzwemmer die gebruikmaakt van hysteretische instorting voor niet-reciproque voortstuwing en onafhankelijke besturing van meerdere zwemmers via één extern magnetisch veld, wat veelbelovende toepassingen biedt voor micro-invasieve medische ingrepen.

Theo Lequy, Andreas M. MenzelWed, 11 Ma🔬 physics.app-ph

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

Dit artikel presenteert AirPulse, een 26-gram zware, vlinder-geïnspireerde robot die voor het eerst autonome, gesloten-lus besturing bereikt bij staartloze zweefvliegtuigen door biologische kenmerken zoals lage flapperfrequenties en een hiërarchisch besturingsarchitectuur te combineren.

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue ZhouWed, 11 Ma💻 cs

Reactive Slip Control in Multifingered Grasping: Hybrid Tactile Sensing and Internal-Force Optimization

Dit artikel presenteert een hybride aanpak die piezo-elektrische en piezoresistieve tastzintuigen combineert met een modelgebaseerde optimalisatie van interne krachten om slip in multifingerige robotgrepen binnen 50 milliseconden te detecteren en te corrigeren.

Théo Ayral, Saifeddine Aloui, Mathieu GrossardWed, 11 Ma⚡ eess

Multimodal Adversarial Quality Policy for Safe Grasping

Dit artikel introduceert MAQP, een multimodaal framework dat via een heterogene dubbel-vlekoptimalisatie en een gradiëntgebaseerde modaal-balanceringsstrategie veilige robotgrijpacties mogelijk maakt door de effectiviteit van adversariële patches voor zowel RGB- als dieptemodaliteiten te maximaliseren.

Kunlin Xie, Chenghao Li, Haolan Zhang, Nak Young ChongWed, 11 Ma💻 cs

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Pri4R is een effectieve methode die Vision-Language-Action-modellen een impliciet begrip van werelddynamiek bijbrengt door tijdens het trainen gebruik te maken van bevoorrechte 4D-informatie via een lichtgewicht punt-track-head, wat leidt tot aanzienlijk betere prestaties in complexe manipulatietaken zonder extra rekenlast tijdens het gebruik.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong KimWed, 11 Ma🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

Dit paper introduceert SPARC, een methode voor gedecentraliseerde multi-robot padplanning die een relationeel versterkt multi-head attention-mechanisme (RMHA) gebruikt om communicatie te optimaliseren op basis van ruimtelijke nabijheid, wat resulteert in aanzienlijk betere prestaties in dichtbevolkte omgevingen vergeleken met bestaande methoden.

Sayang Mu, Xiangyu Wu, Bo AnWed, 11 Ma🤖 cs.AI

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

Het artikel introduceert SPREAD, een nieuw raamwerk voor levenslang imitatieleer dat gebruikmaakt van subspace-representatiedistillatie en een op vertrouwen gebaseerde strategie om catastrofisch vergeten te voorkomen en state-of-the-art prestaties te bereiken door de geometrische structuur van taakrepresentaties te behouden.

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman MoghadamWed, 11 Ma🤖 cs.LG

Age-Related Differences in the Perception of Eye-Gaze from a Social Robot

Dit onderzoek onderzocht hoe leeftijd gerelateerde verschillen de perceptie van deictische blikken van sociale robots beïnvloeden, met als doel het ontwerp van adaptieve non-verbale signalen voor de interactie met ouderen te optimaliseren.

Lucas Morillo-Mendez, Martien G. S. Schrooten, Oscar Martinez MozosWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Het artikel introduceert Scale-Plan, een schaalbaar raamwerk dat grote taalmodellen combineert met gestructureerde grafzoekalgoritmen om irrelevante informatie te filteren en zo betrouwbare, langdurige taakplanning voor heterogene multi-robotteams mogelijk te maken, wat wordt gevalideerd met de nieuwe MAT2-THOR-benchmark.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare

Dit paper introduceert HMR-1, een hiërarchische massage-robotframework dat gebruikmaakt van vision-language-modellen en het nieuwe MedMassage-12K-dataset om acupunctuurpunten te lokaliseren en therapeutische massages in de gezondheidszorg uit te voeren.

Rongtao Xu, Mingming Yu, Xiaofeng Han, Yu Zhang, Kaiyi Hu, Zhe Feng, Zenghuang Fu, Changwei Wang, Weiliang Meng, Xiaopeng ZhangWed, 11 Ma💻 cs

← Vorige Volgende →