cs.RO Arbeiten | Gist.Science

NaviGait: Navigating Dynamically Feasible Gait Libraries using Deep Reinforcement Learning

Die Arbeit stellt NaviGait vor, ein hierarchisches Framework, das Trajektorienoptimierung mit Deep Reinforcement Learning kombiniert, um durch die Auswahl und minimale Anpassung von Gait-Bibliotheken robuste, intuitive und schnell trainierbare Laufsteuerungen für bipede Roboter zu erzeugen.

Neil Janwani, Varun Madabushi, Maegan TuckerWed, 11 Ma💻 cs

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

Das Paper stellt RL-100 vor, ein leistungsfähiges Reinforcement-Learning-Framework für Roboter, das durch die Kombination von Diffusion-Policies mit PPO und Konsistenz-Distillation in acht realen Aufgaben eine 100-prozentige Erfolgsrate erzielt und dabei menschliche Operateure in Geschwindigkeit und Robustheit übertrifft.

Kun Lei, Huanyu Li, Dongjie Yu, Zhenyu Wei, Lingxiao Guo, Zhennan Jiang, Ziyu Wang, Shiyu Liang, Huazhe XuWed, 11 Ma🤖 cs.AI

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

Die Arbeit stellt FALCON vor, ein neues Paradigma für Vision-Language-Action-Modelle, das durch die Integration von räumlichen Grundwissen aus 3D-Spatial-Foundation-Modellen in den Aktionskopf die Lücke zwischen 2D-Vision und 3D-Aktion schließt und damit in Simulationen sowie realen Umgebungen neue Maßstäbe in Bezug auf Generalisierung und Robustheit setzt.

Zhengshen Zhang, Hao Li, Yalun Dai, Zhengbang Zhu, Lei Zhou, Chenchen Liu, Dong Wang, Francis E. H. Tay, Sijin Chen, Ziwei Liu, Yuxiao Liu, Xinghang Li, Pan ZhouWed, 11 Ma🤖 cs.AI

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

Diese Arbeit widerlegt die Annahme, dass reaktives Neuplanen zwingend eine Aktualisierung bestehender Pläne erfordert, und zeigt, dass stattdessen eine Abfolge unabhängiger Probleme mit schnellen, fast sicher asymptotisch optimalen Algorithmen wie EIT* effizienter gelöst werden kann.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. GammellWed, 11 Ma💻 cs

SynHLMA:Synthesizing Hand Language Manipulation for Articulated Object with Discrete Human Object Interaction Representation

Die Arbeit stellt SynHLMA vor, ein neuartiges Framework, das mithilfe einer diskreten Darstellung und eines sprachbasierten Modells Hand-Manipulationssequenzen für artikulierte Objekte generiert, um natürliche Sprachanweisungen in realistische Greifbewegungen zu übersetzen.

Wang zhi, Yuyan Liu, Liu Liu, Li Zhang, Ruixuan Lu, Dan GuoWed, 11 Ma🤖 cs.AI

EgoMI: Learning Active Vision and Whole-Body Manipulation from Egocentric Human Demonstrations

Das Paper stellt EgoMI vor, ein Framework, das durch die Nachahmung synchronisierter Kopf- und Handbewegungen aus egozentrischen menschlichen Demonstrationen die Embodiment-Lücke überbrückt und so die robuste Imitationslernen auf halb-humanoiden Robotern mit aktiven Kameras ermöglicht.

Justin Yu, Yide Shentu, Di Wu, Pieter Abbeel, Ken Goldberg, Philipp WuWed, 11 Ma💻 cs

From Demonstrations to Safe Deployment: Path-Consistent Safety Filtering for Diffusion Policies

Die Arbeit stellt PACS vor, einen sicherheitsfilternden Ansatz für Diffusions-Policies, der durch pfadkonsistente Bremsmanöver und mengenbasierte Erreichbarkeitsanalysen formale Sicherheitsgarantien in dynamischen Umgebungen bietet, ohne dabei die Aufgabenerfolgsrate im Vergleich zu reaktiven Methoden wie Control Barrier Functions signifikant zu beeinträchtigen.

Ralf Römer, Julian Balletshofer, Jakob Thumm, Marco Pavone, Angela P. Schoellig, Matthias AlthoffWed, 11 Ma⚡ eess

Bootstrap Dynamic-Aware 3D Visual Representation for Scalable Robot Learning

Das Paper stellt AFRO vor, ein selbstüberwachtes Framework, das durch die Modellierung von Zustands-Aktions-Dynamiken in einem gemeinsamen latenten Raum ohne explizite geometrische Rekonstruktion oder Aktionsüberwachung dynamische Bewusstsein 3D-Repräsentationen lernt und so die Manipulationserfolgsraten von Robotern in simulierten und realen Umgebungen erheblich verbessert.

Qiwei Liang, Boyang Cai, Minghao Lai, Sitong Zhuang, Tao Lin, Yan Qin, Yixuan Ye, Jiaming Liang, Renjing XuWed, 11 Ma💻 cs

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

Das Paper stellt UniBYD vor, ein einheitliches Framework, das durch dynamisches Reinforcement Learning und eine morphologische Repräsentation Roboter-Manipulationsstrategien entwickelt, die über die reine Nachahmung menschlicher Demonstrationen hinausgehen und sich an diverse Roboter-Handkonfigurationen anpassen, was zu einer signifikanten Leistungssteigerung auf dem neu eingeführten UniManip-Benchmark führt.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Relative Localization System Design for SnailBot: A Modular Self-reconfigurable Robot

Diese Arbeit stellt ein modulares, auf ArUco-Markern, optischem Fluss und IMU-Daten basierendes Relativlokalisationssystem für den selbstrekonfigurierbaren Roboter SnailBot vor, das durch eine regelbasierte Sensorfusion eine robuste Echtzeitpositionierung für kollaborative Aufgaben ermöglicht.

Shuhan Zhang, Tin Lun LamWed, 11 Ma⚡ eess

Magnetically Driven Elastic Microswimmers: Exploiting Hysteretic Collapse for Autonomous Propulsion and Independent Control

Die Studie beschreibt einen magnetisch angetriebenen elastischen Mikroschwimmer, der durch hysteretischen Kollaps und nicht-reziproke Bewegung netten Vortrieb bei niedrigen Reynolds-Zahlen erzielt und es ermöglicht, mehrere Schwimmer gleichzeitig über ein einziges Magnetfeld unabhängig voneinander zu steuern.

Theo Lequy, Andreas M. MenzelWed, 11 Ma🔬 physics.app-ph

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

Das 26 Gramm schwere, schmetterlingsinspirierte Robotersystem „AirPulse" demonstriert erstmals den autonomen, geschlossenen Regelkreis-Flug einer schwanzlosen Plattform durch Nachahmung biologischer Flügelschläge und eine hierarchische Steuerungsarchitektur, die stabile Manöver in einem bisher kaum erforschten aerodynamischen Regime ermöglicht.

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue ZhouWed, 11 Ma💻 cs

Reactive Slip Control in Multifingered Grasping: Hybrid Tactile Sensing and Internal-Force Optimization

Diese Arbeit stellt einen hybriden lernbasierten und modellgestützten Ansatz vor, der multimodale Taktile Sensoren mit einer internen Kraftoptimierung kombiniert, um das Abrutschen von Objekten in multifingrigen Greifern durch eine geschlossene Regelkreisstabilisierung mit einer Gesamtverzögerung von unter 50 ms reaktiv zu verhindern.

Théo Ayral, Saifeddine Aloui, Mathieu GrossardWed, 11 Ma⚡ eess

Multimodal Adversarial Quality Policy for Safe Grasping

Die Arbeit stellt die Multimodal Adversarial Quality Policy (MAQP) vor, ein Framework zur sicheren visuellen Greifsteuerung von Robotern, das durch eine heterogene Dual-Patch-Optimierung und eine gradientenbasierte Modalitätsausgewogenheit die Sicherheitsrisiken von Deep-Learning-Modellen in der Mensch-Roboter-Interaktion effektiv reduziert.

Kunlin Xie, Chenghao Li, Haolan Zhang, Nak Young ChongWed, 11 Ma💻 cs

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Die Arbeit stellt Pri4R vor, eine einfache Methode, die Vision-Language-Action-Modelle durch das Training mit privilegierten 4D-Punktverläufen in die Lage versetzt, physikalische Welt-Dynamiken implizit zu erlernen und so die Leistung bei Manipulationsaufgaben ohne zusätzliche Inferenzkosten erheblich zu steigern.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong KimWed, 11 Ma🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

Die Arbeit stellt SPARC vor, ein dezentralisiertes Multi-Roboter-Pfadplanungssystem, das durch eine relationenverstärkte Multi-Head-Aufmerksamkeitsmechanik (RMHA) räumliche Nähe in die Kommunikation integriert und damit in überfüllten Umgebungen sowie bei der Generalisierung auf deutlich größere Roboterschwärme signifikant bessere Erfolgsraten erzielt als bestehende Methoden.

Sayang Mu, Xiangyu Wu, Bo AnWed, 11 Ma🤖 cs.AI

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

Die Arbeit stellt SPREAD vor, ein geometrieerhaltendes Framework für das lebenslange Imitationslernen, das durch subspace-basierte Distillation und eine vertrauensgesteuerte Strategie katastrophales Vergessen verhindert und gleichzeitig die Übertragung von Wissen sowie die Generalisierungsfähigkeit verbessert.

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman MoghadamWed, 11 Ma🤖 cs.LG

Age-Related Differences in the Perception of Eye-Gaze from a Social Robot

Diese Studie untersucht, wie sich altersbedingte Unterschiede in der Wahrnehmung von Blickkontakt bei der Interaktion mit sozialen Robotern auswirken, um die Gestaltung adaptiver nonverbaler Signale für ältere Menschen zu verbessern.

Lucas Morillo-Mendez, Martien G. S. Schrooten, Oscar Martinez MozosWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Die Arbeit stellt Scale-Plan vor, ein skalierbares Framework, das große Sprachmodelle nutzt, um aus natürlichen Anweisungen kompakte, aufgabenrelevante Darstellungen zu generieren und so die Planung für heterogene Multi-Roboter-Teams durch die Filterung irrelevanter Informationen effizienter und zuverlässiger zu gestalten.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare

Die Arbeit stellt HMR-1 vor, ein hierarchisches Massage-Robotersystem, das auf einem multimodalen Datensatz namens MedMassage-12K und feinabgestimmten Vision-Language-Modellen basiert, um präzise Akupunkturpunkterkennung und Bewegungssteuerung für die embodied Healthcare zu ermöglichen.

Rongtao Xu, Mingming Yu, Xiaofeng Han, Yu Zhang, Kaiyi Hu, Zhe Feng, Zenghuang Fu, Changwei Wang, Weiliang Meng, Xiaopeng ZhangWed, 11 Ma💻 cs

← Zurück Weiter →