cs.RO Arbeiten | Gist.Science

Contact-Safe Reinforcement Learning with ProMP Reparameterization and Energy Awareness

Diese Arbeit stellt ein kontakt-sicheres Reinforcement-Learning-Framework vor, das Proximal Policy Optimization mit Bewegungsprimitiven und einem energiebewussten kartesischen Impedanzregler kombiniert, um robuste und sichere Manipulationsaufgaben in komplexen 3D-Umgebungen zu bewältigen.

Bingkun Huang, Yuhe Gong, Zewen Yang, Tianyu Ren, Luis Figueredo2026-03-09💻 cs

Symmetry-Breaking in Multi-Agent Navigation: Winding Number-Aware MPC with a Learned Topological Strategy

Die Arbeit stellt WNumMPC vor, eine hierarchische Navigationsmethode für Multi-Agenten-Systeme, die durch den Einsatz von Reinforcement Learning zur Vorhersage von Windungszahlen und dynamischen Gewichtungen symmetriebedingte Deadlocks in dichten Szenarien effektiv vermeidet und dabei eine robuste Sim-to-Real-Übertragung ermöglicht.

Tomoki Nakao, Kazumi Kasaura, Tadashi Kozuno2026-03-09💻 cs

Bi-AQUA: Bilateral Control-Based Imitation Learning for Underwater Robot Arms via Lighting-Aware Action Chunking with Transformers

Die Arbeit stellt Bi-AQUA vor, ein bahnbrechendes Framework für das unterwasserbasierte Imitationslernen von Roboterarmen, das durch die Integration von bilateralen Kontrollmechanismen und einer lichtbewussten Transformer-Architektur robuste Manipulationsaufgaben unter variierenden Beleuchtungsbedingungen ermöglicht.

Takeru Tsunoori, Masato Kobayashi, Yuki Uranishi2026-03-09💻 cs

EchoVLA: Synergistic Declarative Memory for VLA-Driven Mobile Manipulation

Das Paper stellt EchoVLA vor, ein Gedächtnis-fähiges Vision-Language-Action-Modell mit synergistischer deklarativer Erinnerung für mobile Manipulation, das durch eine neuartige Benchmark namens MoMani trainiert wurde und in Simulationen sowie realen Umgebungen signifikant bessere Ergebnisse als starke Baselines erzielt.

Min Lin, Xiwen Liang, Bingqian Lin, Liu Jingzhi, Zijian Jiao, Kehan Li, Yu Sun, Weijia Liufu, Yuhan Ma, Yuecheng Liu, Shen Zhao, Yuzheng Zhuang, Xiaodan Liang2026-03-09💻 cs

Safe Autonomous Lane Changing: Planning with Dynamic Risk Fields and Time-Varying Convex Space Generation

Diese Arbeit stellt einen neuartigen Planungsansatz für autonomes Spurwechseln vor, der dynamische Risikofelder mit zeitvariablen konvexen Freiräumen und einem eingeschränkten iLQR-Algorithmus kombiniert, um in komplexen Verkehrsszenarien sichere, effiziente und komfortable Trajektorien zu gewährleisten.

Yijun Lu, Zhihao Lin, Zhen Tian2026-03-09💻 cs

Dependent Reachable Sets for the Constant Bearing Pursuit Strategy

Diese Arbeit führt das Konzept der abhängigen erreichbaren Mengen für Zwei-Agenten-Szenarien ein, charakterisiert deren Geometrie am Beispiel der Konstanten-Bearing-Verfolgungsstrategie durch theoretische Grenzen und Optimierungsprobleme und validiert die Ergebnisse mittels Simulationen.

Venkata Ramana Makkapati, Tulasi Ram Vechalapu, Vinodhini Comandur, Seth Hutchinson2026-03-09🔢 math

XR-DT: Extended Reality-Enhanced Digital Twin for Safe Motion Planning via Human-Aware Model Predictive Path Integral Control

Diese Arbeit stellt XR-DT vor, ein Framework für Extended Reality und Digital Twins, das eine menschenbewusste Modellprädiktive Pfadintegral-Steuerung (HA-MPPI) mit einem Transformer-basierten Vorhersagemodell kombiniert, um sichere und effiziente Navigation von mobilen Robotern in gemeinsamen Arbeitsräumen zu ermöglichen.

Tianyi Wang, Jiseop Byeon, Ahmad Yehia, Yiming Xu, Jihyung Park, Tianyi Zeng, Sikai Chen, Ziran Wang, Junfeng Jiao, Christian Claudel2026-03-09🤖 cs.AI

Safe Model Predictive Diffusion with Shielding

Der Artikel stellt Safe Model Predictive Diffusion (Safe MPD) vor, einen trainingsfreien Diffusionsplaner, der durch die Integration eines Sicherheits-Shields während des Denoising-Prozesses kinodynamisch machbare und sichere Trajektorien für komplexe Robotersysteme erzeugt und dabei bestehende Sicherheitsstrategien in Bezug auf Erfolgsrate und Rechengeschwindigkeit übertrifft.

Taekyung Kim, Keyvan Majd, Hideki Okamoto, Bardh Hoxha, Dimitra Panagou, Georgios Fainekos2026-03-09💻 cs

SORS: A Modular, High-Fidelity Simulator for Soft Robots

Die Arbeit stellt SORS vor, einen modularen, energiebasierten Simulator auf Finite-Elemente-Basis, der durch die Integration von sequentieller quadratischer Programmierung für Kontakthandhabung eine hohe physikalische Genauigkeit bei der Simulation komplexer weicher Roboter in Multiphysik-Umgebungen ermöglicht und so die Lücke zwischen Simulation und Realität schließt.

Manuel Mekkattu, Mike Y. Michelis, Robert K. Katzschmann2026-03-09💻 cs

VISO: Robust Underwater Visual-Inertial-Sonar SLAM with Photometric Rendering for Dense 3D Reconstruction

Das Paper stellt VISO vor, ein robustes Unterwasser-SLAM-System, das Stereo-Kameras, IMU und 3D-Sonar fusioniert, um durch eine neuartige externe Kalibrierung und photometrische Rendering-Strategie präzise 6-DoF-Lokalisierung sowie eine Echtzeit-3D-Rekonstruktion mit hoher photometrischer Qualität zu ermöglichen.

Shu Pan, Simon Archieri, Ahmet Cinar, Jonatan Scharff Willners, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

InsSo3D: Inertial Navigation System and 3D Sonar SLAM for turbid environment inspection

Die Arbeit stellt InsSo3D vor, ein präzises und effizientes SLAM-System, das 3D-Sonar und ein Trägheitsnavigationssystem kombiniert, um auch in trüben Gewässern driftkorrigierte 3D-Karten und genaue Trajektorien für die Inspektion unterwasserstrukturen zu erzeugen.

Simon Archieri, Ahmet Cinar, Shu Pan, Jonatan Scharff Willners, Michele Grimaldi, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

(MGS) $^2$ -Net: Unifying Micro-Geometric Scale and Macro-Geometric Structure for Cross-View Geo-Localization

Die Arbeit stellt (MGS) $^2$ -Net vor, ein geometriebasiertes Framework, das durch die Kombination von Mikro-geometrischer Skalenanpassung und Makro-geometrischer Strukturfiltierung die Robustheit der cross-view Geo-Lokalisierung unter GNSS-verweigernden Bedingungen signifikant verbessert und damit neue State-of-the-Art-Ergebnisse auf gängigen Datensätzen erzielt.

Minglei Li, Mengfan He, Chunyu Li, Chao Chen, Xingyu Shao, Ziyang Meng2026-03-09💻 cs

APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots

Die Arbeit stellt APEX vor, ein auf Deep Reinforcement Learning basierendes System für humanoide Roboter, das durch eine generalisierte Ratchet-Fortschritts-Belohnung und eine distillierte Einheitsrichtlinie das sichere, zero-shot sim-to-real Überwinden von Plattformen ermöglicht, die höher sind als die Beinlänge des Roboters.

Yikai Wang, Tingxuan Leng, Changyi Lin, Shiqi Liu, Shir Simon, Bingqing Chen, Jonathan Francis, Ding Zhao2026-03-09💻 cs

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

Die Studie stellt MiDAS vor, ein quelloffenes, plattformunabhängiges System zur nicht-invasiven, zeitlich synchronisierten Erfassung multimodaler Daten für roboterassistierte minimalinvasive Chirurgie, das proprietäre Schnittstellen umgeht und durch die Bereitstellung annotierter Datensätze, einschließlich der ersten multimodalen Aufnahmen von Herniennaht-Übungen, die Reproduzierbarkeit der Forschung fördert.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

Beyond Imitation: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

Diese Arbeit stellt einen Reinforcement-Learning-basierten Sim-Real-Co-Training-Ansatz (RL-Co) für Vision-Language-Action-Modelle vor, der durch eine Kombination aus SFT-Warm-Start und simuliertem RL mit einer zusätzlichen Überwachungsverlustkomponente für reale Daten die Generalisierungsfähigkeit und die Erfolgsrate realer Roboter im Vergleich zu reinen SFT-Methoden signifikant verbessert.

Liangzhi Shi, Shuaihang Chen, Feng Gao, Yinuo Chen, Kang Chen, Tonghe Zhang, Hongzhi Zang, Weinan Zhang, Chao Yu, Yu Wang2026-03-09💻 cs

Learning Robust Control Policies for Inverted Pose on Miniature Blimp Robots

Die vorgestellte Arbeit entwickelt ein dreistufiges Framework, das auf einer kalibrierten 3D-Simulation, einem modifizierten TD3-Algorithmus mit Domänenrandomisierung und einer Abbildungsschicht basiert, um robuste Steuerungsstrategien für das Erreichen und Halten von invertierten Posen bei Miniatur-Luftschiffen zu erlernen und erfolgreich in der realen Welt einzusetzen.

Yuanlin Yang, Lin Hong, Fumin Zhang2026-03-09💻 cs

ROSER: Few-Shot Robotic Sequence Retrieval for Scalable Robot Learning

Das Paper stellt ROSER vor, ein leichtgewichtiges Few-Shot-Retrieval-Framework, das es ermöglicht, aus ungelabelten, kontinuierlichen Roboter-Interaktionsprotokollen mit nur wenigen Referenzbeispielen wiederverwendbare, aufgabenbezogene Trajektorien zu extrahieren und so die Datenknappheit für das Roboterlernen zu überwinden.

Zillur Rahman, Eddison Pham, Alejandro Daniel Noel, Cristian Meo2026-03-09💻 cs

An Embodied Companion for Visual Storytelling

Die Arbeit stellt „Companion" vor, ein robotisches Zeichensystem, das durch die Integration von Large Language Models und Echtzeit-Interaktion den Menschen wieder in den kreativen Prozess einbindet und so eine synergistische, bidirektionale Zusammenarbeit für das visuelle Geschichtenerzählen ermöglicht, die von Experten als ästhetisch eigenständig und ausstellungsfähig bestätigt wurde.

Patrick Tresset, Markus Wulfmeier2026-03-09🤖 cs.AI

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

Das Paper stellt RoboLayout vor, eine Erweiterung von LayoutVLM, die durch die Integration expliziter Erreichbarkeitsbeschränkungen und einer lokalen Verfeinerung differenzierbare 3D-Layouts für embodied Agents generiert, die sowohl semantisch kohärent als auch physisch für diverse Agenten wie Roboter oder Menschen navigierbar und handhabbar sind.

Ali Shamsaddinlou2026-03-09🤖 cs.AI

ProFocus: Proactive Perception and Focused Reasoning in Vision-and-Language Navigation

Der Artikel stellt ProFocus vor, ein trainingsfreies Framework für die visuell-sprachliche Navigation, das durch proaktive Wahrnehmung und fokussiertes Denken mittels LLM-VLM-Kollaboration sowie BD-MCTS redundanten Input vermeidet und auf den R2R- und REVERIE-Benchmarks neue Bestleistungen bei Zero-Shot-Methoden erzielt.

Wei Xue, Mingcheng Li, Xuecheng Wu, Jingqun Tang, Dingkang Yang, Lihua Zhang2026-03-09💻 cs

← Zurück Weiter →

cs.RO