Symmetry-Breaking in Multi-Agent Navigation: Winding Number-Aware MPC with a Learned Topological Strategy

Die Arbeit stellt WNumMPC vor, eine hierarchische Navigationsmethode für Multi-Agenten-Systeme, die durch den Einsatz von Reinforcement Learning zur Vorhersage von Windungszahlen und dynamischen Gewichtungen symmetriebedingte Deadlocks in dichten Szenarien effektiv vermeidet und dabei eine robuste Sim-to-Real-Übertragung ermöglicht.

Tomoki Nakao, Kazumi Kasaura, Tadashi Kozuno2026-03-09💻 cs

Bi-AQUA: Bilateral Control-Based Imitation Learning for Underwater Robot Arms via Lighting-Aware Action Chunking with Transformers

Die Arbeit stellt Bi-AQUA vor, ein bahnbrechendes Framework für das unterwasserbasierte Imitationslernen von Roboterarmen, das durch die Integration von bilateralen Kontrollmechanismen und einer lichtbewussten Transformer-Architektur robuste Manipulationsaufgaben unter variierenden Beleuchtungsbedingungen ermöglicht.

Takeru Tsunoori, Masato Kobayashi, Yuki Uranishi2026-03-09💻 cs

EchoVLA: Synergistic Declarative Memory for VLA-Driven Mobile Manipulation

Das Paper stellt EchoVLA vor, ein Gedächtnis-fähiges Vision-Language-Action-Modell mit synergistischer deklarativer Erinnerung für mobile Manipulation, das durch eine neuartige Benchmark namens MoMani trainiert wurde und in Simulationen sowie realen Umgebungen signifikant bessere Ergebnisse als starke Baselines erzielt.

Min Lin, Xiwen Liang, Bingqian Lin, Liu Jingzhi, Zijian Jiao, Kehan Li, Yu Sun, Weijia Liufu, Yuhan Ma, Yuecheng Liu, Shen Zhao, Yuzheng Zhuang, Xiaodan Liang2026-03-09💻 cs

XR-DT: Extended Reality-Enhanced Digital Twin for Safe Motion Planning via Human-Aware Model Predictive Path Integral Control

Diese Arbeit stellt XR-DT vor, ein Framework für Extended Reality und Digital Twins, das eine menschenbewusste Modellprädiktive Pfadintegral-Steuerung (HA-MPPI) mit einem Transformer-basierten Vorhersagemodell kombiniert, um sichere und effiziente Navigation von mobilen Robotern in gemeinsamen Arbeitsräumen zu ermöglichen.

Tianyi Wang, Jiseop Byeon, Ahmad Yehia, Yiming Xu, Jihyung Park, Tianyi Zeng, Sikai Chen, Ziran Wang, Junfeng Jiao, Christian Claudel2026-03-09🤖 cs.AI

Safe Model Predictive Diffusion with Shielding

Der Artikel stellt Safe Model Predictive Diffusion (Safe MPD) vor, einen trainingsfreien Diffusionsplaner, der durch die Integration eines Sicherheits-Shields während des Denoising-Prozesses kinodynamisch machbare und sichere Trajektorien für komplexe Robotersysteme erzeugt und dabei bestehende Sicherheitsstrategien in Bezug auf Erfolgsrate und Rechengeschwindigkeit übertrifft.

Taekyung Kim, Keyvan Majd, Hideki Okamoto, Bardh Hoxha, Dimitra Panagou, Georgios Fainekos2026-03-09💻 cs

SORS: A Modular, High-Fidelity Simulator for Soft Robots

Die Arbeit stellt SORS vor, einen modularen, energiebasierten Simulator auf Finite-Elemente-Basis, der durch die Integration von sequentieller quadratischer Programmierung für Kontakthandhabung eine hohe physikalische Genauigkeit bei der Simulation komplexer weicher Roboter in Multiphysik-Umgebungen ermöglicht und so die Lücke zwischen Simulation und Realität schließt.

Manuel Mekkattu, Mike Y. Michelis, Robert K. Katzschmann2026-03-09💻 cs

VISO: Robust Underwater Visual-Inertial-Sonar SLAM with Photometric Rendering for Dense 3D Reconstruction

Das Paper stellt VISO vor, ein robustes Unterwasser-SLAM-System, das Stereo-Kameras, IMU und 3D-Sonar fusioniert, um durch eine neuartige externe Kalibrierung und photometrische Rendering-Strategie präzise 6-DoF-Lokalisierung sowie eine Echtzeit-3D-Rekonstruktion mit hoher photometrischer Qualität zu ermöglichen.

Shu Pan, Simon Archieri, Ahmet Cinar, Jonatan Scharff Willners, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

(MGS)2^2-Net: Unifying Micro-Geometric Scale and Macro-Geometric Structure for Cross-View Geo-Localization

Die Arbeit stellt (MGS)2^2-Net vor, ein geometriebasiertes Framework, das durch die Kombination von Mikro-geometrischer Skalenanpassung und Makro-geometrischer Strukturfiltierung die Robustheit der cross-view Geo-Lokalisierung unter GNSS-verweigernden Bedingungen signifikant verbessert und damit neue State-of-the-Art-Ergebnisse auf gängigen Datensätzen erzielt.

Minglei Li, Mengfan He, Chunyu Li, Chao Chen, Xingyu Shao, Ziyang Meng2026-03-09💻 cs

APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots

Die Arbeit stellt APEX vor, ein auf Deep Reinforcement Learning basierendes System für humanoide Roboter, das durch eine generalisierte Ratchet-Fortschritts-Belohnung und eine distillierte Einheitsrichtlinie das sichere, zero-shot sim-to-real Überwinden von Plattformen ermöglicht, die höher sind als die Beinlänge des Roboters.

Yikai Wang, Tingxuan Leng, Changyi Lin, Shiqi Liu, Shir Simon, Bingqing Chen, Jonathan Francis, Ding Zhao2026-03-09💻 cs

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

Die Studie stellt MiDAS vor, ein quelloffenes, plattformunabhängiges System zur nicht-invasiven, zeitlich synchronisierten Erfassung multimodaler Daten für roboterassistierte minimalinvasive Chirurgie, das proprietäre Schnittstellen umgeht und durch die Bereitstellung annotierter Datensätze, einschließlich der ersten multimodalen Aufnahmen von Herniennaht-Übungen, die Reproduzierbarkeit der Forschung fördert.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

Beyond Imitation: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

Diese Arbeit stellt einen Reinforcement-Learning-basierten Sim-Real-Co-Training-Ansatz (RL-Co) für Vision-Language-Action-Modelle vor, der durch eine Kombination aus SFT-Warm-Start und simuliertem RL mit einer zusätzlichen Überwachungsverlustkomponente für reale Daten die Generalisierungsfähigkeit und die Erfolgsrate realer Roboter im Vergleich zu reinen SFT-Methoden signifikant verbessert.

Liangzhi Shi, Shuaihang Chen, Feng Gao, Yinuo Chen, Kang Chen, Tonghe Zhang, Hongzhi Zang, Weinan Zhang, Chao Yu, Yu Wang2026-03-09💻 cs

Learning Robust Control Policies for Inverted Pose on Miniature Blimp Robots

Die vorgestellte Arbeit entwickelt ein dreistufiges Framework, das auf einer kalibrierten 3D-Simulation, einem modifizierten TD3-Algorithmus mit Domänenrandomisierung und einer Abbildungsschicht basiert, um robuste Steuerungsstrategien für das Erreichen und Halten von invertierten Posen bei Miniatur-Luftschiffen zu erlernen und erfolgreich in der realen Welt einzusetzen.

Yuanlin Yang, Lin Hong, Fumin Zhang2026-03-09💻 cs

ProFocus: Proactive Perception and Focused Reasoning in Vision-and-Language Navigation

Der Artikel stellt ProFocus vor, ein trainingsfreies Framework für die visuell-sprachliche Navigation, das durch proaktive Wahrnehmung und fokussiertes Denken mittels LLM-VLM-Kollaboration sowie BD-MCTS redundanten Input vermeidet und auf den R2R- und REVERIE-Benchmarks neue Bestleistungen bei Zero-Shot-Methoden erzielt.

Wei Xue, Mingcheng Li, Xuecheng Wu, Jingqun Tang, Dingkang Yang, Lihua Zhang2026-03-09💻 cs