SORS: A Modular, High-Fidelity Simulator for Soft Robots

Die Arbeit stellt SORS vor, einen modularen, energiebasierten Simulator auf Finite-Elemente-Basis, der durch die Integration von sequentieller quadratischer Programmierung für Kontakthandhabung eine hohe physikalische Genauigkeit bei der Simulation komplexer weicher Roboter in Multiphysik-Umgebungen ermöglicht und so die Lücke zwischen Simulation und Realität schließt.

Manuel Mekkattu, Mike Y. Michelis, Robert K. Katzschmann2026-03-09💻 cs

VISO: Robust Underwater Visual-Inertial-Sonar SLAM with Photometric Rendering for Dense 3D Reconstruction

Das Paper stellt VISO vor, ein robustes Unterwasser-SLAM-System, das Stereo-Kameras, IMU und 3D-Sonar fusioniert, um durch eine neuartige externe Kalibrierung und photometrische Rendering-Strategie präzise 6-DoF-Lokalisierung sowie eine Echtzeit-3D-Rekonstruktion mit hoher photometrischer Qualität zu ermöglichen.

Shu Pan, Simon Archieri, Ahmet Cinar, Jonatan Scharff Willners, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

(MGS)2^2-Net: Unifying Micro-Geometric Scale and Macro-Geometric Structure for Cross-View Geo-Localization

Die Arbeit stellt (MGS)2^2-Net vor, ein geometriebasiertes Framework, das durch die Kombination von Mikro-geometrischer Skalenanpassung und Makro-geometrischer Strukturfiltierung die Robustheit der cross-view Geo-Lokalisierung unter GNSS-verweigernden Bedingungen signifikant verbessert und damit neue State-of-the-Art-Ergebnisse auf gängigen Datensätzen erzielt.

Minglei Li, Mengfan He, Chunyu Li, Chao Chen, Xingyu Shao, Ziyang Meng2026-03-09💻 cs

APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots

Die Arbeit stellt APEX vor, ein auf Deep Reinforcement Learning basierendes System für humanoide Roboter, das durch eine generalisierte Ratchet-Fortschritts-Belohnung und eine distillierte Einheitsrichtlinie das sichere, zero-shot sim-to-real Überwinden von Plattformen ermöglicht, die höher sind als die Beinlänge des Roboters.

Yikai Wang, Tingxuan Leng, Changyi Lin, Shiqi Liu, Shir Simon, Bingqing Chen, Jonathan Francis, Ding Zhao2026-03-09💻 cs

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

Die Studie stellt MiDAS vor, ein quelloffenes, plattformunabhängiges System zur nicht-invasiven, zeitlich synchronisierten Erfassung multimodaler Daten für roboterassistierte minimalinvasive Chirurgie, das proprietäre Schnittstellen umgeht und durch die Bereitstellung annotierter Datensätze, einschließlich der ersten multimodalen Aufnahmen von Herniennaht-Übungen, die Reproduzierbarkeit der Forschung fördert.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

Beyond Imitation: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

Diese Arbeit stellt einen Reinforcement-Learning-basierten Sim-Real-Co-Training-Ansatz (RL-Co) für Vision-Language-Action-Modelle vor, der durch eine Kombination aus SFT-Warm-Start und simuliertem RL mit einer zusätzlichen Überwachungsverlustkomponente für reale Daten die Generalisierungsfähigkeit und die Erfolgsrate realer Roboter im Vergleich zu reinen SFT-Methoden signifikant verbessert.

Liangzhi Shi, Shuaihang Chen, Feng Gao, Yinuo Chen, Kang Chen, Tonghe Zhang, Hongzhi Zang, Weinan Zhang, Chao Yu, Yu Wang2026-03-09💻 cs

Learning Robust Control Policies for Inverted Pose on Miniature Blimp Robots

Die vorgestellte Arbeit entwickelt ein dreistufiges Framework, das auf einer kalibrierten 3D-Simulation, einem modifizierten TD3-Algorithmus mit Domänenrandomisierung und einer Abbildungsschicht basiert, um robuste Steuerungsstrategien für das Erreichen und Halten von invertierten Posen bei Miniatur-Luftschiffen zu erlernen und erfolgreich in der realen Welt einzusetzen.

Yuanlin Yang, Lin Hong, Fumin Zhang2026-03-09💻 cs

ProFocus: Proactive Perception and Focused Reasoning in Vision-and-Language Navigation

Der Artikel stellt ProFocus vor, ein trainingsfreies Framework für die visuell-sprachliche Navigation, das durch proaktive Wahrnehmung und fokussiertes Denken mittels LLM-VLM-Kollaboration sowie BD-MCTS redundanten Input vermeidet und auf den R2R- und REVERIE-Benchmarks neue Bestleistungen bei Zero-Shot-Methoden erzielt.

Wei Xue, Mingcheng Li, Xuecheng Wu, Jingqun Tang, Dingkang Yang, Lihua Zhang2026-03-09💻 cs

TEGA: A Tactile-Enhanced Grasping Assistant for Assistive Robotics via Sensor Fusion and Closed-Loop Haptic Feedback

Die Arbeit stellt TEGA vor, ein geschlossenes Assistenzsystem für die Teleoperation, das durch die Fusion von EMG-basierten Intent-zu-Kraft-Inferenzen und visuotaktilem Feedback über ein haptisches Weste die intuitive Kraftmodulation und Stabilität beim Greifen für Nutzer mit Oberkörperbehinderungen verbessert.

Hengxu You, Tianyu Zhou, Fang Xu, Kaleb Smith, Eric Jing Du2026-03-09💻 cs

From Decoupled to Coupled: Robustness Verification for Learning-based Keypoint Detection with Joint Specifications

Dieses Paper stellt den ersten gekoppelten Verifikationsrahmen für heatmap-basierte Schlüsselpunkt-Detektoren vor, der mittels eines gemischt-ganzzahligen linearen Programms (MILP) die gemeinsame Abweichung aller Schlüsselpunkte unter Berücksichtigung ihrer Interdependenzen formal verifiziert und damit robustere Garantien liefert als bisherige entkoppelte Ansätze.

Xusheng Luo, Changliu Liu2026-03-09🤖 cs.LG

RFM-HRI : A Multimodal Dataset of Medical Robot Failure, User Reaction and Recovery Preferences for Item Retrieval Tasks

Die Studie stellt den multimodalen RFM-HRI-Datensatz vor, der menschliche Reaktionen und Wiederherstellungspräferenzen bei Fehlern medizinischer Roboter während der Entnahme von Gegenständen erfasst, um die Grundlage für zuverlässigere Fehlererkennung und -behebung in sicherheitskritischen HRI-Szenarien zu schaffen.

Yashika Batra, Giuliano Pioldi, Promise Ekpo, Arman Sayatqyzy, Purnjay Maruur, Shalom Otieno, Kevin Ching, Angelique Taylor2026-03-09💻 cs