cs.RO Arbeiten | Gist.Science

SORS: A Modular, High-Fidelity Simulator for Soft Robots

Die Arbeit stellt SORS vor, einen modularen, energiebasierten Simulator auf Finite-Elemente-Basis, der durch die Integration von sequentieller quadratischer Programmierung für Kontakthandhabung eine hohe physikalische Genauigkeit bei der Simulation komplexer weicher Roboter in Multiphysik-Umgebungen ermöglicht und so die Lücke zwischen Simulation und Realität schließt.

Manuel Mekkattu, Mike Y. Michelis, Robert K. Katzschmann2026-03-09💻 cs

VISO: Robust Underwater Visual-Inertial-Sonar SLAM with Photometric Rendering for Dense 3D Reconstruction

Das Paper stellt VISO vor, ein robustes Unterwasser-SLAM-System, das Stereo-Kameras, IMU und 3D-Sonar fusioniert, um durch eine neuartige externe Kalibrierung und photometrische Rendering-Strategie präzise 6-DoF-Lokalisierung sowie eine Echtzeit-3D-Rekonstruktion mit hoher photometrischer Qualität zu ermöglichen.

Shu Pan, Simon Archieri, Ahmet Cinar, Jonatan Scharff Willners, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

InsSo3D: Inertial Navigation System and 3D Sonar SLAM for turbid environment inspection

Die Arbeit stellt InsSo3D vor, ein präzises und effizientes SLAM-System, das 3D-Sonar und ein Trägheitsnavigationssystem kombiniert, um auch in trüben Gewässern driftkorrigierte 3D-Karten und genaue Trajektorien für die Inspektion unterwasserstrukturen zu erzeugen.

Simon Archieri, Ahmet Cinar, Shu Pan, Jonatan Scharff Willners, Michele Grimaldi, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

(MGS) $^2$ -Net: Unifying Micro-Geometric Scale and Macro-Geometric Structure for Cross-View Geo-Localization

Die Arbeit stellt (MGS) $^2$ -Net vor, ein geometriebasiertes Framework, das durch die Kombination von Mikro-geometrischer Skalenanpassung und Makro-geometrischer Strukturfiltierung die Robustheit der cross-view Geo-Lokalisierung unter GNSS-verweigernden Bedingungen signifikant verbessert und damit neue State-of-the-Art-Ergebnisse auf gängigen Datensätzen erzielt.

Minglei Li, Mengfan He, Chunyu Li, Chao Chen, Xingyu Shao, Ziyang Meng2026-03-09💻 cs

APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots

Die Arbeit stellt APEX vor, ein auf Deep Reinforcement Learning basierendes System für humanoide Roboter, das durch eine generalisierte Ratchet-Fortschritts-Belohnung und eine distillierte Einheitsrichtlinie das sichere, zero-shot sim-to-real Überwinden von Plattformen ermöglicht, die höher sind als die Beinlänge des Roboters.

Yikai Wang, Tingxuan Leng, Changyi Lin, Shiqi Liu, Shir Simon, Bingqing Chen, Jonathan Francis, Ding Zhao2026-03-09💻 cs

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

Die Studie stellt MiDAS vor, ein quelloffenes, plattformunabhängiges System zur nicht-invasiven, zeitlich synchronisierten Erfassung multimodaler Daten für roboterassistierte minimalinvasive Chirurgie, das proprietäre Schnittstellen umgeht und durch die Bereitstellung annotierter Datensätze, einschließlich der ersten multimodalen Aufnahmen von Herniennaht-Übungen, die Reproduzierbarkeit der Forschung fördert.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

Beyond Imitation: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

Diese Arbeit stellt einen Reinforcement-Learning-basierten Sim-Real-Co-Training-Ansatz (RL-Co) für Vision-Language-Action-Modelle vor, der durch eine Kombination aus SFT-Warm-Start und simuliertem RL mit einer zusätzlichen Überwachungsverlustkomponente für reale Daten die Generalisierungsfähigkeit und die Erfolgsrate realer Roboter im Vergleich zu reinen SFT-Methoden signifikant verbessert.

Liangzhi Shi, Shuaihang Chen, Feng Gao, Yinuo Chen, Kang Chen, Tonghe Zhang, Hongzhi Zang, Weinan Zhang, Chao Yu, Yu Wang2026-03-09💻 cs

Learning Robust Control Policies for Inverted Pose on Miniature Blimp Robots

Die vorgestellte Arbeit entwickelt ein dreistufiges Framework, das auf einer kalibrierten 3D-Simulation, einem modifizierten TD3-Algorithmus mit Domänenrandomisierung und einer Abbildungsschicht basiert, um robuste Steuerungsstrategien für das Erreichen und Halten von invertierten Posen bei Miniatur-Luftschiffen zu erlernen und erfolgreich in der realen Welt einzusetzen.

Yuanlin Yang, Lin Hong, Fumin Zhang2026-03-09💻 cs

ROSER: Few-Shot Robotic Sequence Retrieval for Scalable Robot Learning

Das Paper stellt ROSER vor, ein leichtgewichtiges Few-Shot-Retrieval-Framework, das es ermöglicht, aus ungelabelten, kontinuierlichen Roboter-Interaktionsprotokollen mit nur wenigen Referenzbeispielen wiederverwendbare, aufgabenbezogene Trajektorien zu extrahieren und so die Datenknappheit für das Roboterlernen zu überwinden.

Zillur Rahman, Eddison Pham, Alejandro Daniel Noel, Cristian Meo2026-03-09💻 cs

An Embodied Companion for Visual Storytelling

Die Arbeit stellt „Companion" vor, ein robotisches Zeichensystem, das durch die Integration von Large Language Models und Echtzeit-Interaktion den Menschen wieder in den kreativen Prozess einbindet und so eine synergistische, bidirektionale Zusammenarbeit für das visuelle Geschichtenerzählen ermöglicht, die von Experten als ästhetisch eigenständig und ausstellungsfähig bestätigt wurde.

Patrick Tresset, Markus Wulfmeier2026-03-09🤖 cs.AI

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

Das Paper stellt RoboLayout vor, eine Erweiterung von LayoutVLM, die durch die Integration expliziter Erreichbarkeitsbeschränkungen und einer lokalen Verfeinerung differenzierbare 3D-Layouts für embodied Agents generiert, die sowohl semantisch kohärent als auch physisch für diverse Agenten wie Roboter oder Menschen navigierbar und handhabbar sind.

Ali Shamsaddinlou2026-03-09🤖 cs.AI

ProFocus: Proactive Perception and Focused Reasoning in Vision-and-Language Navigation

Der Artikel stellt ProFocus vor, ein trainingsfreies Framework für die visuell-sprachliche Navigation, das durch proaktive Wahrnehmung und fokussiertes Denken mittels LLM-VLM-Kollaboration sowie BD-MCTS redundanten Input vermeidet und auf den R2R- und REVERIE-Benchmarks neue Bestleistungen bei Zero-Shot-Methoden erzielt.

Wei Xue, Mingcheng Li, Xuecheng Wu, Jingqun Tang, Dingkang Yang, Lihua Zhang2026-03-09💻 cs

Digital-Twin Losses for Lane-Compliant Trajectory Prediction at Urban Intersections

Diese Arbeit stellt einen digitalen-Zwilling-gestützten V2X-Ansatz zur Vorhersage von Trajektorien an städtischen Kreuzungen vor, der durch eine neuartige „Twin Loss"-Funktion neben der Genauigkeit auch die Einhaltung von Verkehrsregeln und die Vermeidung von Kollisionen sicherstellt.

Kuo-Yi Chao, Erik Leo Haß, Melina Gegg, Jiajie Zhang, Ralph Raßhofer, Alois Christian Knoll2026-03-09💻 cs

TEGA: A Tactile-Enhanced Grasping Assistant for Assistive Robotics via Sensor Fusion and Closed-Loop Haptic Feedback

Die Arbeit stellt TEGA vor, ein geschlossenes Assistenzsystem für die Teleoperation, das durch die Fusion von EMG-basierten Intent-zu-Kraft-Inferenzen und visuotaktilem Feedback über ein haptisches Weste die intuitive Kraftmodulation und Stabilität beim Greifen für Nutzer mit Oberkörperbehinderungen verbessert.

Hengxu You, Tianyu Zhou, Fang Xu, Kaleb Smith, Eric Jing Du2026-03-09💻 cs

PRISM: Personalized Refinement of Imitation Skills for Manipulation via Human Instructions

Die Arbeit stellt PRISM vor, eine Methode, die Imitationslernen und verstärkendes Lernen durch nutzerdefinierte Anweisungen und menschliches Feedback kombiniert, um Roboter-Manipulationsfähigkeiten effizient zu verfeinern und an neue Zielkonfigurationen anzupassen.

Arnau Boix-Granell, Alberto San-Miguel-Tello, Magí Dalmau-Moreno, Néstor García2026-03-09🤖 cs.AI

Task Parameter Extrapolation via Learning Inverse Tasks from Forward Demonstrations

Diese Arbeit stellt ein neuartiges gemeinsames Lernverfahren vor, das durch die Umkehrung von Vorwärtsdemonstrationen in neuen Konfigurationen eine präzise und dateneffiziente Extrapolation von Roboterkompetenzen auf unbekannte Bedingungen ermöglicht und dabei diffusionbasierte Alternativen übertrifft.

Serdar Bahar, Fatih Dogangun, Matteo Saveriano, Yukie Nagai, Emre Ugur2026-03-09💻 cs

From Decoupled to Coupled: Robustness Verification for Learning-based Keypoint Detection with Joint Specifications

Dieses Paper stellt den ersten gekoppelten Verifikationsrahmen für heatmap-basierte Schlüsselpunkt-Detektoren vor, der mittels eines gemischt-ganzzahligen linearen Programms (MILP) die gemeinsame Abweichung aller Schlüsselpunkte unter Berücksichtigung ihrer Interdependenzen formal verifiziert und damit robustere Garantien liefert als bisherige entkoppelte Ansätze.

Xusheng Luo, Changliu Liu2026-03-09🤖 cs.LG

RACAS: Controlling Diverse Robots With a Single Agentic System

Die Studie stellt RACAS vor, ein roboteragnostisches Agentic-System, das mittels natürlicher Sprache und großer Sprachmodelle diverse Roboterplattformen ohne Anpassung des Quellcodes steuern kann und so die Hürden für die Prototypenentwicklung senkt.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

Control Lyapunov Functions for Underactuated Soft Robots

Diese Arbeit stellt ein allgemeines Regelungsframework vor, das durch die Formulierung einer schnell exponentiell stabilisierenden Control-Lyapunov-Funktion als konvexe Nebenbedingung die präzise Aufgabenraum-Regelung und -Verfolgung für unteraktuierte weiche Roboter unter Berücksichtigung von Aktorengrenzen und den vollen Systemdynamiken ermöglicht.

Huy Pham, Zach J. Patterson2026-03-09💻 cs

RFM-HRI : A Multimodal Dataset of Medical Robot Failure, User Reaction and Recovery Preferences for Item Retrieval Tasks

Die Studie stellt den multimodalen RFM-HRI-Datensatz vor, der menschliche Reaktionen und Wiederherstellungspräferenzen bei Fehlern medizinischer Roboter während der Entnahme von Gegenständen erfasst, um die Grundlage für zuverlässigere Fehlererkennung und -behebung in sicherheitskritischen HRI-Szenarien zu schaffen.

Yashika Batra, Giuliano Pioldi, Promise Ekpo, Arman Sayatqyzy, Purnjay Maruur, Shalom Otieno, Kevin Ching, Angelique Taylor2026-03-09💻 cs

← Zurück Weiter →

cs.RO