cs.RO Arbeiten | Gist.Science

Quadrotor Navigation using Reinforcement Learning with Privileged Information

Diese Arbeit stellt eine Reinforcement-Learning-Methode für die Navigation von Quadrotoren vor, die mittels privilegierter Zeit-Ankunfts-Karten und einer neuen Verlustfunktion Hindernisse erfolgreich umfliegt und sich sowohl in Simulationen als auch in 20 erfolgreichen Außenflügen bei Geschwindigkeiten bis zu 4 m/s bewährt hat.

Jonathan Lee, Abhishek Rathod, Kshitij Goel + 2 more2026-03-06💻 cs

Responsibility and Engagement -- Evaluating Interactions in Social Robot Navigation

Diese Arbeit erweitert den bestehenden Verantwortlichkeits-Metriken-Rahmen für die soziale Roboternavigation durch die Einführung einer Zeitnormalisierung für die Konfliktentstehung und eines neuen Engagement-Metriks zur Erfassung der Konfliktintensivierung, um in simulierten Szenarien die Qualität und Voraussicht kooperativer Konfliktlösungen bewerten zu können.

Malte Probst, Raphael Wenzel, Monica Dasi2026-03-06💻 cs

Diffusion-Based Impedance Learning for Contact-Rich Manipulation Tasks

Die Arbeit stellt einen neuartigen Rahmen vor, der Diffusionsmodelle mit energieerhaltender Impedanzregelung verbindet, um durch das Lernen von Null-Kraft-Trajektorien aus Teleoperationsdaten kontaktreiche Manipulationsaufgaben wie das Einstecken von Stiften in Löcher mit hoher Präzision und Generalisierungsfähigkeit zu lösen.

Noah Geiger, Tamim Asfour, Neville Hogan + 1 more2026-03-06💻 cs

GUIDE: A Diffusion-Based Autonomous Robot Exploration Framework Using Global Graph Inference

Das Paper stellt GUIDE vor, ein neues Framework für die autonome Roboterkartierung, das durch die Kombination einer globalen Grapheninferenz mit einem Diffusions-basierten Entscheidungsmechanismus die Abdeckungsgeschwindigkeit in komplexen Innenräumen signifikant steigert und redundante Bewegungen reduziert.

Zijun Che, Yinghong Zhang, Shengyi Liang + 3 more2026-03-06💻 cs

Distant Object Localisation from Noisy Image Segmentation Sequences

Diese Arbeit stellt ein rechen-effizientes System zur 3D-Lokalisierung entfernter Objekte aus verrauschten Bildsegmentierungssequenzen vor, das entweder auf Multi-View-Triangulation oder Partikelfiltern basiert und sich besonders für die Überwachung von Waldbränden durch Drohnen eignet.

Julius Pesonen, Arno Solin, Eija Honkavaara2026-03-06💻 cs

In-Hand Manipulation of Articulated Tools with Dexterous Robot Hands with Sim-to-Real Transfer

Diese Arbeit stellt einen Ansatz vor, der eine simulationsbasierte Grundpolitik durch eine sensorgeführte Verfeinerung auf Basis von Hardware-Demonstrationen ergänzt, um eine robuste und generalisierende In-Hand-Manipulation von artikulierten Werkzeugen mit dexterous Robotergreifern im realen Einsatz zu ermöglichen.

Soofiyan Atar, Daniel Huang, Florian Richter + 1 more2026-03-06💻 cs

Ask, Reason, Assist: Robot Collaboration via Natural Language and Temporal Logic

Die Autoren stellen ein dezentrales Peer-to-Peer-Koordinationsprotokoll vor, das heterogene Roboterteams durch die Kombination von Large Language Models und Signal-Temporal-Logik befähigt, Konflikte autonom durch natürliche Sprachanfragen und logisch fundierte Hilfsangebote zu lösen, wodurch eine Leistung erreicht wird, die mit zentralen Baselines vergleichbar ist, ohne deren hohen Informationsbedarf.

Dan BW Choe, Sundhar Vinodh Sangeetha, Steven Emanuel + 3 more2026-03-06💻 cs

EgoTraj-Bench: Towards Robust Trajectory Prediction Under Ego-view Noisy Observations

Die Arbeit stellt EgoTraj-Bench, das erste reale Benchmark für robuste Trajektorienvorhersage unter verrauschten Ego-Beobachtungen, und das dazugehörige BiFlow-Modell vor, das durch gleichzeitiges Entroischen der Vergangenheit und Vorhersage der Zukunft sowie den EgoAnchor-Mechanismus signifikant robustere und genauere Ergebnisse erzielt.

Jiayi Liu, Jiaming Zhou, Ke Ye + 3 more2026-03-06💻 cs

Conflict-Based Search as a Protocol: A Multi-Agent Motion Planning Protocol for Heterogeneous Agents, Solvers, and Independent Tasks

Diese Arbeit stellt ein Protokoll vor, das Conflict-Based Search als zentrale Schnittstelle nutzt, um heterogene Roboter mit unterschiedlichen Einzelplanern (wie A*, RRT oder Reinforcement Learning) in einer gemeinsamen Umgebung kollisionsfrei zu koordinieren.

Rishi Veerapaneni, Alvin Tang, Haodong He + 9 more2026-03-06💻 cs

Seeing the Bigger Picture: 3D Latent Mapping for Mobile Manipulation Policy Learning

Die Arbeit stellt „Seeing the Bigger Picture" (SBP) vor, eine End-to-End-Lernmethode für mobile Manipulation, die durch die Nutzung einer 3D-Latenz-Karte als Langzeitgedächtnis und globalen Kontext eine überlegene räumliche und zeitliche reasoning im Vergleich zu rein bildbasierten Ansätzen ermöglicht.

Sunghwan Kim, Woojeh Chung, Zhirui Dai + 5 more2026-03-06💻 cs

MachaGrasp: Morphology-Aware Cross-Embodiment Dexterous Hand Articulation Generation for Grasping

MachaGrasp ist ein eigengrasp-basiertes, end-to-end Framework, das morphologiebewusste, dexterous Greifbewegungen für verschiedene Roboterhände generiert und dabei durch einen kinematikbewussten Verlust sowie Few-Shot-Anpassung hohe Erfolgsraten in Simulation und der realen Welt erreicht.

Heng Zhang, Kevin Yuchen Ma, Mike Zheng Shou + 2 more2026-03-06💻 cs

CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions

Die Arbeit stellt CBF-RL vor, ein Framework, das Control Barrier Functions direkt in das Reinforcement-Learning-Training integriert, um sichere Strategien zu erlernen, die auch ohne nachgeschaltete Online-Sicherheitsfilter robust in realen Anwendungen wie der Unitree G1-Humanoiden-Roboterplattform operieren können.

Lizhi Yang, Blake Werner, Massimiliano de Sa + 1 more2026-03-06💻 cs

Least Restrictive Hyperplane Control Barrier Functions

Diese Arbeit stellt Hyperplane Control Barrier Functions (H-CBFs) vor, die durch die Optimierung der Orientierung der trennenden Hyperebene weniger restriktive und dennoch sichere Steuerungen für dynamische Systeme ermöglichen als herkömmliche distanzbasierte Ansätze.

Mattias Trende, Petter Ögren2026-03-06💻 cs

Kinodynamic Task and Motion Planning using VLM-guided and Interleaved Sampling

Die vorgestellte Arbeit stellt einen kinodynamischen Task-and-Motion-Planer vor, der durch eine hybride Zustandsbaumdarstellung, die Validierung mittels physikalischer Simulation und die visuelle Rückverfolgung durch ein Vision-Language-Modell (VLM) die Erfolgsraten und Effizienz bei komplexen Langzeitplanungsproblemen im Vergleich zu bestehenden Methoden signifikant verbessert.

Minseo Kwon, Young J. Kim2026-03-06💻 cs

SpikeATac: A Multimodal Tactile Finger with Taxelized Dynamic Sensing for Dexterous Manipulation

Die Arbeit stellt SpikeATac vor, einen multimodalen taktilen Finger mit dynamischer PVDF- und statischer kapazitiver Sensorik, der in Kombination mit einem Reinforcement-Learning-Ansatz das bisher unerreichte In-Hand-Manipulieren zerbrechlicher Objekte durch einen dexterousen Roboterhand ermöglicht.

Eric T. Chang, Peter Ballentine, Zhanpeng He + 8 more2026-03-06💻 cs

Runge-Kutta Approximations for Direct Coning Compensation Applying Lie Theory

Diese Arbeit stellt eine neue Klasse von Konus-Kompensationsalgorithmen vor, die direkt aus klassischen Runge-Kutta-Integrationsroutinen abgeleitet werden und durch Lie-Theorie höhere Ordnungen ermöglichen, wobei ein einfacher Fall zu einem etablierten Algorithmus reduziert wird.

John A. Christian, Michael R. Walker, Wyatt Bridgman + 1 more2026-03-06💻 cs

ROVER: Regulator-Driven Robust Temporal Verification of Black-Box Robot Policies

Die Arbeit stellt ROVER vor, einen regulatorgesteuerten Ansatz zur robusten temporalen Verifizierung von Black-Box-Roboterpolitiken mittels Signal-Temporal-Logic, der durch gezieltes Nachtrainieren die Einhaltung temporaler Sicherheitsanforderungen in simulierten und realen Umgebungen signifikant verbessert.

Kristy Sakano, Jianyu An, Dinesh Manocha + 1 more2026-03-06💻 cs

Observer-Actor: Active Vision Imitation Learning with Sparse-View Gaussian Splatting

Das Paper stellt ObAct vor, ein Framework für aktives visuelles Imitationslernen, bei dem ein Roboterarm als Beobachter eine 3D-Gaussian-Splatting-Repräsentation erstellt und eine optimale Kameraposition einnimmt, um die Sichtbarkeit für den ausführenden Arm zu maximieren und so die Robustheit der Politik gegenüber Verdeckungen signifikant zu verbessern.

Yilong Wang, Cheng Qian, Ruomeng Fan + 1 more2026-03-06💻 cs

MarketGen: A Scalable Simulation Platform with Auto-Generated Embodied Supermarket Environments

Das Paper stellt MarketGen vor, eine skalierbare Simulationsplattform mit einem agentenbasierten, prozeduralen Inhaltsgenerierungsframework, das realistische Supermarktumgebungen erstellt und einen neuen Benchmark für die Bewertung von Embodied-AI-Agenten bei komplexen Aufgaben wie dem Kassenentladen und der Regalbestückung bietet.

Xu Hu, Yiyang Feng, Junran Peng + 7 more2026-03-06💻 cs

LAP: Fast LAtent Diffusion Planner for Autonomous Driving

Das Paper stellt LAP vor, einen Latent-Diffusions-Planer für autonomes Fahren, der durch die Planung in einem VAE-gelernten latenten Raum und einen einzelnen Denoising-Schritt sowohl die Inferenzgeschwindigkeit um das Zehnfache steigert als auch den State-of-the-Art auf dem nuPlan-Benchmark erreicht.

Jinhao Zhang, Wenlong Xia, Zhexuan Zhou + 3 more2026-03-06💻 cs

← Zurück Weiter →