Interactive World Simulator for Robot Policy Training and Evaluation

Die Arbeit stellt den „Interactive World Simulator" vor, ein Framework, das auf Konsistenzmodellen basiert, um aus moderaten Roboterdatensätzen schnelle und physikalisch konsistente Weltmodelle zu erstellen, die sowohl das skalierbare Training von Roboterkontrollpolitiken als auch eine zuverlässige Evaluierung in der realen Welt ermöglichen.

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model

Das Paper stellt RAG-Driver vor, ein neuartiges, retrieval-augmentiertes multimodales Large-Language-Modell, das durch kontextbasiertes Lernen mit abgerufenen Expertenbeispielen hochleistungsfähige, erklärbare und generalisierbare autonome Fahrentscheidungen trifft, ohne dass nach dem Training weitere Anpassungen erforderlich sind.

Jianhao Yuan, Shuyang Sun, Daniel Omeiza, Bo Zhao, Paul Newman, Lars Kunze, Matthew Gadd2026-03-09🤖 cs.AI

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

Das Paper stellt FALCON vor, einen selbstüberwachten Vorab-Trainingsansatz für die UAV-Aktionserkennung, der durch objektspezifisches Masking und zukunftsorientierte Rekonstruktion die Dominanz von Hintergrundinformationen überwindet und so die Genauigkeit bei gleichzeitig schnellerer Inferenz im Vergleich zu überwachten Methoden signifikant verbessert.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

Integrated Hierarchical Decision-Making in Inverse Kinematic Planning and Control

Diese Arbeit stellt einen effizienten, nichtlinearen Optimierungsrahmen vor, der hierarchische Entscheidungsfindung durch die Nutzung der 0\ell_0-Norm nahtlos in die inverse Kinematik integriert, um komplexe Probleme wie die simultane Auswahl von Greifpunkten oder Endeffektorpositionen präzise und schnell zu lösen.

Kai Pfeiffer, Quan Zhang, Yuqing Chen, Gordon Boateng, Yuquan Wang, Vincent Bonnet, Aberrahmane Kheddar2026-03-09💻 cs

CAPS: Context-Aware Priority Sampling for Enhanced Imitation Learning in Autonomous Driving

Die vorgestellte Arbeit führt CAPS (Context-Aware Priority Sampling) ein, eine Methode, die mittels VQ-VAEs kontextsensitive Datencluster erstellt, um durch gezieltes Priorisieren seltener, wertvoller Beispiele die Effizienz und Generalisierungsfähigkeit von autonomen Fahrsystemen im CARLA-Simulator signifikant zu verbessern.

Hamidreza Mirkhani, Behzad Khamidehi, Ehsan Ahmadi, Mohammed Elmahgiubi, Weize Zhang, Fazel Arasteh, Umar Rajguru, Kasra Rezaee, Dongfeng Bai2026-03-09🤖 cs.LG

Whole-Body Model-Predictive Control of Legged Robots with MuJoCo

Die Arbeit demonstriert, dass ein einfacher iLQR-Ansatz mit MuJoCo-Dynamik und endlich-differenzierten Ableitungen eine überraschend effektive und echtzeitfähige Ganzkörper-Modellprädiktive Regelung für quadrupede und humanoide Roboter ermöglicht, die sich mit wenigen Sim-to-Real-Anpassungen erfolgreich auf reale Hardware übertragen lässt.

John Z. Zhang, Taylor A. Howell, Zeji Yi, Chaoyi Pan, Guanya Shi, Guannan Qu, Tom Erez, Yuval Tassa, Zachary Manchester2026-03-09💻 cs

Graph-based Online Lidar Odometry with Retrospective Map Refinement

Die vorgestellte Arbeit stellt eine graphbasierte Online-Lidar-Odometrie vor, die durch die Registrierung aktueller Scans gegen mehrere überlappende Subkarten und eine nachträgliche Verfeinerung der Kartenankerpunkte die Genauigkeit und Konsistenz im Vergleich zu herkömmlichen Scan-zu-Karte-Ansätzen signifikant verbessert, ohne dabei die Echtzeitfähigkeit zu beeinträchtigen.

Aaron Kurda, Simon Steuernagel, Marcus Baum2026-03-09💻 cs

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

Der Artikel stellt FindAnything vor, einen effizienten Open-World-Mapping-Framework, der durch die Aggregation von Vision-Language-Features auf Objektebene eine skalierbare, semantisch ausdrucksstarke und geometrisch präzise 3D-Kartierung für ressourcenbeschränkte Roboter in Echtzeit ermöglicht.

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI

ROS-related Robotic Systems Development with V-model-based Application of MeROS Metamodel

Dieses Papier stellt eine strukturierte Methodik vor, die das SysML-Metamodell MeROS mit dem V-Modell kombiniert, um die semantische Kohärenz und strukturelle Rückverfolgbarkeit bei der Entwicklung komplexer, ROS-basierter Robotersysteme im Rahmen des modellbasierten Systemsingenieurwesens (MBSE) zu gewährleisten.

Tomasz Winiarski, Jan Kaniuka, Daniel Giełdowski, Jakub Ostrysz, Krystian Radlak, Dmytro Kushnir2026-03-09💻 cs

Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL

Diese Arbeit stellt ein Student-Lehrer-Framework vor, das mittels multi-agenten-basiertem Reinforcement Learning einen adaptiven Lehrplan automatisch generiert, um autonome Fahrzeuge durch eine ausgewogene Progression von alltäglichen bis zu kritischen Verkehrsszenarien robuster und vielseitiger zu trainieren.

Ahmed Abouelazm, Johannes Ratz, Philip Schörner, J. Marius Zöllner2026-03-09🤖 cs.LG

Bridging Simulation and Usability: A User-Friendly Framework for Scenario Generation in CARLA

Die vorgestellte Arbeit stellt ein benutzerfreundliches, grafikbasiertes No-Code-Framework für die Szenariengenerierung in CARLA vor, das durch eine graphenbasierte Repräsentation und Unterstützung manueller sowie automatisierter Methoden die Zugänglichkeit der Simulationstests für autonome Fahrzeuge für ein breiteres Publikum ohne Programmierkenntnisse erhöht.

Ahmed Abouelazm, Mohammad Mahmoud, Conrad Walter, Oleksandr Shchetsura, Erne Hussong, Helen Gremmelmaier, J. Marius Zöllner2026-03-09💻 cs

VEGA: Electric Vehicle Navigation Agent via Physics-Informed Neural Operator and Proximal Policy Optimization

Das Paper stellt VEGA vor, ein adaptives Routensystem für Elektrofahrzeuge, das einen physik-informierten neuronalen Operator zur Parameterschätzung mit einem Proximal-Policy-Optimization-Agenten kombiniert, um energieeffiziente Routen und Ladestopps zu planen, die sich ohne Neukalibrierung auf verschiedene Netzwerke verallgemeinern lassen.

Hansol Lim, Minhyeok Im, Jonathan Boyack, Jee Won Lee, Jongseong Brad Choi2026-03-09🤖 cs.LG

Decision-Driven Semantic Object Exploration for Legged Robots via Confidence-Calibrated Perception and Topological Subgoal Selection

Diese Arbeit stellt einen visuellen Ansatz für die semantische Objekterkundung mit Laufrobotern vor, der durch vertrauenskalibrierte Wahrnehmung, ein wachsendes topologisches Gedächtnis und eine nutzungsorientierte Subziel-Auswahl robuste Entscheidungen in offenen Umgebungen ermöglicht, ohne auf dichte geometrische Rekonstruktionen angewiesen zu sein.

Guoyang Zhao, Yudong Li, Weiqing Qi, Kai Zhang, Bonan Liu, Kai Chen, Haoang Li, Jun Ma2026-03-09💻 cs