Learning Physical Systems: Symplectification via Gauge Fixing in Dirac Structures

Questo lavoro introduce le Presymplectification Networks (PSN), un nuovo framework che risolve il problema della degenerazione della forma simplettica nei sistemi meccanici vincolati e dissipativi, come i robot quadrupedi, mappandoli su una varietà di fase aumentata tramite strutture di Dirac per garantire la conservazione dell'energia e la stabilità nelle previsioni a lungo termine.

Aristotelis Papatheodorou, Pranav Vaidhyanathan, Natalia Ares + 1 more2026-03-06💻 cs

Walk Like Dogs: Learning Steerable Imitation Controllers for Legged Robots from Unlabeled Motion Data

Il paper presenta un framework di apprendimento per imitazione che, partendo da dati di movimento reali non etichettati, estrae automaticamente modalità comportamentali e transizioni per permettere a robot quadrupedi di eseguire locomozione steerabile e stilisticamente coerente senza necessità di etichettatura manuale o regole di commutazione predefinite.

Dongho Kang, Jin Cheng, Fatemeh Zargarbashi + 3 more2026-03-06💻 cs

Design and Experimental Validation of Sensorless 4-Channel Bilateral Teleoperation for Low-Cost Manipulators

Questo articolo presenta e convalida sperimentalmente un sistema di teleoperazione bilaterale a 4 canali senza sensori di forza per manipolatori a basso costo, dimostrando che tale approccio consente un'interazione stabile ad alta velocità e migliora significativamente l'apprendimento per imitazione fornendo dati di dimostrazione arricchiti da informazioni di forza.

Koki Yamane, Yunhan Li, Masashi Konosu + 4 more2026-03-06💻 cs

LHM-Humanoid: Learning a Unified Policy for Long-Horizon Humanoid Whole-Body Loco-Manipulation in Diverse Messy Environments

Il paper introduce LHM-Humanoid, un framework di apprendimento e benchmark che addestra un'unica politica end-to-end per il controllo olistico di humanoid in ambienti disordinati, permettendo loro di navigare, manipolare e trasportare oggetti in episodi lunghi e complessi senza reset, superando le prestazioni dei metodi precedenti grazie a una forte generalizzazione cross-scena.

Haozhuo Zhang, Jingkai Sun, Michele Caprio + 4 more2026-03-06💻 cs

Learning Agile Gate Traversal via Analytical Optimal Policy Gradient

Questo lavoro presenta un nuovo framework ibrido che combina il controllo predittivo basato su modello (MPC) con una rete neurale per l'aggiustamento adattivo online dei parametri, permettendo ai droni di attraversare con agilità e precisione cancelli stretti e di recuperare rapidamente da forti perturbazioni, superando i limiti dei metodi modulari tradizionali e dell'apprendimento per rinforzo end-to-end.

Tianchen Sun, Bingheng Wang, Nuthasith Gerdpratoom + 3 more2026-03-06💻 cs

Quadrotor Navigation using Reinforcement Learning with Privileged Information

Questo articolo presenta un metodo di navigazione per quadricotteri basato sull'apprendimento per rinforzo che, sfruttando informazioni privilegiate come le mappe del tempo di arrivo e una funzione di perdita specifica, supera le limitazioni delle tecniche precedenti nel superare grandi ostacoli, ottenendo un tasso di successo dell'86% in simulazione e validando il sistema in 20 voli reali senza collisioni.

Jonathan Lee, Abhishek Rathod, Kshitij Goel + 2 more2026-03-06💻 cs

In-Hand Manipulation of Articulated Tools with Dexterous Robot Hands with Sim-to-Real Transfer

Il paper presenta un approccio originale che combina una politica di apprendimento per rinforzo addestrata in simulazione con un affinamento guidato da sensori derivato da dimostrazioni hardware, consentendo una manipolazione robusta e adattiva di strumenti articolati da parte di mani robotiche dexterose con un efficace trasferimento simula-reale.

Soofiyan Atar, Daniel Huang, Florian Richter + 1 more2026-03-06💻 cs

Ask, Reason, Assist: Robot Collaboration via Natural Language and Temporal Logic

Il paper propone un protocollo di coordinamento peer-to-peer per team robotici eterogenei che, sfruttando l'integrazione tra Modelli Linguistici di grandi dimensioni e la Logica Temporale dei Segnali, permette ai robot di gestire conflitti imprevisti tramite richieste di aiuto in linguaggio naturale e selezione collaborativa degli assistenti, ottenendo prestazioni superiori alle euristiche tradizionali e paragonabili a quelle di un allocatore centralizzato senza richiedere informazioni globali.

Dan BW Choe, Sundhar Vinodh Sangeetha, Steven Emanuel + 3 more2026-03-06💻 cs

Conflict-Based Search as a Protocol: A Multi-Agent Motion Planning Protocol for Heterogeneous Agents, Solvers, and Independent Tasks

Questo lavoro dimostra come l'utilizzo della Conflict-Based Search come protocollo centrale permetta di coordinare in modo efficiente il movimento di agenti eterogenei con pianificatori indipendenti e diversi in ambienti condivisi, garantendo percorsi privi di collisioni indipendentemente dall'implementazione specifica dei singoli sistemi di pianificazione.

Rishi Veerapaneni, Alvin Tang, Haodong He + 9 more2026-03-06💻 cs

CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions

Il paper propone CBF-RL, un framework che integra le Funzioni di Barriera di Controllo (CBF) direttamente nell'addestramento del Reinforcement Learning per internalizzare i vincoli di sicurezza nella politica appresa, permettendo così un dispiegamento sicuro e robusto su robot reali senza la necessità di filtri di sicurezza in tempo reale.

Lizhi Yang, Blake Werner, Massimiliano de Sa + 1 more2026-03-06💻 cs