Task-Relevant and Irrelevant Region-Aware Augmentation for Generalizable Vision-Based Imitation Learning in Agricultural Manipulation

Il paper propone DRAIL, un framework di augmentation che separa le regioni visive rilevanti e irrilevanti per il compito, migliorando la generalizzazione dell'apprendimento per imitazione nella manipolazione agricola preservando le caratteristiche essenziali delle colture mentre randomizza gli sfondi variabili.

Shun Hattori, Hikaru Sasaki, Takumi Hachimine + 2 more2026-03-06💻 cs

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

Il paper presenta ReCouPLe, un framework leggero che utilizza rationales in linguaggio naturale per guidare l'apprendimento delle ricompense basato sulle preferenze, mitigando la confusione causale e migliorando significativamente la generalizzazione e le prestazioni delle politiche in nuovi compiti senza richiedere ulteriori dati o fine-tuning del modello linguistico.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

Beyond the Patch: Exploring Vulnerabilities of Visuomotor Policies via Viewpoint-Consistent 3D Adversarial Object

Questo lavoro propone un metodo di ottimizzazione di texture avversarie 3D, basato su rendering differenziabile e strategie di ottimizzazione come EOT e un curriculum da grezzo a fine, per identificare e sfruttare le vulnerabilità delle politiche visuomotorie robotiche sotto diverse angolazioni di visione, superando i limiti delle tradizionali patch 2D.

Chanmi Lee, Minsung Yoon, Woojae Kim + 2 more2026-03-06💻 cs

U-OBCA: Uncertainty-Aware Optimization-Based Collision Avoidance via Wasserstein Distributionally Robust Chance Constraints

Il paper presenta U-OBCA, un metodo di pianificazione di traiettorie che utilizza vincoli di probabilità distribuzionalmente robusti basati sulla distanza di Wasserstein per gestire le incertezze in modo efficace, evitando semplificazioni geometriche eccessive e riducendo la conservatività nelle collisioni tra robot e ostacoli poligonali.

Zehao Wang, Yuxuan Tang, Han Zhang + 2 more2026-03-06🔢 math

Integrated cooperative localization of heterogeneous measurement swarm: A unified data-driven method

Questo lavoro propone un metodo unificato basato sui dati per la localizzazione cooperativa di sciami eterogenei, che supera i limiti delle topologie di misura sparse e dirette sviluppando un stimatore adattivo per la localizzazione relativa e una strategia distribuita che garantisce la convergenza anche in condizioni topologiche debolmente connesse.

Kunrui Ze, Wei Wang, Guibin Sun + 3 more2026-03-06💻 cs

Observer Design for Augmented Reality-based Teleoperation of Soft Robots

Questo articolo presenta un'interfaccia di realtà aumentata basata su HoloLens 2 per la teleoperazione di robot morbidi, validata su un manipolatore pneumatico modulare, che dimostra come un osservatore basato su modelli fisici possa stimare con un errore del 5% la posizione del robot, facilitando l'interazione dell'operatore e l'integrazione nel ciclo di controllo.

Jorge Francisco García-Samartín, Iago López Pérez, Emirhan Yolcu + 2 more2026-03-06💻 cs

AIM-SLAM: Dense Monocular SLAM via Adaptive and Informative Multi-View Keyframe Prioritization with Foundation Model

Il paper presenta AIM-SLAM, un sistema SLAM monoculare denso che utilizza modelli fondazionali geometrici e un modulo SIGMA per la selezione adattiva di fotogrammi chiave basata su sovrapposizione volumetrica e guadagno informativo, ottenendo prestazioni all'avanguardia nel posizionamento e nella ricostruzione 3D.

Jinwoo Jeon, Dong-Uk Seo, Eungchang Mason Lee + 1 more2026-03-06💻 cs

SPIRIT: Perceptive Shared Autonomy for Robust Robotic Manipulation under Deep Learning Uncertainty

Il paper presenta SPIRIT, un sistema di autonomia condivisa percettiva che integra stime di incertezza derivanti da deep learning per regolare dinamicamente il livello di controllo tra manipolazione semi-autonoma e teleoperazione aptica, garantendo così operazioni robotiche robuste e sicure anche in presenza di fallimenti percettivi.

Jongseok Lee, Ribin Balachandran, Harsimran Singh + 6 more2026-03-06🤖 cs.AI

Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models

Il paper propone un framework adattivo per i modelli Vision-Language-Action che, ispirandosi alla cognizione umana, ottimizza l'allocazione delle risorse dinamicamente scegliendo tra agire, ragionare o astenersi in base alla complessità del compito, utilizzando con successo solo le embedding visive per rilevare tale complessità con elevata efficienza e affidabilità.

Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-06💻 cs