cs.RO articoli | Gist.Science

Diffusion Policy through Conditional Proximal Policy Optimization

Il paper propone un metodo efficiente per addestrare politiche di diffusione in contesti di apprendimento per rinforzo on-policy, superando le sfide computazionali del calcolo della verosimiglianza attraverso un nuovo allineamento tra iterazione della politica e processo di diffusione, ottenendo prestazioni superiori e comportamenti multimodali su diversi benchmark.

Ben Liu, Shunpeng Yang, Hua Chen2026-03-06💻 cs

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Questo studio analizza i punti di forza e le debolezze dei dati per l'assistenza incorporata in scenari open-set, dimostrando che la generazione di dataset sintetici diversificati e multimodali è fondamentale per addestrare modelli in grado di generalizzare a nuovi comportamenti utente e configurazioni di compiti.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

Task-Relevant and Irrelevant Region-Aware Augmentation for Generalizable Vision-Based Imitation Learning in Agricultural Manipulation

Il paper propone DRAIL, un framework di augmentation che separa le regioni visive rilevanti e irrilevanti per il compito, migliorando la generalizzazione dell'apprendimento per imitazione nella manipolazione agricola preservando le caratteristiche essenziali delle colture mentre randomizza gli sfondi variabili.

Shun Hattori, Hikaru Sasaki, Takumi Hachimine + 2 more2026-03-06💻 cs

Hyperbolic Multiview Pretraining for Robotic Manipulation

Il paper presenta HyperMVP, un framework di preaddestramento autosupervisionato nello spazio iperbolico che, sfruttando un encoder GeoLink e il nuovo dataset 3D-MOV, supera i limiti delle rappresentazioni euclidee per migliorare la percezione spaziale e le prestazioni dei robot in compiti di manipolazione.

Jin Yang, Ping Wei, Yixin Chen2026-03-06💻 cs

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

Il paper presenta ReCouPLe, un framework leggero che utilizza rationales in linguaggio naturale per guidare l'apprendimento delle ricompense basato sulle preferenze, mitigando la confusione causale e migliorando significativamente la generalizzazione e le prestazioni delle politiche in nuovi compiti senza richiedere ulteriori dati o fine-tuning del modello linguistico.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory

Il paper propone VPWEM, una politica visuomotoria non markoviana che integra memoria di lavoro ed episodica tramite un compressore contestuale basato su Transformer, permettendo ai robot di gestire compiti a lungo termine con costi computazionali costanti e superando significativamente gli stati dell'arte su benchmark di manipolazione.

Yuheng Lei, Zhixuan Liang, Hongyuan Zhang + 1 more2026-03-06🤖 cs.AI

Beyond the Patch: Exploring Vulnerabilities of Visuomotor Policies via Viewpoint-Consistent 3D Adversarial Object

Questo lavoro propone un metodo di ottimizzazione di texture avversarie 3D, basato su rendering differenziabile e strategie di ottimizzazione come EOT e un curriculum da grezzo a fine, per identificare e sfruttare le vulnerabilità delle politiche visuomotorie robotiche sotto diverse angolazioni di visione, superando i limiti delle tradizionali patch 2D.

Chanmi Lee, Minsung Yoon, Woojae Kim + 2 more2026-03-06💻 cs

U-OBCA: Uncertainty-Aware Optimization-Based Collision Avoidance via Wasserstein Distributionally Robust Chance Constraints

Il paper presenta U-OBCA, un metodo di pianificazione di traiettorie che utilizza vincoli di probabilità distribuzionalmente robusti basati sulla distanza di Wasserstein per gestire le incertezze in modo efficace, evitando semplificazioni geometriche eccessive e riducendo la conservatività nelle collisioni tra robot e ostacoli poligonali.

Zehao Wang, Yuxuan Tang, Han Zhang + 2 more2026-03-06🔢 math

Integrated cooperative localization of heterogeneous measurement swarm: A unified data-driven method

Questo lavoro propone un metodo unificato basato sui dati per la localizzazione cooperativa di sciami eterogenei, che supera i limiti delle topologie di misura sparse e dirette sviluppando un stimatore adattivo per la localizzazione relativa e una strategia distribuita che garantisce la convergenza anche in condizioni topologiche debolmente connesse.

Kunrui Ze, Wei Wang, Guibin Sun + 3 more2026-03-06💻 cs

Person Detection and Tracking from an Overhead Crane LiDAR

Questo articolo presenta un dataset specifico per la rilevazione e il tracciamento di persone tramite LiDAR montato su gru a ponte, valutando l'adattamento di vari rilevatori 3D e algoritmi di tracciamento in un ambiente industriale per colmare il divario tra i dati di guida standard e la visione dall'alto.

Nilusha Jayawickrama, Henrik Toikka, Risto Ojala2026-03-06🤖 cs.LG

Observer Design for Augmented Reality-based Teleoperation of Soft Robots

Questo articolo presenta un'interfaccia di realtà aumentata basata su HoloLens 2 per la teleoperazione di robot morbidi, validata su un manipolatore pneumatico modulare, che dimostra come un osservatore basato su modelli fisici possa stimare con un errore del 5% la posizione del robot, facilitando l'interazione dell'operatore e l'integrazione nel ciclo di controllo.

Jorge Francisco García-Samartín, Iago López Pérez, Emirhan Yolcu + 2 more2026-03-06💻 cs

Direct Contact-Tolerant Motion Planning With Vision Language Models

Il paper propone un pianificatore di movimento diretto e tollerante al contatto (DCT) che integra modelli visione-linguaggio per la percezione e la navigazione in ambienti affollati, superando i limiti dei metodi esistenti grazie a una segmentazione intelligente degli ostacoli e a un'ottimizzazione diretta del controllo.

He Li, Jian Sun, Chengyang Li + 4 more2026-03-06💻 cs

CoIn3D: Revisiting Configuration-Invariant Multi-Camera 3D Object Detection

Il paper presenta CoIn3D, un framework generalizzabile per il rilevamento 3D di oggetti multi-camera che supera le difficoltà di trasferimento tra configurazioni diverse integrando esplicitamente le discrepanze degli prior spaziali attraverso la modulazione delle feature sensibile allo spazio e l'aumento dei dati orientato alla camera.

Zhaonian Kuang, Rui Ding, Haotian Wang + 3 more2026-03-06💻 cs

VinePT-Map: Pole-Trunk Semantic Mapping for Resilient Autonomous Robotics in Vineyards

Questo articolo presenta VinePT-Map, un framework di mappatura semantica che utilizza i tronchi e i pali di sostegno come punti di riferimento persistenti per garantire una localizzazione robotica resiliente e indipendente dalla stagione nei vigneti, superando le sfide poste dalla variabilità visiva e dalle strutture ripetitive.

Giorgio Audrito, Mauro Martini, Alessandro Navone + 2 more2026-03-06💻 cs

AIM-SLAM: Dense Monocular SLAM via Adaptive and Informative Multi-View Keyframe Prioritization with Foundation Model

Il paper presenta AIM-SLAM, un sistema SLAM monoculare denso che utilizza modelli fondazionali geometrici e un modulo SIGMA per la selezione adattiva di fotogrammi chiave basata su sovrapposizione volumetrica e guadagno informativo, ottenendo prestazioni all'avanguardia nel posizionamento e nella ricostruzione 3D.

Jinwoo Jeon, Dong-Uk Seo, Eungchang Mason Lee + 1 more2026-03-06💻 cs

GaussTwin: Unified Simulation and Correction with Gaussian Splatting for Robotic Digital Twins

Il paper presenta GaussTwin, un gemello digitale in tempo reale che unisce la dinamica basata sulla posizione, le aste di Cosserat e lo splatting gaussiano per colmare il divario tra realtà e simulazione, migliorando l'accuratezza del tracciamento e abilitando compiti di pianificazione robotica in ciclo chiuso.

Yichen Cai, Paul Jansonnie, Cristiana de Farias + 2 more2026-03-06💻 cs

SPIRIT: Perceptive Shared Autonomy for Robust Robotic Manipulation under Deep Learning Uncertainty

Il paper presenta SPIRIT, un sistema di autonomia condivisa percettiva che integra stime di incertezza derivanti da deep learning per regolare dinamicamente il livello di controllo tra manipolazione semi-autonoma e teleoperazione aptica, garantendo così operazioni robotiche robuste e sicure anche in presenza di fallimenti percettivi.

Jongseok Lee, Ribin Balachandran, Harsimran Singh + 6 more2026-03-06🤖 cs.AI

Decoupling Task and Behavior: A Two-Stage Reward Curriculum in Reinforcement Learning for Robotics

Questo articolo propone un curricolo di ricompensa a due stadi che disaccoppia gli obiettivi specifici del compito dai termini comportamentali, migliorando l'esplorazione e la stabilità dell'addestramento nel reinforcement learning per la robotica rispetto ai metodi tradizionali.

Kilian Freitag, Knut Åkesson, Morteza Haghir Chehreghani2026-03-06🤖 cs.LG

SeedPolicy: Horizon Scaling via Self-Evolving Diffusion Policy for Robot Manipulation

Il paper presenta SeedPolicy, un metodo di apprendimento per imitazione che integra il modulo SEGA nelle politiche di diffusione per superare i limiti temporali nella manipolazione robotica a lungo termine, ottenendo prestazioni superiori e una maggiore efficienza rispetto alle soluzioni esistenti.

Youqiang Gui, Yuxuan Zhou, Shen Cheng + 4 more2026-03-06💻 cs

Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models

Il paper propone un framework adattivo per i modelli Vision-Language-Action che, ispirandosi alla cognizione umana, ottimizza l'allocazione delle risorse dinamicamente scegliendo tra agire, ragionare o astenersi in base alla complessità del compito, utilizzando con successo solo le embedding visive per rilevare tale complessità con elevata efficienza e affidabilità.

Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-06💻 cs

← Precedente Successivo →