cs.RO articoli | Gist.Science

Vision-Augmented On-Track System Identification for Autonomous Racing via Attention-Based Priors and Iterative Neural Correction

Questo paper propone un innovativo sistema di identificazione per veicoli autonomi da corsa che combina una rete neurale leggera per stimare l'attrito stradale tramite visione, un modello S4 per catturare le dinamiche temporali residue e un algoritmo di ottimizzazione senza derivate per estrarre parametri fisici interpretabili, ottenendo così una convergenza più rapida e una maggiore precisione rispetto ai metodi tradizionali.

Zhiping Wu, Cheng Hu, Yiqin Wang, Lei Xie, Hongye SuWed, 11 Ma💻 cs

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Il paper propone un framework che distilla una politica esperta Conditional Flow Matching in una politica studentessa a singolo passo tramite Implicit Maximum Likelihood Estimation e una distanza di Chamfer bi-direzionale, permettendo di generare in tempo reale traiettorie multi-modali ad alta frequenza per il controllo robotico senza subire il collasso della distribuzione tipico dei metodi di accelerazione esistenti.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

Questo lavoro introduce l'Open-World Motion Forecasting, un nuovo paradigma che supera i limiti degli approcci chiusi permettendo ai veicoli autonomi di prevedere le traiettorie direttamente dalle immagini e di adattarsi continuamente a nuove classi di oggetti senza dimenticare quelle apprese in precedenza, grazie a un framework end-to-end che combina pseudo-etichettatura, modelli visione-linguaggio e strategie di replay innovative.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

Stein Variational Ergodic Surface Coverage with SE(3) Constraints

Il paper presenta un approccio basato sulla discesa del gradiente Stein variazionale (SVGD) precondizionata per la generazione di traiettorie ergodiche che coprono superfici 3D complesse rispettando i vincoli SE(3), superando le limitazioni dei metodi esistenti e dimostrando risultati superiori sia in simulazione che in esperimenti reali con robot.

Jiayun Li, Yufeng Jin, Sangli Teng, Dejian Gong, Georgia ChalvatzakiWed, 11 Ma💻 cs

SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments

Il paper presenta SEA-Nav, un framework di apprendimento per rinforzo che combina funzioni di barriera differenziabili, un meccanismo di replay adattivo e vincoli cinematici per permettere ai robot quadrupedi di navigare in modo sicuro e agile in ambienti densamente ostacolati con un tempo di addestramento di soli pochi minuti.

Shiyi Chen, Mingye Yang, Haiyan Mao, Jiaqi Zhang, Haiyi Liu, Shuheng He, Debing Zhang, Zihao Qiu, Chun ZhangWed, 11 Ma💻 cs

Receptogenesis in a Vascularized Robotic Embodiment

Questo articolo presenta un sistema robotico vascolarizzato in grado di generare hardware ex novo attraverso la ricostituzione dinamica dei materiali, dimostrando la "receptogenesi" in cui sensori vengono costruiti on-demand da riserve interne di fluidi per adattare le capacità del robot in tempo reale.

Kadri-Ann Pankratov, Leonid Zinatullin, Hans Priks, Adele Metsniit, Urmas Johanson, Tarmo Tamm, Alvo Aabloo, Edoardo Sinibaldi, Indrek MustWed, 11 Ma🔬 cond-mat.mtrl-sci

StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving

Il paper presenta StyleVLA, un modello Vision-Language-Action basato su Qwen3-VL-4B e arricchito da vincoli fisici, che supera i modelli proprietari più grandi generando traiettorie di guida autonome non solo sicure ma anche fisicamente plausibili e adattate a diversi stili di guida.

Yuan Gao, Dengyuan Hua, Mattia Piccinini, Finn Rasmus Schäfer, Korbinian Moller, Lin Li, Johannes BetzWed, 11 Ma💻 cs

Context-Nav: Context-Driven Exploration and Viewpoint-Aware 3D Spatial Reasoning for Instance Navigation

Il paper presenta Context-Nav, un approccio senza addestramento specifico che risolve la navigazione di istanze tramite descrizioni testuali lunghe integrando allineamenti testo-immagine per guidare l'esplorazione globale e un ragionamento spaziale 3D consapevole del punto di vista per verificare i candidati, ottenendo prestazioni all'avanguardia su InstanceNav e CoIN-Bench.

Won Shik Jang, Ue-Hwan KimWed, 11 Ma💻 cs

Beyond Short-Horizon: VQ-Memory for Robust Long-Horizon Manipulation in Non-Markovian Simulation Benchmarks

Il paper introduce RuleSafe, un nuovo benchmark di manipolazione articolata con compiti non-Markoviani a lungo termine, e propone VQ-Memory, una rappresentazione temporale strutturata basata su VQ-VAE che migliora significativamente il ragionamento e la pianificazione dei modelli robotici in scenari complessi.

Wang Honghui, Jing Zhi, Ao Jicong, Song Shiji, Li Xuelong, Huang Gao, Bai ChenjiaWed, 11 Ma💻 cs

NS-VLA: Towards Neuro-Symbolic Vision-Language-Action Models

Il paper propone NS-VLA, un nuovo framework neuro-simbolico per modelli Vision-Language-Action che, integrando un encoder simbolico, un solver e l'apprendimento per rinforzo online, supera i metodi precedenti in termini di efficienza dei dati, generalizzazione zero-shot e capacità di esplorazione nella manipolazione robotica.

Ziyue Zhu, Shangyang Wu, Shuai Zhao, Zhiqiu Zhao, Shengjie Li, Yi Wang, Fang Li, Haoran LuoWed, 11 Ma💻 cs

On the Cost of Evolving Task Specialization in Multi-Robot Systems

Lo studio dimostra che, in scenari di foraggiamento per sciami robotici con un budget di valutazione limitato, l'ottimizzazione evolutiva di comportamenti generalisti supera quella di controller specializzati, i quali falliscono nella cooperazione e risultano meno efficienti.

Paolo Leopardi, Heiko Hamann, Jonas Kuckling, Tanja Katharina KaiserWed, 11 Ma💻 cs

Trajectory Optimization for Self-Wrap-Aware Cable-Towed Planar Object Manipulation under Implicit Tension Constraints

Questo articolo propone un metodo di ottimizzazione della traiettoria per la manipolazione di oggetti planari trainati da cavi che integra implicitamente i vincoli di tensione e sfrutta l'avvolgimento autonomo del cavo attorno ai bordi dell'oggetto per modificare dinamicamente il canale di trasmissione delle forze.

Yu Li, Amin Fakhari, Hamid SadeghianWed, 11 Ma💻 cs

ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly

Il paper presenta ReTac-ACT, un modello di apprendimento per imitazione che fonde visione e tatto tramite un meccanismo di gating stato-dipendente e un obiettivo di ricostruzione tattile, ottenendo prestazioni superiori nel montaggio di precisione anche in condizioni di occlusione visiva e tolleranze industriali strette.

Minchi Ruan, LiangQing Zhou, Hongtong Li, Zongtao Wang, ZhaoMing Lu, Jianwei Zhang, Bin FangWed, 11 Ma💻 cs

SCDP: Learning Humanoid Locomotion from Partial Observations via Mixed-Observation Distillation

Il paper presenta SCDP, una strategia di apprendimento che utilizza modelli di diffusione addestrati su osservazioni parziali per distillare il controllo della locomozione umanoide da dati offline, permettendo a un robot reale di muoversi in modo robusto basandosi esclusivamente sui sensori di bordo senza necessità di stima esplicita dello stato.

Milo Carroll, Tianhu Peng, Lingfan Bao, Chengxu Zhou, Zhibin LiWed, 11 Ma🤖 cs.LG

Towards Terrain-Aware Safe Locomotion for Quadrupedal Robots Using Proprioceptive Sensing

Questo lavoro presenta un framework di stima e controllo sicuro per robot quadrupedi equipaggiati solo con sensori propriocettivi, che genera mappe del terreno e utilizza funzioni di barriera di controllo per garantire la locomozione sicura su terreni irregolari.

Peiyu Yang, Jiatao Ding, Wei Pan, Claudio Semini, Cosimo Della SantinaWed, 11 Ma💻 cs

A Generalized Voronoi Graph based Coverage Control Approach for Non-Convex Environment

Questo articolo propone un approccio di controllo per la copertura basato sul Grafico di Voronoi Generalizzato (GVG) per sistemi multi-robot in ambienti non convessi, che combina un algoritmo di bilanciamento del carico per l'allocazione ottimale dei robot in sottoregioni ponderate e un nuovo controller collaborativo per garantire una copertura efficiente con convergenza dimostrata.

Zuyi Guo, Ronghao Zheng, Meiqin Liu, Senlin ZhangWed, 11 Ma💻 cs

OTPL-VIO: Robust Visual-Inertial Odometry with Optimal Transport Line Association and Adaptive Uncertainty

Il paper presenta OTPL-VIO, un sistema di odometria visivo-inerziale stereo robusto che combina descrittori profondi senza addestramento per le linee con un'associazione basata sul trasporto ottimo e un pesamento adattivo dell'incertezza, migliorando significativamente accuratezza e stabilità in scenari a bassa texture e con variazioni di illuminazione.

Zikun Chen, Wentao Zhao, Yihe Niu, Tianchen Deng, Jingchuan WangWed, 11 Ma💻 cs

DRIFT: Dual-Representation Inter-Fusion Transformer for Automated Driving Perception with 4D Radar Point Clouds

Il paper presenta DRIFT, un modello basato su Transformer che utilizza un'architettura a doppio percorso per fondere efficacemente informazioni locali e globali dai punti cloud 4D dei radar, ottenendo prestazioni superiori nella rilevazione di oggetti e nella stima della strada libera rispetto ai metodi esistenti.

Siqi Pei, Andras Palffy, Dariu M. GavrilaWed, 11 Ma💻 cs

Robotic Scene Cloning:Advancing Zero-Shot Robotic Scene Adaptation in Manipulation via Visual Prompt Editing

Il paper propone Robotic Scene Cloning (RSC), un metodo innovativo che utilizza l'editing di prompt visivi per adattare le traiettorie robotiche a nuovi scenari in modo zero-shot, migliorando significativamente la generalizzazione delle politiche di manipolazione sia in ambienti simulati che reali.

Binyuan Huang, Yuqing Wen, Yucheng Zhao, Yaosi Hu, Tiancai Wang, Chang Wen Chen, Haoqiang Fan, Zhenzhong ChenWed, 11 Ma💻 cs

Efficient and robust control with spikes that constrain free energy

Il paper propone un nuovo framework di controllo spiking efficiente e robusto, ispirato al principio dell'energia libera, in cui i neuroni si attivano solo se riducono l'energia libera della loro rappresentazione interna, offrendo alte prestazioni e resilienza ai disturbi sia per applicazioni cognitive che per l'hardware neuromorfico.

André Urbano, Pablo Lanillos, Sander KeeminkWed, 11 Ma🧬 q-bio

← Precedente Successivo →