cs.RO articoli | Gist.Science

Systematic Evaluation of Novel View Synthesis for Video Place Recognition

Questo articolo presenta una valutazione sistematica dell'impatto delle viste sintetiche innovative sul riconoscimento dei luoghi nei video, dimostrando che l'aggiunta di tali viste migliora le statistiche di riconoscimento e che, per aggiunte più ampie, il numero di viste e il tipo di immagine sono fattori più critici rispetto alla magnitudine del cambiamento di prospettiva.

Muhammad Zawad Mahmud, Samiha Islam, Damian Lyons2026-03-09💻 cs

Improved hopping control on slopes for small robots using spring mass modeling

Questo lavoro presenta un metodo di controllo semplificato basato su un modello massa-molla che, regolando l'angolo di atterraggio e applicando una coppia correttiva, permette a piccoli robot saltatori di mantenere la stabilità su terreni in pendenza senza richiedere sensori o calcoli complessi.

Heston Roberts, Pronoy Sarker, Sm Ashikul Islam, Min Gyu Kim2026-03-09💻 cs

Iterative Convex Optimization with Control Barrier Functions for Obstacle Avoidance among Polytopes

Questo articolo propone un nuovo quadro iterativo di controllo predittivo basato su modelli (MPC) e funzioni di barriera di controllo (DCBF) che, sfruttando iperpiani di supporto derivati da calcoli esatti di punti più vicini tra poliedri, garantisce la convessità dell'ottimizzazione per una navigazione sicura e in tempo reale di robot poliedrici in ambienti con ostacoli poliedrici complessi.

Shuo Liu, Zhe Huang, Calin A. Belta2026-03-09💻 cs

FTSplat: Feed-forward Triangle Splatting Network

FTSplat è un framework feed-forward che genera istantaneamente superfici triangolari continue da immagini multi-vista, producendo modelli geometrici pronti per la simulazione senza richiedere ottimizzazione per scena.

Xiong Jinlin, Li Can, Shen Jiawei, Qi Zhigang, Sun Lei, Zhao Dongyang2026-03-09💻 cs

Swooper: Learning High-Speed Aerial Grasping With a Simple Gripper

Il paper presenta Swooper, un approccio basato sul reinforcement learning profondo che, grazie a una strategia di apprendimento in due fasi e un'architettura neurale leggera, permette a un drone quadrotore di eseguire prese aeree ad alta velocità con un semplice gripper commerciale, raggiungendo un tasso di successo dell'84% in scenari reali senza necessità di riaddestramento.

Ziken Huang, Xinze Niu, Bowen Chai, Renbiao Jin, Danping Zou2026-03-09💻 cs

How to Model Your Crazyflie Brushless

Questo lavoro presenta un modello dinamico accurato del nuovo Crazyflie Brushless, ne convalida l'efficacia attraverso simulazioni e test hardware, e ne dimostra l'utilità per l'apprendimento per rinforzo, permettendo il trasferimento di controllori acrobatici complessi dalla simulazione alla realtà.

Alexander Gräfe, Christoph Scherer, Wolfgang Hönig, Sebastian Trimpe2026-03-09💻 cs

PROBE: Probabilistic Occupancy BEV Encoding with Analytical Translation Robustness for 3D Place Recognition

Il paper presenta PROBE, un descrittore di riconoscimento dei luoghi basato su LiDAR privo di apprendimento che utilizza una codifica probabilistica dell'occupazione BEV e un'analisi matematica delle traslazioni continue per ottenere una robustezza superiore e una generalizzazione cross-sensore senza necessità di tuning specifico per dataset.

Jinseop Lee, Byoungho Lee, Gichul Yoo2026-03-09💻 cs

Proprioceptive Shape Estimation of Tensegrity Manipulators Using Energy Minimisation

Questo articolo dimostra che è possibile stimare la forma di un manipolatore a tensegrità su larga scala utilizzando esclusivamente i dati angolari di inclinazione provenienti da IMU integrati, ottenendo un'accuratezza del 2,1% della lunghezza totale sia in condizioni statiche che sotto disturbi esterni.

Tufail Ahmad Bhat, Shuhei Ikemoto2026-03-09💻 cs

HarvestFlex: Strawberry Harvesting via Vision-Language-Action Policy Adaptation in the Wild

Questo lavoro presenta il primo studio sul trasferimento di politiche visione-linguaggio-azione (VLA) per la raccolta di fragole in serra, dimostrando che un sistema end-to-end basato su visione RGB e 3,71 ore di dati teleoperati in realtà virtuale può raggiungere un tasso di successo del 74,0% con un tasso di danneggiamento del 4,1%.

Ziyang Zhao, Shuheng Wang, Zhonghua Miao, Ya Xiong2026-03-09💻 cs

MagRobot:An Open Simulator for Magnetically Navigated Robots

Il documento presenta MagRobot, il primo simulatore open-source universale che facilita la progettazione, la visualizzazione e il benchmarking di robot navigati magneticamente per applicazioni mediche minimamente invasive, offrendo un ambiente flessibile per testare algoritmi e hardware in scenari anatomici deformabili.

Heng Wang (South China University of Technology), Haoyu Song (South China University of Technology), Jiatao Zheng (South China University of Technology), Yuxiang Han (South China University of Technology), Kunli Wang (South China University of Technology)2026-03-09💻 cs

Moving Through Clutter: Scaling Data Collection and Benchmarking for 3D Scene-Aware Humanoid Locomotion via Virtual Reality

Il paper presenta Moving Through Clutter (MTC), un framework open-source basato sulla realtà virtuale per la raccolta dati e il benchmarking della locomozione umanoide in ambienti 3D affollati, fornendo un nuovo dataset di traiettorie umane adattate ai robot per studiare l'adattamento geometrico e la pianificazione consapevole dell'ambiente.

Beichen Wang, Yuanjie Lu, Linji Wang, Liuchuan Yu, Xuesu Xiao2026-03-09💻 cs

TADPO: Reinforcement Learning Goes Off-road

Il paper introduce TADPO, un nuovo sistema di apprendimento per rinforzo basato su visione che combina traiettorie on-policy e off-policy per la guida off-road ad alta velocità, dimostrando per la prima volta il trasferimento zero-shot da simulazione a un veicolo reale a pieno scala.

Zhouchonghao Wu, Raymond Song, Vedant Mundheda, Luis E. Navarro-Serment, Christof Schoenborn, Jeff Schneider2026-03-09🤖 cs.AI

Restoring Linguistic Grounding in VLA Models via Train-Free Attention Recalibration

Questo paper introduce ICBench per diagnosticare la "cecità linguistica" nei modelli VLA, che ignorano le istruzioni contraddittorie favorendo le priorità visive, e propone IGAR, un metodo senza riaddestramento che ripristina l'attenzione alle istruzioni durante l'inferenza per prevenire azioni errate.

Ninghao Zhang, Bin Zhu, Shijie Zhou, Jingjing Chen2026-03-09🤖 cs.AI

Devil is in Narrow Policy: Unleashing Exploration in Driving VLA Models

Il paper presenta Curious-VLA, un framework che supera i limiti delle politiche ristrette nei modelli VLA per la guida autonoma attraverso una strategia di espansione delle traiettorie fattibili e un campionamento adattivo, ottenendo risultati all'avanguardia sul benchmark Navsim.

Canyu Chen, Yuguang Yang, Zhewen Tan, Yizhi Wang, Ruiyi Zhan, Haiyan Liu, Xuanyao Mao, Jason Bao, Xinyue Tang, Linlin Yang, Bingchuan Sun, Yan Wang, Baochang Zhang2026-03-09💻 cs

RODEO: RObotic DEcentralized Organization

Il paper presenta RODEO, un framework basato su blockchain che integra meccanismi di fiducia e responsabilità per i robot di servizio, permettendo loro di eseguire compiti autonomi verificabili, ricevere compensi in token e reinvestire tali fondi per servizi essenziali come la ricarica delle batterie.

Milan Groshev, Eduardo Castelló Ferrer2026-03-09💻 cs

Transforming Omnidirectional RGB-LiDAR data into 3D Gaussian Splatting

Questo lavoro presenta una pipeline innovativa che trasforma log sensoriali omnidirezionali RGB-LiDAR esistenti, spesso sottoutilizzati, in asset di inizializzazione robusti per il 3D Gaussian Splatting, superando le distorsioni e l'overhead computazionale per generare gemelli digitali di alta qualità.

Semin Bae, Hansol Lim, Jongseong Brad Choi2026-03-09💻 cs

Lifelong Embodied Navigation Learning

Il paper propone Uni-Walker, un framework di apprendimento incarnato a vita che risolve il problema della rimozione catastrofica nei agenti di navigazione potenziati da LLM, decoulando le conoscenze in componenti condivise e specifiche tramite DE-LoRA e strategie di eredità e ortogonalità per adattarsi a compiti e stili di istruzioni diversi mantenendo le competenze apprese in precedenza.

Xudong Wang, Jiahua Dong, Baichen Liu, Qi Lyu, Lianqing Liu, Zhi Han2026-03-09🤖 cs.AI

Multimodal Behavior Tree Generation: A Small Vision-Language Model for Robot Task Planning

Questo lavoro propone un metodo per generare alberi comportamentali per la pianificazione di compiti robotici utilizzando un modello visione-linguaggio (VLM) compatto e open-source, che viene addestrato su un nuovo dataset derivato da episodi robotici esistenti e dimostra prestazioni competitive con modelli chiusi su larga scala pur richiedendo risorse computazionali significativamente inferiori.

Cristiano Battistini, Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-09💻 cs

Sticky-Glance: Robust Intent Recognition for Human Robot Collaboration via Single-Glance

Il paper propone "Sticky-Glance", un framework robusto per il riconoscimento delle intenzioni basato sullo sguardo che, tramite un algoritmo di "sguardo adesivo" e un controllo condiviso continuo, permette alle persone con limitate capacità motorie di interagire efficacemente con robot in ambienti dinamici, riducendo il carico di lavoro e il tempo di esecuzione dei compiti.

Yuzhi Lai, Shenghai Yuan, Peizheng Li, Andreas Zell2026-03-09💻 cs

A Hazard-Informed Data Pipeline for Robotics Physical Safety

Questo rapporto presenta un quadro strutturato per la sicurezza fisica dei robot che integra l'ingegneria della sicurezza classica con l'apprendimento automatico, allineando la dichiarazione degli asset, l'enumerazione delle vulnerabilità e la generazione di dati sintetici basati sui pericoli per l'addestramento di modelli di sicurezza.

Alexei Odinokov, Rostislav Yavorskiy2026-03-09🤖 cs.AI

← Precedente Successivo →