cs.RO papers | Gist.Science

AnyCamVLA: Zero-Shot Camera Adaptation for Viewpoint Robust Vision-Language-Action Models

Dit paper introduceert AnyCamVLA, een zero-shot raamwerk dat de viewpoint-robuustheid van Vision-Language-Action-modellen verbetert door testtijd-cameraobservaties virtueel aan te passen aan de trainingsconfiguratie zonder extra data of fijnafstemming.

Hyeongjun Heo, Seungyeon Woo, Sang Min Kim, Junho Kim, Junho Lee, Yonghyeon Lee, Young Min Kim2026-03-09💻 cs

Systematic Evaluation of Novel View Synthesis for Video Place Recognition

Dit artikel presenteert een systematische evaluatie van synthetische nieuwe weergaven voor video-locatieherkenning, waarbij wordt geconcludeerd dat hoewel kleine toevoegingen de prestaties verbeteren, bij grotere toevoegingen het aantal toegevoegde beelden en het type dataset belangrijker zijn dan de grootte van het gezichtspuntverschil.

Muhammad Zawad Mahmud, Samiha Islam, Damian Lyons2026-03-09💻 cs

Improved hopping control on slopes for small robots using spring mass modeling

Dit paper presenteert een eenvoudige, op een veer-massa-model gebaseerde aanpak voor kleine hoprobots die door het aanpassen van de landingshoek en het toepassen van een corrigerend koppel, stabiel blijft op hellingen zonder complexe sensoren of berekeningen.

Heston Roberts, Pronoy Sarker, Sm Ashikul Islam, Min Gyu Kim2026-03-09💻 cs

Iterative Convex Optimization with Control Barrier Functions for Obstacle Avoidance among Polytopes

Dit paper introduceert een iteratief convex optimalisatiekader dat Control Barrier Functions combineert met exacte polytoop-afstanden om veilige en snelle obstakelontwijking voor polytopale robots in complexe omgevingen mogelijk te maken.

Shuo Liu, Zhe Huang, Calin A. Belta2026-03-09💻 cs

FTSplat: Feed-forward Triangle Splatting Network

FTSplat is een feed-forward framework dat directe, simulatieklare driehoeksoppervlakken voorspelt uit meervoudige beelden, waardoor de noodzaak voor tijdrovende per-scene optimalisatie wordt weggenomen en de integratie met grafische en robotische simulatoren wordt vergemakkelijkt.

Xiong Jinlin, Li Can, Shen Jiawei, Qi Zhigang, Sun Lei, Zhao Dongyang2026-03-09💻 cs

Swooper: Learning High-Speed Aerial Grasping With a Simple Gripper

Dit paper introduceert Swooper, een diep versterkingsleringsbenadering die een enkel lichtgewicht neuronaal netwerk gebruikt om een drone in staat te stellen tot hoge snelheid te vliegen en objecten te grijpen met een simpele grijper, wat resulteert in een succesgraad van 84% in echte wereldtoepassingen zonder verdere aanpassing.

Ziken Huang, Xinze Niu, Bowen Chai, Renbiao Jin, Danping Zou2026-03-09💻 cs

How to Model Your Crazyflie Brushless

Deze paper introduceert een nauwkeurig dynamisch model voor de nieuwe Crazyflie Brushless, dat wordt gevalideerd via simulatie en hardware en succesvol wordt gebruikt voor het trainen van reinforcement learning-controllers die complexe acrobatische manoeuvres realiseren met een naadloze overgang van simulatie naar de echte wereld.

Alexander Gräfe, Christoph Scherer, Wolfgang Hönig, Sebastian Trimpe2026-03-09💻 cs

PROBE: Probabilistic Occupancy BEV Encoding with Analytical Translation Robustness for 3D Place Recognition

Dit paper introduceert PROBE, een leervrije LiDAR-locatieherkenningsmethode die probabilistische bezettingskaarten in een BEV-ruimte gebruikt en via analytische translatie-robustheid en FFT-gebaseerde rotatiealignatie toonaangevende prestaties bereikt zonder dataset-specifieke tuning.

Jinseop Lee, Byoungho Lee, Gichul Yoo2026-03-09💻 cs

Proprioceptive Shape Estimation of Tensegrity Manipulators Using Energy Minimisation

Dit artikel toont aan dat de vorm van een grote, continu buigende tensegrity-robotarm met een nauwkeurigheid van 2,1% kan worden geschat door alleen de hellingshoeken van de struts te meten via IMU's en een energie-minimalisatie-algoritme toe te passen, zonder externe sensoren.

Tufail Ahmad Bhat, Shuhei Ikemoto2026-03-09💻 cs

HarvestFlex: Strawberry Harvesting via Vision-Language-Action Policy Adaptation in the Wild

Dit onderzoek introduceert HarvestFlex, het eerste systeem dat vision-language-action (VLA)-policies succesvol toepast voor het oogsten van aardbeien in een ongestructureerde kasomgeving met slechts vier uur tele-geopereerde demonstratiegegevens, waarbij een aangepaste pi_0.5-politiek een slagingspercentage van 74,0% bereikte.

Ziyang Zhao, Shuheng Wang, Zhonghua Miao, Ya Xiong2026-03-09💻 cs

MagRobot:An Open Simulator for Magnetically Navigated Robots

Dit paper introduceert MagRobot, het eerste universele open-source simulatieplatform dat onderzoekers in staat stelt om magnetisch gestuurde robots voor medische toepassingen efficiënt te ontwerpen, te visualiseren en te benchmarken, waardoor de afhankelijkheid van kostbare experimentele prototyping wordt verminderd.

Heng Wang (South China University of Technology), Haoyu Song (South China University of Technology), Jiatao Zheng (South China University of Technology), Yuxiang Han (South China University of Technology), Kunli Wang (South China University of Technology)2026-03-09💻 cs

Moving Through Clutter: Scaling Data Collection and Benchmarking for 3D Scene-Aware Humanoid Locomotion via Virtual Reality

Dit paper introduceert 'Moving Through Clutter' (MTC), een open-source VR-framework dat een dataset en benchmarks biedt voor het trainen en evalueren van humanoiden die zich veilig en adaptief door complexe, 3D-verrommelde omgevingen kunnen bewegen.

Beichen Wang, Yuanjie Lu, Linji Wang, Liuchuan Yu, Xuesu Xiao2026-03-09💻 cs

TADPO: Reinforcement Learning Goes Off-road

Dit paper introduceert TADPO, een nieuwe versterkingsleerbenadering die PPO uitbreidt met off-policy trajecten voor begeleiding en on-policy trajecten voor exploratie, waarmee voor het eerst een op visie gebaseerd RL-systeem succesvol is ingezet voor hoogwaardig off-road rijden op een volledig schaalvoertuig via zero-shot sim-naar-real-overdracht.

Zhouchonghao Wu, Raymond Song, Vedant Mundheda, Luis E. Navarro-Serment, Christof Schoenborn, Jeff Schneider2026-03-09🤖 cs.AI

Restoring Linguistic Grounding in VLA Models via Train-Free Attention Recalibration

Dit paper introduceert IGAR, een train-vrije methode die de 'taalkundige blindheid' in Vision-Language-Action-modellen oplost door de aandacht tijdens de inferentie te herkalibreren, zodat robots instructies correct volgen zelfs bij tegenstrijdige visuele prikkels.

Ninghao Zhang, Bin Zhu, Shijie Zhou, Jingjing Chen2026-03-09🤖 cs.AI

Devil is in Narrow Policy: Unleashing Exploration in Driving VLA Models

Dit paper introduceert Curious-VLA, een tweestapsframework dat de beperkende 'smalle beleid'-problematiek in autonome VLA-modellen aanpakt door middel van Feasible Trajectory Expansion en Adaptive Diversity-Aware Sampling, wat leidt tot state-of-the-art prestaties op de Navsim-benchmark door de exploratiecapaciteit te maximaliseren.

Canyu Chen, Yuguang Yang, Zhewen Tan, Yizhi Wang, Ruiyi Zhan, Haiyan Liu, Xuanyao Mao, Jason Bao, Xinyue Tang, Linlin Yang, Bingchuan Sun, Yan Wang, Baochang Zhang2026-03-09💻 cs

RODEO: RObotic DEcentralized Organization

Dit paper introduceert RODEO, een blockchain-gebaseerd raamwerk dat service-robots via een ROS-ETH-brug integreert in decentrale autonome organisaties (DAO's) om hun acties auditabel te maken, taken te coördineren en betalingen in tokens te verwerken, zoals aangetoond door een experiment waarbij een robot zijn inkomsten verdubbelde en deze herinvesteerde in laadservices.

Milan Groshev, Eduardo Castelló Ferrer2026-03-09💻 cs

Transforming Omnidirectional RGB-LiDAR data into 3D Gaussian Splatting

Dit artikel presenteert een robuust verwerkingskader dat bestaande omnidirectionele RGB-LiDAR-logbestanden omzet in hoogwaardige initialisatiebestanden voor 3D Gaussian Splatting, waardoor kostenefficiënte en nauwkeurige digitale tweelingen kunnen worden gegenereerd zonder de noodzaak van dure, doelgerichte datacollectie.

Semin Bae, Hansol Lim, Jongseong Brad Choi2026-03-09💻 cs

Lifelong Embodied Navigation Learning

Dit paper introduceert Uni-Walker, een framework voor levenslang embodied navigatie dat door middel van DE-LoRA en specifieke leerstrategieën het probleem van catastrofale vergetelheid oplost door algemene en taakspecifieke kennis effectief te scheiden en te integreren.

Xudong Wang, Jiahua Dong, Baichen Liu, Qi Lyu, Lianqing Liu, Zhi Han2026-03-09🤖 cs.AI

Multimodal Behavior Tree Generation: A Small Vision-Language Model for Robot Task Planning

Dit paper introduceert een methode om een compact, open-source vision-language model te fine-tunen voor het genereren van uitvoerbare behavior trees voor robottaken, waarbij een groot model als leraar fungeert om een dataset te creëren en een 4B-parameter model een succesratio van 87% bereikt met een fractie van de rekenkracht van gesloten systemen.

Cristiano Battistini, Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-09💻 cs

Sticky-Glance: Robust Intent Recognition for Human Robot Collaboration via Single-Glance

Dit artikel introduceert 'Sticky-Glance', een robuust raamwerk voor intentieherkenning via blik dat, zelfs bij zeer korte blikken en in dynamische omgevingen, de intentie van gebruikers met beperkte motoriek stabiliseert door objectgerichte blikverankering en multi-modale interactie, wat resulteert in een hogere nauwkeurigheid en een kortere taaktijd.

Yuzhi Lai, Shenghai Yuan, Peizheng Li, Andreas Zell2026-03-09💻 cs

← Vorige Volgende →