cs.RO artículos | Gist.Science

Systematic Evaluation of Novel View Synthesis for Video Place Recognition

Este artículo presenta una evaluación sistemática de la síntesis de nuevas vistas en el reconocimiento de lugares en video, demostrando que las vistas sintéticas mejoran las estadísticas de reconocimiento, especialmente cuando se añaden en gran número, independientemente de la magnitud del cambio de perspectiva.

Muhammad Zawad Mahmud, Samiha Islam, Damian Lyons2026-03-09💻 cs

Improved hopping control on slopes for small robots using spring mass modeling

Este trabajo presenta un método de control mejorado para robots saltadores en pendientes que, mediante un modelo de masa-resorte y ajustes simples en el ángulo de contacto y el torque, cancela las rotaciones no deseadas para lograr aterrizajes estables sin requerir sensores o computación complejos.

Heston Roberts, Pronoy Sarker, Sm Ashikul Islam, Min Gyu Kim2026-03-09💻 cs

Iterative Convex Optimization with Control Barrier Functions for Obstacle Avoidance among Polytopes

Este artículo presenta un marco iterativo de control predictivo basado en modelos (MPC) y funciones de barrera de control (DCBF) que garantiza la colisión de robots y obstáculos poligónicos mediante la linealización local y hiperplanos de soporte, logrando así una planificación de trayectorias segura y en tiempo real para dinámicas no lineales complejas.

Shuo Liu, Zhe Huang, Calin A. Belta2026-03-09💻 cs

FTSplat: Feed-forward Triangle Splatting Network

FTSplat es un marco de trabajo de alimentación directa que genera superficies triangulares continuas y listas para simulación a partir de imágenes multivista en una sola pasada, superando las limitaciones de optimización por escena y la falta de geometría explícita de métodos anteriores como NeRF y 3DGS.

Xiong Jinlin, Li Can, Shen Jiawei, Qi Zhigang, Sun Lei, Zhao Dongyang2026-03-09💻 cs

Swooper: Learning High-Speed Aerial Grasping With a Simple Gripper

El artículo presenta "Swooper", un enfoque de aprendizaje por refuerzo profundo que utiliza una estrategia de dos etapas y una sola red neuronal ligera para permitir que un dron cuadricóptero con un agarre sencillo realice tareas de agarre aéreo de alta velocidad (hasta 1.5 m/s) con un 84% de éxito en el mundo real, todo entrenado en menos de 60 minutos y ejecutado en tiempo real en un ordenador embarcado.

Ziken Huang, Xinze Niu, Bowen Chai, Renbiao Jin, Danping Zou2026-03-09💻 cs

How to Model Your Crazyflie Brushless

Este trabajo presenta un modelo dinámico preciso del nuevo Crazyflie Brushless, validado mediante simulaciones y pruebas en hardware, que demuestra su eficacia para entrenar controladores de aprendizaje por refuerzo capaces de ejecutar maniobras acrobáticas complejas con transferencia exitosa de simulación a la realidad.

Alexander Gräfe, Christoph Scherer, Wolfgang Hönig, Sebastian Trimpe2026-03-09💻 cs

PROBE: Probabilistic Occupancy BEV Encoding with Analytical Translation Robustness for 3D Place Recognition

PROBE es un descriptor de reconocimiento de lugares basado en LiDAR que, sin necesidad de aprendizaje, modela la ocupación en vistas aéreas como variables aleatorias de Bernoulli y utiliza una marginalización analítica para lograr una robustez ante traslaciones y generalización entre sensores, logrando un rendimiento superior entre los métodos no supervisados en múltiples conjuntos de datos.

Jinseop Lee, Byoungho Lee, Gichul Yoo2026-03-09💻 cs

Proprioceptive Shape Estimation of Tensegrity Manipulators Using Energy Minimisation

Este artículo demuestra que es posible estimar con precisión la forma de manipuladores de tensegridad a gran escala utilizando únicamente datos de inclinación obtenidos mediante IMUs en cada viga, mediante un método de minimización de energía que funciona tanto en condiciones estáticas como bajo perturbaciones externas.

Tufail Ahmad Bhat, Shuhei Ikemoto2026-03-09💻 cs

HarvestFlex: Strawberry Harvesting via Vision-Language-Action Policy Adaptation in the Wild

Este trabajo presenta el primer estudio sobre la transferencia de políticas de visión-idioma-acción (VLA) a la cosecha real de fresas en invernadero, logrando un sistema de bucle cerrado con un 74% de éxito mediante el uso de sensores RGB, demostraciones teleoperadas y la adaptación de modelos como pi_0.5, sin depender de nubes de puntos de profundidad ni calibración geométrica explícita.

Ziyang Zhao, Shuheng Wang, Zhonghua Miao, Ya Xiong2026-03-09💻 cs

MagRobot:An Open Simulator for Magnetically Navigated Robots

El artículo presenta MagRobot, el primer simulador de código abierto universal que facilita el diseño, la visualización y la validación de robots navegados magnéticamente para aplicaciones médicas mínimamente invasivas, permitiendo la comparación de hardware y algoritmos en entornos anatómicos deformables.

Heng Wang (South China University of Technology), Haoyu Song (South China University of Technology), Jiatao Zheng (South China University of Technology), Yuxiang Han (South China University of Technology), Kunli Wang (South China University of Technology)2026-03-09💻 cs

Moving Through Clutter: Scaling Data Collection and Benchmarking for 3D Scene-Aware Humanoid Locomotion via Virtual Reality

Este trabajo presenta "Moving Through Clutter" (MTC), un marco de código abierto basado en realidad virtual que genera un conjunto de datos y benchmarks para la locomoción de humanoides en entornos 3D desordenados, capturando movimientos humanos completos y adaptándolos automáticamente a modelos robóticos para abordar la falta de investigación en navegación segura y consciente del entorno.

Beichen Wang, Yuanjie Lu, Linji Wang, Liuchuan Yu, Xuesu Xiao2026-03-09💻 cs

TADPO: Reinforcement Learning Goes Off-road

El artículo presenta TADPO, un nuevo sistema de aprendizaje por refuerzo basado en visión que permite la conducción autónoma de alta velocidad en terrenos off-road complejos, logrando por primera vez una transferencia cero-shot de simulación a la realidad en un vehículo a escala completa.

Zhouchonghao Wu, Raymond Song, Vedant Mundheda, Luis E. Navarro-Serment, Christof Schoenborn, Jeff Schneider2026-03-09🤖 cs.AI

Restoring Linguistic Grounding in VLA Models via Train-Free Attention Recalibration

Este artículo presenta ICBench, un nuevo benchmark para diagnosticar la "ceguera lingüística" en modelos VLA que priorizan la visión sobre las instrucciones, y propone IGAR, un mecanismo de recalibración de atención sin entrenamiento que restaura la alineación lingüística y mejora la fiabilidad de los robots ante instrucciones contradictorias.

Ninghao Zhang, Bin Zhu, Shijie Zhou, Jingjing Chen2026-03-09🤖 cs.AI

Devil is in Narrow Policy: Unleashing Exploration in Driving VLA Models

El artículo presenta Curious-VLA, un marco de dos etapas que supera las limitaciones de políticas estrechas en los modelos VLA de conducción mediante la expansión de trayectorias factibles y un muestreo adaptativo, logrando así resultados de vanguardia en el benchmark Navsim al desbloquear el potencial exploratorio del aprendizaje por refuerzo.

Canyu Chen, Yuguang Yang, Zhewen Tan, Yizhi Wang, Ruiyi Zhan, Haiyan Liu, Xuanyao Mao, Jason Bao, Xinyue Tang, Linlin Yang, Bingchuan Sun, Yan Wang, Baochang Zhang2026-03-09💻 cs

RODEO: RObotic DEcentralized Organization

Este artículo presenta RODEO, un marco basado en blockchain que integra mecanismos de confianza y auditoría para permitir que robots autónomos participen en organizaciones descentralizadas, ejecutando tareas verificables y gestionando sus propios recursos financieros mediante contratos inteligentes.

Milan Groshev, Eduardo Castelló Ferrer2026-03-09💻 cs

Transforming Omnidirectional RGB-LiDAR data into 3D Gaussian Splatting

Este trabajo presenta un pipeline que transforma registros históricos omnidireccionales de RGB y LiDAR en inicializaciones robustas para la representación 3D mediante Gaussian Splatting, superando desafíos de distorsión y sobrecarga computacional mediante conversión a cubemap, muestreo estratificado y registro global para generar gemelos digitales de alta fidelidad.

Semin Bae, Hansol Lim, Jongseong Brad Choi2026-03-09💻 cs

Lifelong Embodied Navigation Learning

El artículo presenta Uni-Walker, un marco de aprendizaje que aborda el olvido catastrófico en la navegación corporal mediante la decodificación de conocimientos compartidos y específicos con DE-LoRA, permitiendo a los agentes adaptarse continuamente a nuevas tareas e instrucciones sin perder lo aprendido previamente.

Xudong Wang, Jiahua Dong, Baichen Liu, Qi Lyu, Lianqing Liu, Zhi Han2026-03-09🤖 cs.AI

Multimodal Behavior Tree Generation: A Small Vision-Language Model for Robot Task Planning

Este trabajo presenta un modelo de visión-idioma pequeño y de código abierto que, tras ser ajustado finamente con un nuevo dataset generado por un modelo grande, produce árboles de comportamiento para planificación robótica con un 87% de éxito en tareas domésticas, igualando el rendimiento de modelos cerrados de vanguardia con una fracción de los recursos computacionales.

Cristiano Battistini, Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-09💻 cs

Sticky-Glance: Robust Intent Recognition for Human Robot Collaboration via Single-Glance

El artículo presenta "Sticky-Glance", un marco robusto de reconocimiento de intenciones mediante la mirada que utiliza un algoritmo de "mirada adhesiva" para estabilizar la selección de objetos en entornos dinámicos con muy pocas muestras, mejorando la precisión y reduciendo el tiempo de tarea en la colaboración humano-robot.

Yuzhi Lai, Shenghai Yuan, Peizheng Li, Andreas Zell2026-03-09💻 cs

A Hazard-Informed Data Pipeline for Robotics Physical Safety

Este informe presenta un marco estructurado para la seguridad física en robótica que integra la ingeniería de riesgos clásica con la generación de datos sintéticos y el aprendizaje automático mediante una ontología formalizada de peligros.

Alexei Odinokov, Rostislav Yavorskiy2026-03-09🤖 cs.AI

← Anterior Siguiente →